Auf Daten innerhalb eines Data Warehouse zugreifen
Verwenden Sie Data Pipeline, um Stripe-Daten mit einem Data Warehouse zu synchronisieren.
Data Pipeline ist ein No-Code-Produkt, das Ihre sämtlichen Stripe-Daten an verschiedene Datenspeicherziele sendet. So können Sie Ihre Stripe-Daten mit anderen Geschäftsdaten zentralisieren, um beim Abschluss Ihrer Bücher behilflich zu sein und detailliertere Geschäftseinblicke zu erhalten. Wenn Sie Fragen zum Support für Ihr Datenziel haben, kontaktieren Sie uns.
Mit Data Pipeline können Sie:
- Ihre vollständigen Stripe-Daten auf schnelle und zuverlässige Weise automatisch exportieren.
- Sich nicht länger auf ETL-Pipelines (Extrahieren, Transformieren und Laden) von Drittanbietern oder selbst erstellte API-Integrationen verlassen.
- Daten aus allen Ihren Stripe-Konten in einem Data Warehouse verbinden.
- Stripe-Daten mit Ihren anderen Geschäftsdaten für umfassendere Geschäftseinblicke vernetzen.
Vorsicht
Aufgrund der Anforderungen an die Datenlokalisierung bietet Stripe keine Data Pipeline-Dienste für Kundinnen/Kunden, Unternehmen oder Nutzer/innen in Indien.
Unterstützung von Zielen
Stripe Data Pipeline unterstützt zwei Arten von Zielen:
Data Warehouses (Snowflake, Amazon Redshift)
Für Data Warehouse-Ziele sendet Stripe eine Datenfreigabe an Ihr Data Warehouse.
Nachdem Sie die Datenfreigabe akzeptiert haben, können Sie innerhalb von 12 Stunden auf Ihre Stripe-Kerndaten in Snowflake oder Amazon Redshift zugreifen.
Nach dem ersten Laden werden Ihre Stripe-Daten regelmäßig aktualisiert und liefern alle 3 Stunden eine inkrementelle oder vollständige Datenlast.
Cloudspeicher (Google Cloud Storage, Azure Blob Storage, Amazon S3)
Für unsere Cloud-Speicherziele sendet Stripe Parquet-Dateien direkt an einen Cloud-Speicherort, den Sie besitzen.
Nach dem ersten Laden werden Ihre Stripe-Daten regelmäßig aktualisiert und liefern alle 6 Stunden eine neue vollständige Datenlast Ihrer Daten.
Datenbankschemata
Ihre Warehouse-Daten werden basierend auf dem zur Erstellung der Daten verwendeten API-Modus in zwei Datenbankschemata aufgeteilt.
Schema | Beschreibung |
---|---|
STRIPE | Daten aus dem Live-Modus übernommen |
STRIPE_ | Daten aus dem Test-Modus übernommen |
Wenn Sie Daten von mehreren Stripe-Konten mit demselben Data Warehouse teilen, können Sie diese separat ausweisen. Jede Tabelle verfügt über eine Spalte merchant_
, mit der Sie die Daten nach Konto filtern können.
Proprietäre Daten mit und Stripe-Daten kombinieren
In einigen Fällen möchten Sie vielleicht Informationen aus Ihren proprietären Daten mit Stripe-Daten kombinieren. Das folgende Schema zeigt eine orders
-Tabelle, in der die Bestelldaten für ein Unternehmen aufgeführt sind. Diese Tabelle enthält keine Daten zu Transaktionsgebühren oder Auszahlungen, da diese Daten ausschließlich in Stripe existieren.
Datum | order_no | stripe_txn_no | customer_name | Preis | Posten |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | John Smith | 5 | 1 Buch |
In Stripe enthält die balance_
-Tabelle die folgenden Informationen, es fehlen jedoch proprietäre Daten zu Kundennamen und gekauften Artikeln:
ID | Betrag | available_on | Gebühr | Netto | automatic_transfer_id |
---|---|---|---|---|---|
bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Um neben Ihren Stripe-Daten auf Ihre proprietären Daten zuzugreifen, kombinieren Sie die Tabelle orders
mit der Tabelle balance_
von Stripe:
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Nach Abschluss sind die folgenden Informationen verfügbar:
Datum | order_no | Stripe_txn_no | Betrag | Gebühr | automatic_transfer_id |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Datensätze
Eine Liste der verfügbaren Datensätze finden Sie unter Datensätze in der Schema-Dokumentation im Dashboard. Die verfügbaren Datensätze können je nach lokaler Produktverfügbarkeit und Vorschriften je nach Region variieren. Jeder Datensatz enthält eine oder mehrere Warehouse-Tabellen und wird von Data Pipeline separat freigegeben, sobald Daten verfügbar sind. Data Pipeline aktualisiert die Tabellen nach unterschiedlichen Zeitplänen, wenn neue Daten verfügbar werden. Weitere Informationen zu den verfügbaren Datensätzen und Aktualisierungsplänen finden Sie unter Datenaktualität.
Data Pipeline deaktivieren
Sie können Data Pipeline im Dashboard deaktivieren, indem Sie auf „Deaktivieren“ klicken. Nachdem Sie die Verbindung getrennt haben, verlieren Sie sofort den Zugriff auf das Teilen von Daten. Wenn Sie Dateien mit einer anderen Struktur oder in einem benutzerdefinierten Format hochladen möchten, kontaktieren Sie uns.