Mit Data Pipeline auf Daten in Ihrem Data Warehouse zugreifen
Synchronisieren Sie Ihr Stripe-Konto mit Snowflake, Amazon Redshift, Google Cloud Storage und anderen Datenspeicherdiensten.
Data Pipeline ist ein No-Code-Produkt, das Ihre sämtlichen Stripe-Daten an verschiedene Datenspeicherziele sendet. So können Sie Ihre Stripe-Daten mit anderen Geschäftsdaten zentral halten, um beim Abschluss Ihrer Bücher zu helfen und detailliertere Geschäftseinblicke zu erhalten.
Mit Data Pipeline können Sie:
- Ihre vollständigen Stripe-Daten auf schnelle und zuverlässige Weise automatisch exportieren.
- Sich nicht länger auf ETL-Pipelines (Extrahieren, Transformieren und Laden) von Drittanbietern oder selbst erstellte API-Integrationen verlassen.
- Daten aus allen Ihren Stripe-Konten in einem Data Warehouse verbinden.
- Stripe-Daten mit Ihren anderen Geschäftsdaten für umfassendere Geschäftseinblicke vernetzen.
Vorsicht
Aufgrund der Anforderungen an die Datenlokalisierung bietet Stripe keine Data Pipeline-Dienste für Kundinnen/Kunden, Unternehmen oder Nutzer/innen in Indien.
Notiz
Wenn Sie Fragen zum Support für Ihr Datenziel haben, teilen Sie uns dies unter data-pipeline@stripe.com mit.
Unterstützung von Zielen
Stripe Data Pipeline unterstützt zwei Varianten von Zielen.
- Data Warehouses (Snowflake, Amazon Redshift)
- Für Data Warehouse-Ziele sendet Stripe eine Datenfreigabe an Ihr Data Warehouse.
- Nachdem Sie die Datenfreigabe akzeptiert haben, können Sie innerhalb von 12 Stunden auf Ihre Stripe-Kerndaten in Snowflake oder Amazon Redshift zugreifen.
- Nach dem ersten Laden werden Ihre Stripe-Daten regelmäßig aktualisiert und liefern alle 3 Stunden eine inkrementelle oder vollständige Datenlast.
- Cloud-Speicher (Google Cloud Storage, Azure Blob Storage)
- Für unsere Cloud-Speicherziele sendet Stripe Parquet-Dateien direkt an einen Cloud-Speicherort, den Sie besitzen.
- Nach dem ersten Laden werden Ihre Stripe-Daten regelmäßig aktualisiert und liefern alle 6 Stunden eine neue vollständige Datenlast Ihrer Daten.
Datenbankschemata
Ihre Warehouse-Daten werden basierend auf dem zur Erstellung der Daten verwendeten API-Modus in zwei Datenbankschemata aufgeteilt.
Schema | Beschreibung |
---|---|
STRIPE | Daten aus dem Live-Modus übernommen |
STRIPE_ | Daten aus dem Test-Modus übernommen |
Mehrere Stripe-Konten mit demselben Data Warehouse
Wenn Sie Daten von mehreren Stripe-Konten mit demselben Data Warehouse teilen, können Sie diese separat ausweisen. Jede Tabelle verfügt über eine Spalte merchant_
, mit der Sie die Daten nach Konto filtern können.
Beispiel für ein Anwendungsszenario
In einigen Fällen möchten Sie vielleicht Informationen aus Ihren proprietären Daten mit Stripe-Daten kombinieren. Das folgende Schema zeigt eine Tabelle mit orders
, in denen Informationen über eine Bestellung für ein Unternehmen aufgeführt sind:
Datum | order_no | stripe_txn_no | customer_name | Preis | Posten |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | John Smith | 5 | 1 Buch |
Die vorstehende Tabelle enthält keine Daten zu Transaktionsgebühren oder Auszahlungen, da diese Daten ausschließlich in Stripe enthalten sind. In Stripe enthält die Tabelle balance_
die folgenden Informationen, es fehlen jedoch proprietäre Daten zu Kundennamen und gekauften Artikeln:
ID | Betrag | available_on | Gebühr | Netto | automatic_transfer_id |
---|---|---|---|---|---|
bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Um neben Ihren Stripe-Daten auf Ihre proprietären Daten zuzugreifen, kombinieren Sie die Tabelle orders
mit der Tabelle balance_
von Stripe:
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Nach Abschluss sind die folgenden Informationen verfügbar:
Datum | order_no | Stripe_txn_no | Betrag | Gebühr | automatic_transfer_id |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Datensätze
Eine Liste der verfügbaren Datensätze finden Sie unter Datensätze in der Schema-Dokumentation im Dashboard. Die verfügbaren Datensätze können je nach lokaler Produktverfügbarkeit und Vorschriften je nach Region variieren. Jeder Datensatz enthält eine oder mehrere Warehouse-Tabellen und wird von Data Pipeline separat freigegeben, sobald Daten verfügbar sind. Data Pipeline aktualisiert die Tabellen nach unterschiedlichen Zeitplänen, wenn neue Daten verfügbar werden. Weitere Informationen zu den verfügbaren Datensätzen und Aktualisierungsplänen finden Sie unter Datenaktualität.
E-Mail-Benachrichtigungen
Sie können auch E-Mail-Benachrichtigungen über wichtige Updates im Dashboard abonnieren.
Data Pipeline deaktivieren
Sie können die Data Pipeline in den Einstellungen des Dashboards deaktivieren, indem Sie auf Deaktivieren klicken. Nachdem Sie die Verbindung getrennt haben, verlieren Sie sofort den Zugriff auf Ihre Datenfreigabe.