Data Pipeline

Verwenden Sie Data Pipeline, um Stripe-Daten mit einem Data Warehouse zu synchronisieren.

Data Pipeline ist ein No-Code-Produkt, das Ihre sämtlichen Stripe-Daten an verschiedene Datenspeicherziele sendet. So können Sie Ihre Stripe-Daten mit anderen Geschäftsdaten zentralisieren, um beim Abschluss Ihrer Bücher behilflich zu sein und detailliertere Geschäftseinblicke zu erhalten. Wenn Sie Fragen zum Support für Ihr Datenziel haben, wenden Sie sich an den Stripe-Support.

Mit Data Pipeline können Sie:

Ihre vollständigen Stripe-Daten auf schnelle und zuverlässige Weise automatisch exportieren.
Sich nicht länger auf ETL-Pipelines (Extrahieren, Transformieren und Laden) von Drittanbietern oder selbst erstellte API-Integrationen verlassen.
Daten aus allen Ihren Stripe-Konten in einem Data Warehouse verbinden.
Stripe-Daten mit Ihren anderen Geschäftsdaten für umfassendere Geschäftseinblicke vernetzen.

Vorsicht

Aufgrund der Anforderungen an die Datenlokalisierung bietet Stripe keine Data Pipeline-Dienste für Kundinnen/Kunden, Unternehmen oder Nutzer/innen in Indien.

Unterstützung von Zielen

Stripe Data Pipeline unterstützt zwei Arten von Zielen:

Data Warehouses (Snowflake, Amazon Redshift)
- Für Data Warehouse-Ziele sendet Stripe eine Datenfreigabe an Ihr Data Warehouse.
- Nachdem Sie die Datenfreigabe akzeptiert haben, können Sie innerhalb von 12 Stunden auf Ihre Stripe-Kerndaten in Snowflake oder Amazon Redshift zugreifen.
- Nach dem ersten Laden werden Ihre Stripe-Daten regelmäßig aktualisiert und liefern alle 3 Stunden eine vollständige Datenlast.
Cloudspeicher (Google Cloud Storage, Azure Blob Storage, Amazon S3)
- Für unsere Cloud-Speicherziele sendet Stripe Parquet-Dateien direkt an einen Cloud-Speicherort, den Sie besitzen.
- Nach dem ersten Laden werden Ihre Stripe-Daten regelmäßig aktualisiert und liefern alle 3 Stunden eine neue vollständige Datenlast.

Datenbankschemata

Ihre Warehouse-Daten werden basierend auf dem zur Erstellung der Daten verwendeten API-Modus in zwei Datenbankschemata aufgeteilt.

Schema	Beschreibung
`STRIPE`	Daten aus dem Live-Modus übernommen
`STRIPE_TESTMODE`	Daten aus Sandboxes und dem Test-Modus übernommen

Wenn Sie Daten von mehreren Stripe-Konten mit demselben Data Warehouse teilen, können Sie diese separat ausweisen. Jede Tabelle verfügt über eine Spalte merchant_id, mit der Sie die Daten nach Konto filtern können.

Organisationen nutzen, um mehrere Data Pipelines zu verwalten

Wenn Sie Organisationen verwenden, können Sie alle Konten sehen, die Daten extern teilen. Sie können:

Erstellen Sie eine neue Data Pipeline, wenn Sie die Rollen Super-Administrator/in oder Administrator/in innehaben.
Fügen Sie ein Konto ohne zusätzliche Verifizierung zu einem bestehenden Data Warehouse hinzu.
Ein oder mehrere Konten von einer Data Pipeline abmelden.
Löschen Sie das Pipeline-Setup.

Wenn Sie ein Konto aus einer Organisation entfernen, wird Ihre Datenfreigabe für dieses Konto sofort beendet.

Proprietäre Daten mit und Stripe-Daten kombinieren

In einigen Fällen möchten Sie vielleicht Informationen aus Ihren proprietären Daten mit Stripe-Daten kombinieren. Das folgende Schema zeigt eine orders-Tabelle, in der die Bestelldaten für ein Unternehmen aufgeführt sind. Diese Tabelle enthält keine Daten zu Transaktionsgebühren oder Auszahlungen, da diese Daten ausschließlich in Stripe existieren.

Datum	order_no	stripe_txn_no	customer_name	Preis	Posten
14.8.2025	1	bt_xcVXgHcBfi83m94	John Smith	5	1 Buch

In Stripe enthält die balance_transactions-Tabelle die folgenden Informationen, es fehlen jedoch proprietäre Daten zu Kundennamen und gekauften Artikeln:

ID	Betrag	available_on	Gebühr	Netto	automatic_transfer_id
bt_xcVXgHcBfi83m94	500	14.8.2025	50	450	po_rC4ocAkjGy8zl3j

Um neben Ihren Stripe-Daten auf Ihre proprietären Daten zuzugreifen, kombinieren Sie die Tabelle orders mit der Tabelle balance_transactions von Stripe:

select
  orders.date,
  orders.order_no,
  orders.stripe_txn_no,
  bts.amount,
  bts.fee,
  bts.automatic_transfer_id
from mycompany.orders join stripe.balance_transactions bts
on orders.stripe_txn_no = bts.id;

Nach Abschluss sind die folgenden Informationen verfügbar:

Datum	order_no	Stripe_txn_no	Betrag	Gebühr	automatic_transfer_id
14.8.2025	1	bt_xcVXgHcBfi83m94	500	50	po_rC4ocAkjGy8zl3j

Datensätze

Eine Liste der verfügbaren Datensätze finden Sie unter Datensätze in der Schema-Dokumentation.

Die verfügbaren Datensätze können je nach Region variieren, abhängig von der lokalen Produktverfügbarkeit und den lokalen Vorschriften. Jeder Datensatz, der eine oder mehrere Warehouse-Tabellen enthält, wird von Data Pipeline separat freigegeben, sobald Daten verfügbar sind. Data Pipeline aktualisiert einige Tabellen nach unterschiedlichen Zeitplänen, wenn neue Daten verfügbar werden. Weitere Informationen zu den verfügbaren Datensätzen und Aktualisierungsplänen finden Sie unter Datenaktualität.

Sandbox-Unterstützung

Sie können eine Sandbox verwenden, d. h. eine risikofreie Umgebung, um die Data Pipeline-Funktionalität zu testen. Mit einer Sandbox können Sie die Datensynchronisierung bewerten, ohne dass sich dies negativ auf Ihre Live-Produktionsdaten auswirkt. Während des Tests bleiben kostenlose Testversionen von Data Pipeline davon unberührt, sodass Ihnen Sandbox-Aktivitäten niemals in Rechnung gestellt werden.

Um Sandbox-Daten anzuzeigen, rufen Sie das TESTMODE-Schema auf und filtern Sie nach Ihrer spezifischen Sandbox-Händler-ID. Auf diese Weise können Sie neben Ihren bestehenden Analysen Ihre Testdaten analysieren, ohne dass dies finanzielle Auswirkungen hat.

Eine ausführlichere Anleitung zum Einrichten und Verwalten von Sandboxes finden Sie unter Sandboxes.

Data Pipeline deaktivieren

Sie können Data Pipeline im Dashboard deaktivieren, indem Sie auf Plan verwalten klicken.