So funktioniert Data Pipeline
Erfahren Sie, was Sie mit Data Pipeline tun können.
Data Pipeline ist ein No-Code-Produkt, das alle Ihre Stripe-Daten an eine Vielzahl von Datenspeicherzielen sendet. So können Sie Ihre Stripe-Daten mit anderen Unternehmensdaten zentralisieren, um Ihre Bücher zu schließen und detailliertere Einblicke in Ihr Unternehmen zu erhalten. Wenn Sie Fragen zur Unterstützung Ihres Datenziels haben, wenden Sie sich bitte an den Stripe-Support.
Mit Data Pipeline können Sie Folgendes tun:
- Ihre vollständigen Stripe-Daten auf schnelle und zuverlässige Weise automatisch exportieren.
- Sie müssen sich nicht länger auf ETL-Pipelines (Extrahieren, Transformieren und Laden) von Drittanbietern oder selbst erstellte API-Integrationen verlassen.
- Daten aus allen Ihren Stripe-Konten in einem Data Warehouse verbinden.
- Stripe-Daten mit Ihren anderen Geschäftsdaten für umfassendere Geschäftseinblicke vernetzen.
Vorsicht
Aufgrund der Anforderungen an die Datenlokalisierung bietet Stripe keine Data Pipeline-Dienste für Kundinnen/Kunden, Unternehmen oder Nutzer/innen in Indien.
Ziel-Support
Stripe Data Pipeline unterstützt zwei Varianten von Zielen:
Data Warehouses (Snowflake, Amazon Redshift)
Für Data Warehouse-Ziele sendet Stripe eine Datenfreigabe an Ihr Data Warehouse.
Nachdem Sie die Datenfreigabe akzeptiert haben, können Sie innerhalb von 12 Stunden auf Ihre Stripe-Kerndaten in Snowflake oder Amazon Redshift zugreifen.
Nach dem anfänglichen Laden werden Ihre Stripe-Daten regelmäßig aktualisiert, wobei alle 3 Stunden eine volle Ladung von Daten erfolgt.
Cloud-Speicher (Google Cloud Storage, Azure Blob Storage, Amazon S3)
Für unsere Cloud-Speicherziele sendet Stripe Parquet-Dateien direkt an einen Speicherort in Ihrer Cloud.
Nach dem anfänglichen Laden werden Ihre Stripe-Daten regelmäßig aktualisiert, so dass alle 3 Stunden eine neue vollständige Ladung Ihrer Daten bereitgestellt wird.
Datenbankschemata
Ihre Warehouse-Daten sind in zwei Datenbankschemata aufgeteilt, die auf dem API-Modus basieren, den Sie zur Erstellung der Daten verwendet haben.
| Schema-Name | Beschreibung |
|---|---|
STRIPE | Daten eingefüllt aus Live-Modell |
STRIPE_ | Daten, die aus Sandboxes und test mode eingefüllt werden |
Wenn Sie Daten von mehreren Stripe-Konten mit demselben Data Warehouse teilen, können Sie diese separat ausweisen. Jede Tabelle verfügt über eine Spalte merchant_, mit der Sie die Daten nach Konto filtern können.
Verwenden von Organizations zur Verwaltung mehrerer Datenpipelines
Wenn Sie Organizations verwenden, können Sie alle Konten sehen, die extern Daten freigeben. Sie können :
- Erstellen Sie eine neue Datenpipeline, wenn Sie die Rolle Super Administrator oder Administrator haben.
- Fügen Sie ein Konto zu einer bestehenden Data Warehouse-Einrichtung ohne zusätzliche Verifizierung hinzu.
- Ein oder mehrere Konten aus einer Datenpipeline abbestellen.
- Löschen Sie die Pipeline-Einrichtung.
Wenn Sie ein Konto aus einer Organisation entfernen, wird Ihre Datenfreigabe für dieses Konto sofort beendet.
Kombinieren von proprietären und Stripe-Daten
In manchen Fällen möchten Sie vielleicht Informationen aus Ihren eigenen Daten mit Daten von Stripe kombinieren. Das folgende Schema zeigt eine Auftrags-Tabelle, die Daten über einen Auftrag für ein Unternehmen auflistet. Diese Tabelle enthält keine Daten zu Transaktionsgebühren oder payouts, da diese Daten nur in Stripe existieren.
| Datum | order_no | stripe_txn_no | customer_name | Preis | Posten |
|---|---|---|---|---|---|
| 1 | bt_xcVXgHcBfi83m94 | John Smith | 5 | 1 Buch |
In Stripe enthält die Tabelle balance_ die folgenden Informationen, aber es fehlen die geschützten Daten zu den Namen der Kunden/Kundinnen und den gekauften Posten:
| ID | Betrag | available_on | Gebühr | net | automatic_transfer_id |
|---|---|---|---|---|---|
| bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Um neben Ihren Stripe-Daten auf Ihre proprietären Daten zuzugreifen, kombinieren Sie die Tabelle Aufträge mit der Tabelle balance_ von Stripe:
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Nach Abschluss sind die folgenden Informationen verfügbar:
| Datum | order_no | Stripe_txn_no | Betrag | Gebühr | automatic_transfer_id |
|---|---|---|---|---|---|
| 1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Datensätze
Eine Liste der verfügbaren Datensätze finden Sie unter Datensätze in der Schema-Dokumentation.
Die verfügbaren Datensätze können je nach Region variieren, abhängig von der lokalen Produktverfügbarkeit und den lokalen Vorschriften. Data Pipeline gibt jedes Dataset, das eine oder mehrere Warehouse-Tabellen enthält, separat frei, sobald Daten verfügbar sind. Data Pipeline aktualisiert einige Tabellen nach unterschiedlichen Zeitplänen, je nach der Verfügbarkeit neuer Daten. Unter Daten-Aktualität finden Sie weitere Informationen zu den verfügbaren Datensätzen und Aktualisierungszeitplänen.
Sandbox-Support
Sie können eine Sandbox, die eine risikofreie Umgebung ist, verwenden, um die Funktionalität von Data Pipeline zu testen. Mit einer Sandbox können Sie die Datensynchronisation testen, ohne dass Ihre Live-Produktionsdaten beeinträchtigt werden. Während des Tests bleibt jegliche kostenlose Testversion von Data Pipeline unangetastet, so dass Ihnen für Sandbox-Aktivitäten keine Rechnungen gestellt werden.
Um Sandbox-Daten anzuzeigen, greifen Sie auf das Schema TESTMODUS zu und filtern Sie nach Ihrer spezifischen Sandbox-Händler-ID. Mit dieser Einrichtung können Sie Ihre Testdaten neben Ihren bestehenden Analysen analysieren, ohne dass dies finanzielle Auswirkungen hat. Weitere Informationen zum Einrichten und Verwalten von Sandboxen finden Sie unter Sandboxen.
Data Pipeline deaktivieren
Sie können Data Pipeline im Dashboard deaktivieren, indem Sie auf Plan verwalten klicken.