Accéder aux données de votre entrepôt de données avec Data Pipeline
Synchronisez votre compte Stripe avec Snowflake, Amazon Redshift, Google Cloud Storage et d'autres services de stockage de données.
Data Pipeline est un produit sans code qui envoie l’ensemble de vos données Stripe vers une multitude de destinations de stockage de données. Cela vous permet de centraliser vos données Stripe avec d’autres données commerciales pour clôturer vos comptes et bénéficier d’informations plus détaillées.
Grâce à Data Pipeline, vous pouvez :
- Exporter automatiquement la totalité de vos données Stripe en toute sécurité et rapidité.
- Cesser de vous appuyer sur des pipelines d’extraction, de transformation et de chargement (ETL) tiers ou sur des intégrations d’API préconfigurées.
- Combiner les données de tous vos comptes Stripe dans un seul entrepôt de données.
- Intégrer les données Stripe aux autres données de votre entreprise pour obtenir des analyses commerciales plus complètes.
Mise en garde
Stripe ne propose pas les services de Data Pipeline aux clients, entreprises et utilisateurs en Inde en raison des exigences de localisation des données.
Note
Si vous avez des questions concernant la prise en charge de votre destination de données, contactez-nous à l’adresse data-pipeline@stripe.com.
Prise en charge des destinations
Stripe Data Pipeline prend en charge deux types de destinations.
- Entrepôts de données (Snowflake, Amazon Redshift)
- Pour les destinations d’entrepôt de données, Stripe envoie un partage de données à votre entrepôt de données.
- Une fois que vous avez accepté le partage de données, vous pouvez accéder à vos données Stripe principales dans Snowflake ou Amazon Redshift sous 12 heures.
- Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 3 heures par le biais du chargement incrémentiel ou complet.
- Cloud Storage (Google Cloud Storage, Azure Blob Storage)
- Pour nos destinations de stockage dans le cloud, Stripe envoie les fichiers Parquet directement à l’un de vos emplacements de stockage dans le cloud.
- Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 6 heures.
Schémas de base de données
Les données de votre entrepôt sont divisées en deux schémas de base de données, en fonction du mode d’API utilisé pour créer les données.
Nom du schéma | Description |
---|---|
STRIPE | Données renseignées par le mode production |
STRIPE_ | Données renseignées par le mode test |
Entrepôt de données utilisé par plusieurs comptes Stripe
Si vous partagez les données de plusieurs comptes Stripe avec un même entrepôt de données, vous pouvez les identifier séparément. Chaque tableau comporte une colonne merchant_
, qui vous permet de filtrer les données par compte.
Exemple de cas d’usage
Dans certains cas, vous pouvez souhaiter regrouper les informations issues de vos données propriétaires avec les données de Stripe. Le schéma qui suit expose une table orders
qui liste les informations à propos d’une commande pour une entreprise :
date | order_no | stripe_txn_no | customer_name | tarif | articles |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | Jean Durand | 5 | 1 livre |
Le tableau ci-dessus ne contient pas les données relatives aux frais de transaction ou aux virements, car ces données sont uniquement disponibles dans Stripe. Dans Stripe, le tableau balance_
contient les informations suivantes, mais les données propriétaires concernant les noms des clients et les articles achetés n’y figurent pas :
id | montant | available_on | frais | net | automatic_transfer_id |
---|---|---|---|---|---|
bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Pour accéder à vos données propriétaires en même temps qu’à vos données Stripe, associez le tableau orders
au tableau balance_
de Stripe :
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Une fois l’opération terminée, les informations suivantes sont disponibles :
date | order_no | Stripe_txn_no | montant | frais | automatic_transfer_id |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Jeux de données
Vous pouvez consulter la liste des ensembles de données disponibles dans la section **Ensembles de données ** de la documentation consacrée aux schémas du Dashboard. Les ensembles de données disponibles peuvent varier en fonction de la région, et dépendent de la disponibilité et des réglementations locales. Data Pipeline partage séparément chaque ensemble de données, qui contient une ou plusieurs tables d’entrepôt de données, chaque fois que de nouvelles données sont disponibles. Data Pipeline met à jour différentes tables à différentes fréquences, en fonction de la disponibilité des nouvelles données. Pour en savoir plus sur les ensembles de données disponibles et les fréquences d’actualisation, consultez la documentation consacrée à l’actualisation des données.
Notifications par e-mail
Vous pouvez également vous abonner pour recevoir des notifications par e-mail pour les mises à jour importantes dans le Dashboard.
Désactiver Data Pipeline
Vous pouvez désactiver Data Pipeline sur la page des paramètres du Dashboard en cliquant sur Désactiver. Après la déconnexion, vous perdrez immédiatement l’accès à vos données partagées.