Data Pipeline

Utilisez Data Pipeline pour synchroniser des données Stripe avec un entrepôt de données.

Data Pipeline est un produit no-code qui envoie toutes vos données Stripe vers une variété de destinations de stockage de données. Cela vous permet de centraliser vos données Stripe avec d’autres données d’entreprise pour vous aider à clôturer vos livres et obtenir des informations stratégiques plus détaillées. Si vous avez des questions concernant la prise en charge de votre destination de données, contactez le service Support de Stripe.

Grâce à Data Pipeline, vous pouvez :

Exporter automatiquement la totalité de vos données Stripe en toute sécurité et rapidité.
Cesser de vous appuyer sur des pipelines d’extraction, de transformation et de chargement (ETL) tiers ou sur des intégrations d’API préconfigurées.
Combiner les données de tous vos comptes Stripe dans un seul entrepôt de données.
Intégrer les données Stripe aux autres données de votre entreprise pour obtenir des analyses commerciales plus complètes.

Mise en garde

Stripe ne propose pas les services de Data Pipeline aux clients, entreprises et utilisateurs en Inde en raison des exigences de localisation des données.

Prise en charge des destinations

Stripe Data Pipeline prend en charge deux types de destinations :

Entrepôts de données (Snowflake, Amazon Redshift)
- Pour les destinations d’entrepôt de données, Stripe envoie un partage de données à votre entrepôt de données.
- Une fois que vous avez accepté le partage de données, vous pouvez accéder à vos données Stripe principales dans Snowflake ou Amazon Redshift sous 12 heures.
- Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 3 heures.
Cloud Storage (Google Cloud Storage, Azure Blob Storage, Amazon S3)
- Pour nos destinations de stockage dans le cloud, Stripe envoie les fichiers Parquet directement à l’un de vos emplacements de stockage dans le cloud.
- Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 3 heures.

Schémas de base de données

Les données de votre entrepôt sont divisées en deux schémas de base de données, en fonction du mode d’API utilisé pour créer les données.

Nom du schéma	Description
`STRIPE`	Données renseignées à partir du mode production
`STRIPE_TESTMODE`	Données remplies à partir d’environnements de test ou du mode test

Si vous partagez les données de plusieurs comptes Stripe avec un même entrepôt de données, vous pouvez les identifier séparément. Chaque tableau comporte une colonne merchant_id, qui vous permet de filtrer les données par compte.

Utiliser Organizations pour gérer plusieurs pipelines de données

Si vous utilisez Organizations, vous pouvez voir tous les comptes qui partagent des données en externe. Vous pouvez :

Créez un nouveau pipeline de données si votre rôle est celui de super administrateur ou d’administrateur.
Ajouter un compte à une configuration d’entrepôt de données existante sans vérification supplémentaire.
Désabonner un ou plusieurs comptes d’un pipeline de données.
Supprimer la configuration du pipeline.

Si vous supprimez un compte d’une organisation, le partage de données s’arrête immédiatement pour ce compte.

Combiner les données propriétaires et celles de Stripe

Dans certains cas, vous pouvez souhaiter regrouper les informations issues de vos données propriétaires avec les données de Stripe. Le schéma qui suit expose un tableau orders qui liste les informations à propos d’une commande pour une entreprise : Ce tableau ne contient pas les données relatives aux frais de transaction ou aux virements, car ces données sont uniquement disponibles dans Stripe.

date	order_no	stripe_txn_no	customer_name	tarif	articles
14/08/2025	1	bt_xcVXgHcBfi83m94	Jean Durand	5	1 livre

Dans Stripe, le tableau balance_transactions contient les informations suivantes, mais les données propriétaires concernant les noms des clients et les articles achetés n’y figurent pas :

id	montant	available_on	frais	net	automatic_transfer_id
bt_xcVXgHcBfi83m94	500	14/08/2025	50	450	po_rC4ocAkjGy8zl3j

Pour accéder à vos données propriétaires en même temps qu’à vos données Stripe, associez le tableau orders au tableau balance_transactions de Stripe :

select
  orders.date,
  orders.order_no,
  orders.stripe_txn_no,
  bts.amount,
  bts.fee,
  bts.automatic_transfer_id
from mycompany.orders join stripe.balance_transactions bts
on orders.stripe_txn_no = bts.id;

Une fois l’opération terminée, les informations suivantes sont disponibles :

date	order_no	Stripe_txn_no	montant	frais	automatic_transfer_id
14/08/2025	1	bt_xcVXgHcBfi83m94	500	50	po_rC4ocAkjGy8zl3j

Jeux de données

Vous pouvez consulter la liste des ensembles de données disponibles sous Ensembles de données dans la documentation relative aux schémas.

Les ensembles de données disponibles peuvent varier d’une région à l’autre, en fonction de la disponibilité des produits et des réglementations locales. Data Pipeline partage séparément chaque ensemble de données, qui contient une ou plusieurs tables d’entrepôt, à mesure que les données deviennent disponibles. Data Pipeline met à jour certaines tables à différentes fréquences en fonction de la disponibilité des nouvelles données. Consultez la page Actualisation des données pour plus d’informations sur les ensembles de données disponibles et les calendriers d’actualisation.

Prise en charge de l’environnement de test

Vous pouvez utiliser un environnement de test pour tester les fonctionnalités de Data Pipeline, qui est un environnement sans risque. Avec un environnement de test, vous pouvez évaluer la synchronisation des données sans affecter vos données en mode production. Pendant les tests, l’essai gratuit de Data Pipeline n’est pas affecté. Les activités que vous effectuez dans un environnement de test ne vous seront donc jamais facturées.

Pour afficher les données de l’environnement de test, accédez au schéma TESTMODE et filtrez en fonction de l’ID de marchand de votre environnement de test. Cette configuration vous permet d’analyser vos données de test en même temps que vos analyses existantes sans implications financières.

Pour en savoir plus sur la configuration et la gestion des environnements de test, consultez la page consacrée aux environnements de test.

Désactiver Data Pipeline

Vous pouvez désactiver Data Pipeline dans le Dashboard en cliquant sur Gérer l’offre.