Data Pipeline
Utilisez Data Pipeline pour synchroniser des données Stripe avec un entrepôt de données.
Data Pipeline est un produit no-code qui envoie toutes vos données Stripe vers une variété de destinations de stockage de données. Cela vous permet de centraliser vos données Stripe avec d’autres données d’entreprise pour vous aider à clôturer vos livres et obtenir des informations stratégiques plus détaillées. Si vous avez des questions concernant la prise en charge de votre destination de données, contactez le service Support de Stripe.
Grâce à Data Pipeline, vous pouvez :
- Exporter automatiquement la totalité de vos données Stripe en toute sécurité et rapidité.
- Cesser de vous appuyer sur des pipelines d’extraction, de transformation et de chargement (ETL) tiers ou sur des intégrations d’API préconfigurées.
- Combiner les données de tous vos comptes Stripe dans un seul entrepôt de données.
- Intégrer les données Stripe aux autres données de votre entreprise pour obtenir des analyses commerciales plus complètes.
Mise en garde
Stripe ne propose pas les services de Data Pipeline aux clients, entreprises et utilisateurs en Inde en raison des exigences de localisation des données.
Prise en charge des destinations
Stripe Data Pipeline prend en charge deux types de destinations :
Entrepôts de données (Snowflake, Amazon Redshift)
Pour les destinations d’entrepôt de données, Stripe envoie un partage de données à votre entrepôt de données.
Une fois que vous avez accepté le partage de données, vous pouvez accéder à vos données Stripe principales dans Snowflake ou Amazon Redshift sous 12 heures.
Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 3 heures.
Cloud Storage (Google Cloud Storage, Azure Blob Storage, Amazon S3)
Pour nos destinations de stockage dans le cloud, Stripe envoie les fichiers Parquet directement à l’un de vos emplacements de stockage dans le cloud.
Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 3 heures.
Schémas de base de données
Les données de votre entrepôt sont divisées en deux schémas de base de données, en fonction du mode d’API utilisé pour créer les données.
Nom du schéma | Description |
---|---|
STRIPE | Données renseignées à partir du mode production |
STRIPE_ | Données remplies à partir d’environnements de test ou du mode test |
Si vous partagez les données de plusieurs comptes Stripe avec un même entrepôt de données, vous pouvez les identifier séparément. Chaque tableau comporte une colonne merchant_
, qui vous permet de filtrer les données par compte.
Utiliser Organizations pour gérer plusieurs pipelines de données
Si vous utilisez Organizations, vous pouvez voir tous les comptes qui partagent des données en externe. Vous pouvez :
- Créez un nouveau pipeline de données si votre rôle est celui de super administrateur ou d’administrateur.
- Ajouter un compte à une configuration d’entrepôt de données existante sans vérification supplémentaire.
- Désabonner un ou plusieurs comptes d’un pipeline de données.
- Supprimer la configuration du pipeline.
Si vous supprimez un compte d’une organisation, le partage de données s’arrête immédiatement pour ce compte.
Combiner les données propriétaires et celles de Stripe
Dans certains cas, vous pouvez souhaiter regrouper les informations issues de vos données propriétaires avec les données de Stripe. Le schéma qui suit expose un tableau orders
qui liste les informations à propos d’une commande pour une entreprise : Ce tableau ne contient pas les données relatives aux frais de transaction ou aux virements, car ces données sont uniquement disponibles dans Stripe.
date | order_no | stripe_txn_no | customer_name | tarif | articles |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | Jean Durand | 5 | 1 livre |
Dans Stripe, le tableau balance_
contient les informations suivantes, mais les données propriétaires concernant les noms des clients et les articles achetés n’y figurent pas :
id | montant | available_on | frais | net | automatic_transfer_id |
---|---|---|---|---|---|
bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Pour accéder à vos données propriétaires en même temps qu’à vos données Stripe, associez le tableau orders
au tableau balance_
de Stripe :
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Une fois l’opération terminée, les informations suivantes sont disponibles :
date | order_no | Stripe_txn_no | montant | frais | automatic_transfer_id |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Jeux de données
Vous pouvez consulter la liste des ensembles de données disponibles sous Ensembles de données dans la documentation relative aux schémas.
Les ensembles de données disponibles peuvent varier d’une région à l’autre, en fonction de la disponibilité des produits et des réglementations locales. Data Pipeline partage séparément chaque ensemble de données, qui contient une ou plusieurs tables d’entrepôt, à mesure que les données deviennent disponibles. Data Pipeline met à jour certaines tables à différentes fréquences en fonction de la disponibilité des nouvelles données. Consultez la page Actualisation des données pour plus d’informations sur les ensembles de données disponibles et les calendriers d’actualisation.
Prise en charge de l’environnement de test
Vous pouvez utiliser un environnement de test pour tester les fonctionnalités de Data Pipeline, qui est un environnement sans risque. Avec un environnement de test, vous pouvez évaluer la synchronisation des données sans affecter vos données en mode production. Pendant les tests, l’essai gratuit de Data Pipeline n’est pas affecté. Les activités que vous effectuez dans un environnement de test ne vous seront donc jamais facturées.
Pour afficher les données de l’environnement de test, accédez au schéma TESTMODE
et filtrez en fonction de l’ID de marchand de votre environnement de test. Cette configuration vous permet d’analyser vos données de test en même temps que vos analyses existantes sans implications financières.
Pour en savoir plus sur la configuration et la gestion des environnements de test, consultez la page consacrée aux environnements de test.
Désactiver Data Pipeline
Vous pouvez désactiver Data Pipeline dans le Dashboard en cliquant sur Gérer l’offre.