Fonctionnement de Data Pipeline
Découvrez ce que vous pouvez faire avec Data Pipeline.
Data Pipeline est un produit sans code qui envoie toutes vos données Stripe vers diverses destinations de stockage de données. Cela vous permet de centraliser vos données Stripe avec d’autres données commerciales pour vous aider à clôturer vos livres comptables et obtenir des informations commerciales plus détaillées. Si vous avez des questions concernant la prise en charge de votre destination de données, contactez le service d’assistance Stripe.
Grâce à Data Pipeline, vous pouvez :
- Exporter automatiquement la totalité de vos données Stripe en toute sécurité et rapidité.
- Ne dépendez plus des pipelines ETL (extraction, transformation et chargement) tiers ou des intégrations API maison.
- Combinez les données de tous vos comptes Stripe dans un seul entrepôt de données.
- Intégrer les données Stripe aux autres données de votre entreprise pour obtenir des analyses commerciales plus complètes.
Mise en garde
Stripe ne propose pas les services de Data Pipeline aux clients, entreprises et utilisateurs en Inde en raison des exigences de localisation des données.
Prise en charge des destinations
Stripe Data Pipeline prend en charge deux variantes de destinations :
Entrepôts de données (Snowflake, Amazon Redshift)
Pour les destinations d’entrepôt de données, Stripe envoie un partage de données à votre entrepôt de données.
Une fois que vous avez accepté le partage de données, vous pouvez accéder à vos données Stripe principales dans Snowflake ou Amazon Redshift sous 12 heures.
Après le chargement initial, vos données Stripe sont actualisées régulièrement, avec un chargement complet toutes les 3 heures.
Stockage dans le cloud (Google Cloud Storage, Azure Blob Storage, Amazon S3)
Pour nos destinations de stockage dans le cloud, Stripe envoie les fichiers Parquet directement à l’un de vos emplacements de stockage dans le cloud.
Après le chargement initial, vos données Stripe sont actualisées régulièrement, avec un chargement complet de données toutes les 3 heures.
Schémas de base de données
Les données de votre entrepôt sont divisées en deux schémas de base de données établis selon le mode API utilisé pour créer les données.
| Nom du schéma | Description |
|---|---|
STRIPE | Données renseignées à partir du mode production |
STRIPE_ | Données renseignées à partir des environnements de test et du mode test |
Si vous partagez les données de plusieurs comptes Stripe avec un même entrepôt de données, vous pouvez les identifier séparément. Chaque tableau comporte une colonne merchant_, qui vous permet de filtrer les données par compte.
Utiliser Organizations pour gérer plusieurs pipelines de données
Si vous utilisez Organizations, vous pouvez voir tous les comptes qui partagent des données externes. Vous pouvez :
- Créez un nouveau pipeline de données si vous avez les rôles Super Administrateur ou Administrateur.
- Ajoutez un compte à une configuration d’entrepôt de données existante sans vérification supplémentaire.
- Désabonner un ou plusieurs comptes d’un pipeline de données.
- Supprimez la configuration du pipeline.
Si vous supprimez un compte d’une organisation, le partage de vos données pour ce compte cesse immédiatement.
Combiner les données propriétaires et celles de Stripe
Dans certains cas, vous pouvez vouloir combiner les informations de vos données propriétaires avec les données Stripe. Le schéma suivant montre un tableau des commandes qui répertorie les données concernant une commande pour une entreprise. Ce tableau ne contient pas de données concernant les frais de transaction ou les paiements, car ces données existent uniquement dans Stripe.
| date | order_no | stripe_txn_no | customer_name | prix | articles |
|---|---|---|---|---|---|
| 1 | bt_xcVXgHcBfi83m94 | John Smith | 5 | 1 livre |
Dans Stripe, le tableau balance_ contient les informations suivantes, mais ne dispose pas des données propriétaires concernant les noms des clients et les articles achetés :
| id | montant | available_on | frais | net | automatic_transfer_id |
|---|---|---|---|---|---|
| bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Pour accéder à vos données propriétaires en même temps qu’à vos données Stripe, associez le tableau orders au tableau balance_ de Stripe :
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Une fois l’opération terminée, les informations suivantes sont disponibles :
| date | order_no | Stripe_txn_no | montant | frais | automatic_transfer_id |
|---|---|---|---|---|---|
| 1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Jeux de données
Vous pouvez consulter la liste des jeux de données disponibles sous Jeux de données dans la documentation du schéma.
Les ensembles de données disponibles peuvent varier d’une région à l’autre, sous réserve de la disponibilité des produits et des réglementations locales. Data Pipeline partage séparément chaque ensemble de données, qui contient un ou plusieurs tableaux d’entrepôt, au fur et à mesure que les données deviennent disponibles. Data Pipeline met à jour certains tableaux selon des calendriers différents établis selon la disponibilité de nouvelles données. Pour en savoir plus sur les ensembles de données disponibles et actualiser les calendriers, consultez l’article Actualisation des données.
Prise en charge de l’environnement de test
Vous pouvez utiliser un environnement de test, qui est un environnement sans risque, pour tester les fonctionnalités de Data Pipeline. Grâce à cet environnement, vous pouvez évaluer la synchronisation des données sans affecter vos données de production en direct. Pendant la période de test, tout essai gratuit de Data Pipeline reste inchangé, ce qui vous garantit de ne jamais être facturé pour les activités environnement de test.
Pour afficher les données environnement de test, accédez au schéma MODE TEST et filtrez par ID marchand de votre environnement de test spécifique. Cette configuration vous permet d’analyser vos données test parallèlement à vos analyses existantes sans implications financières. Pour plus d’informations sur la configuration et la gestion des environnements de test, consultez l’article Environnements de test.
Désactiver Data Pipeline
Vous pouvez désactiver Data Pipeline dans le Dashboard en cliquant sur Gérer l’offre.