Accéder aux données au sein d’un entrepôt de données
Utilisez Data Pipeline pour synchroniser des données Stripe avec un entrepôt de données.
Data Pipeline est un produit no-code qui envoie toutes vos données Stripe vers une variété de destinations de stockage de données. Cela vous permet de centraliser vos données Stripe avec d’autres données d’entreprise pour vous aider à clôturer vos livres et obtenir des informations stratégiques plus détaillées. Si vous avez des questions concernant la prise en charge de votre destination de données, contactez-nous.
Grâce à Data Pipeline, vous pouvez :
- Exporter automatiquement la totalité de vos données Stripe en toute sécurité et rapidité.
- Cesser de vous appuyer sur des pipelines d’extraction, de transformation et de chargement (ETL) tiers ou sur des intégrations d’API préconfigurées.
- Combiner les données de tous vos comptes Stripe dans un seul entrepôt de données.
- Intégrer les données Stripe aux autres données de votre entreprise pour obtenir des analyses commerciales plus complètes.
Mise en garde
Stripe ne propose pas les services de Data Pipeline aux clients, entreprises et utilisateurs en Inde en raison des exigences de localisation des données.
Prise en charge des destinations
Stripe Data Pipeline prend en charge deux types de destinations :
Entrepôts de données (Snowflake, Amazon Redshift)
Pour les destinations d’entrepôt de données, Stripe envoie un partage de données à votre entrepôt de données.
Une fois que vous avez accepté le partage de données, vous pouvez accéder à vos données Stripe principales dans Snowflake ou Amazon Redshift sous 12 heures.
Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 3 heures par le biais du chargement incrémentiel ou complet.
Cloud Storage (Google Cloud Storage, Azure Blob Storage, Amazon S3)
Pour nos destinations de stockage dans le cloud, Stripe envoie les fichiers Parquet directement à l’un de vos emplacements de stockage dans le cloud.
Après le chargement initial, vos données Stripe sont mises à jour régulièrement, et vous obtenez de nouvelles données toutes les 6 heures.
Schémas de base de données
Les données de votre entrepôt sont divisées en deux schémas de base de données, en fonction du mode d’API utilisé pour créer les données.
Nom du schéma | Description |
---|---|
STRIPE | Données renseignées à partir du mode production |
STRIPE_ | Données renseignées par le mode test |
Si vous partagez les données de plusieurs comptes Stripe avec un même entrepôt de données, vous pouvez les identifier séparément. Chaque tableau comporte une colonne merchant_
, qui vous permet de filtrer les données par compte.
Combiner les données propriétaires et celles de Stripe
Dans certains cas, vous pouvez souhaiter regrouper les informations issues de vos données propriétaires avec les données de Stripe. Le schéma qui suit expose un tableau orders
qui liste les informations à propos d’une commande pour une entreprise : Ce tableau ne contient pas les données relatives aux frais de transaction ou aux virements, car ces données sont uniquement disponibles dans Stripe.
date | order_no | stripe_txn_no | customer_name | tarif | articles |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | Jean Durand | 5 | 1 livre |
Dans Stripe, le tableau balance_
contient les informations suivantes, mais les données propriétaires concernant les noms des clients et les articles achetés n’y figurent pas :
id | montant | available_on | frais | net | automatic_transfer_id |
---|---|---|---|---|---|
bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
Pour accéder à vos données propriétaires en même temps qu’à vos données Stripe, associez le tableau orders
au tableau balance_
de Stripe :
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
Une fois l’opération terminée, les informations suivantes sont disponibles :
date | order_no | Stripe_txn_no | montant | frais | automatic_transfer_id |
---|---|---|---|---|---|
1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
Jeux de données
Vous pouvez consulter la liste des ensembles de données disponibles dans la section **Ensembles de données ** de la documentation consacrée aux schémas du Dashboard. Les ensembles de données disponibles peuvent varier en fonction de la région, et dépendent de la disponibilité et des réglementations locales. Data Pipeline partage séparément chaque ensemble de données, qui contient une ou plusieurs tables d’entrepôt de données, chaque fois que de nouvelles données sont disponibles. Data Pipeline met à jour différentes tables à différentes fréquences, en fonction de la disponibilité des nouvelles données. Pour en savoir plus sur les ensembles de données disponibles et les fréquences d’actualisation, consultez la documentation consacrée à l’actualisation des données.
Désactiver Data Pipeline
Vous pouvez désactiver Data Pipeline dans le Dashboard en cliquant sur Désactiver. Une fois la déconnexion effectuée, vous perdrez immédiatement l’accès au partage de données. Si vous souhaitez télécharger des fichiers avec une structure différente ou dans un format personnalisé, contactez-nous.