Data Pipeline

Data Pipeline を使用して、Stripe データをデータウェアハウスに同期します。

Data Pipeline は、すべての Stripe データをさまざまなデータ保存先に送信できるノーコードプロダクトです。これにより、Stripe のデータと他のビジネスデータを一元管理でき、帳簿の締め処理やより詳細なビジネスインサイトの取得に役立ちます。データ送信先のサポートについてご質問がある場合は、Stripe サポートまでお問い合わせください。

Data Pipeline を使用すると、以下のことが可能になります。

Stripe の包括的データを迅速に、信頼できる形式で自動的にエクスポートできます。
サードパーティーの抽出、変換、読み込み (ETL) パイプラインや社内で構築した API 組み込みに頼る必要がなくなります。
お客様のすべての Stripe アカウントのデータを 1 つのデータウェアハウスに統合できます。
Stripe のデータと他のビジネスデータを統合して、より総合的なビジネスインサイトを獲得できます。

注意

データローカリゼーションに関する要件に従い、Stripe は Data Pipeline サービスをインドの顧客、企業、ユーザーに提供していません。

宛先のサポート

Stripe Data Pipeline は、次の 2 種類の宛先をサポートしています。

データウェアハウス (Snowflake、Amazon Redshift)
- データウェアハウスの保存先の場合、 Stripe はデータウェアハウスにデータ共有を送信します。
- データ共有を承認すると、12 時間以内に Snowflake または Amazon Redshift から Stripe のコアデータにアクセスできます。
- 初回の読み込み後、Stripe データは定期的に更新され、3 時間ごとにデータが完全に読み込まれます。
クラウドストレージ (Google Cloud Storage、Azure Blob Storage、Amazon S3)
- クラウドストレージの保存先の場合、 Stripe はお客様が管理するクラウドストレージの場所に Parquet ファイルを直接送信します。
- 初回の読み込み後、Stripe データは定期的に更新され、3 時間ごとに新しいデータが完全に読み込まれます。

データベーススキーマ

ウェアハウスデータは、データの作成に使用した API モードに基づいて 2 つのデータベーススキーマに分割されます。

スキーマ名	説明
`STRIPE`	本番環境からデータが取り込まれます
`STRIPE_TESTMODE`	サンドボックスとテスト環境から入力されたデータ

同じデータウェアハウスで複数の Stripe アカウントのデータを共有している場合、それらを個別に識別できます。テーブルのすべてに merchant_id 列が存在するため、アカウントごとにデータを絞り込むことが可能です。

Organizations を使用して複数のデータパイプラインを管理する

Organizations を使用している場合は、データを外部と共有しているすべてのアカウントを確認できます。具体的に、以下の操作が可能です。

新しいデータパイプラインを作成する (スーパー管理者または管理者の役割が付与されている場合)。
追加確認なしで、既存のデータウェアハウス設定にアカウントを追加する。
データパイプラインにあるアカウントの登録を解除する。
パイプラインの設定を削除する。

組織からアカウントを削除すると、そのアカウントのデータ共有が即座に停止します。

独自のデータと Stripe のデータを組み合わせる

場合によっては、独自のデータからの情報を Stripe データと組み合わせることをお勧めします。次のスキーマは、会社の注文に関するデータを一覧表示する orders テーブルを示しています。取引手数料や入金に関するデータは Stripe 内にのみ存在するため、このテーブルには含まれていません。

日付	order_no	stripe_txn_no	customer_name	価格	アイテム
2025/8/14	1	bt_xcVXgHcBfi83m94	John Smith	5	1 つの書籍

Stripe では、balance_transactions テーブルに次の情報が含まれていますが、顧客の名前と購入された項目に関する独自のデータはありません。

id	金額	available_on	手数料	net	automatic_transfer_id
bt_xcVXgHcBfi83m94	500	2025/8/14	50	450	po_rC4ocAkjGy8zl3j

お客様の独自データと Stripe データの両方にアクセスするには、orders テーブルと Stripe の balance_transactions テーブルを組み合わせます。

select
  orders.date,
  orders.order_no,
  orders.stripe_txn_no,
  bts.amount,
  bts.fee,
  bts.automatic_transfer_id
from mycompany.orders join stripe.balance_transactions bts
on orders.stripe_txn_no = bts.id;

完了すると、以下の情報が使用できるようになります。

日付	order_no	Stripe_txn_no	金額	手数料	automatic_transfer_id
2025/8/14	1	bt_xcVXgHcBfi83m94	500	50	po_rC4ocAkjGy8zl3j

データセット

利用可能なデータセットのリストは、スキーマに関するドキュメントのデータセットで確認できます。

利用可能なデータセットは地域によって異なる場合があり、現地でのプロダクトのサポート状況と規制の影響を受けます。Data Pipeline は、データが利用可能になると、1 つ以上のウェアハウステーブルを含むデータセットを個別に共有します。Data Pipeline は、新しいデータの可用性に応じて、異なるスケジュールでテーブルを更新します。利用可能なデータセットと更新スケジュールについて、詳細はデータの鮮度をご覧ください。

サンドボックスのサポート

リスクのない環境であるサンドボックスを使用して、Data Pipeline の機能をテストできます。サンドボックスを使用すると、本番データに影響を与えることなくデータ同期を評価できます。テスト中は、Data Pipeline の無料トライアルは影響を受けず、サンドボックスでのアクティビティに対して課金されることはありません。

サンドボックスデータを表示するには、TESTMODE スキーマにアクセスして、特定のサンドボックス加盟店 ID で絞り込みます。このフィルター設定により、財務上の影響を与えることなく、既存の分析と並行してテストデータを分析できます。

サンドボックスの設定と管理に関する詳しいガイダンスについては、サンドボックスをご覧ください。

Data Pipeline を無効にする

ダッシュボードのプランの管理をクリックして Data Pipeline を無効にできます。