Data Pipeline の仕組み
Data Pipeline でできることをご紹介します。
Data Pipeline は、お客様のあらゆる Stripe データを様々なデータストレージの保存先に送信するノーコード製品です。これにより、Stripe データを他のビジネスデータとともに一元管理でき、決算のより詳細なビジネスインサイトを得ることができます。データの保存先のサポートについてご不明な点がございましたら、[Stripe サポート](https://support.stripe.com/contact/email?topic=third_party_integrations&subject=Stripe%20Data%20Pipeline%20(SDP) にお問い合わせください。
Data Pipeline を使用すると、以下のことが可能になります。
- Stripe の包括的なデータを迅速に、信頼できる形式で自動的にエクスポートできます。
- サードパーティーの抽出、変換、読み込み (ETL) パイプラインや社内で構築した API 組み込みに頼る必要がなくなります。
- お客様のすべての Stripe アカウントのデータを 1 つのデータウェアハウスに統合できます。
- Stripe のデータと他のビジネスデータを統合して、より総合的なビジネスインサイトを獲得できます。
注意
データローカリゼーションに関する要件に従い、Stripe は Data Pipeline サービスをインドの顧客、企業、ユーザーに提供していません。
保存先のサポート
Stripe Data Pipeline は、2 種類の保存先をサポートしています。
データウェアハウス (Snowflake、Amazon Redshift、Databricks)
データウェアハウスの保存先の場合、Stripe はデータウェアハウスにデータ共有を送信します。
データ共有を承認すると、12 時間以内に Snowflake、Amazon Redshift、または Databricks で Stripe のコアデータにアクセスできます。
初回の読み込み後は、Stripe データが 定期的に更新 され、3 時間ごとにすべてのデータが読み込まれます。
クラウドストレージ (Google Cloud Storage、Azure Blob Storage、Amazon S3)
データベーススキーマ
データウェアハウスのデータは、データ作成時に使用した API モードに基づいて、2 つのデータベーススキーマに分割されます。
同じデータウェアハウスで複数の Stripe アカウントのデータを共有している場合、それらを個別に識別できます。テーブルのすべてに merchant_ 列が存在するため、アカウントごとにデータを絞り込むことが可能です。
Organizations を使用して複数のデータパイプラインを管理する
Organizations を使用すると、外部でデータを共有するすべてのアカウントを確認できます。以下を実行できます。
- スーパー管理者 または管理者のロールがある場合は、新しいデータパイプラインを作成します。
- 追加の確認なしで既存のデータウェアハウス設定にアカウントを追加します。
- データパイプラインから 1 つ以上のアカウントを登録解除します。
- パイプラインの設定を削除します。
組織からアカウントを削除すると、そのアカウントのデータ共有は直ちに停止します。
専有データと Stripe データを統合
場合によっては、独自のデータからの情報を Stripe データと組み合わせる必要があります。次のスキーマは、会社の注文に関するデータをリストした orders テーブルを示しています。取引手数料や入金に関するデータは Stripe 内のみに存在するため、このテーブルには含まれていません。
| 日付 | order_no | stripe_txn_no | customer_name | 価格 | アイテム |
|---|---|---|---|---|---|
| 1 | bt_xcVXgHcBfi83m94 | 山田 花子 | 5 | 1 つの本 |
Stripe の balance_ テーブルには次の情報が含まれていますが、顧客名と購入アイテムに関する独自のデータがありません。
| ID | 金額 | available_on | 手数料 | net | automatic_transfer_id |
|---|---|---|---|---|---|
| bt_xcVXgHcBfi83m94 | 500 | 50 | 450 | po_rC4ocAkjGy8zl3j |
お客様の独自データと Stripe データの両方にアクセスするには、orders テーブルと Stripe の balance_ テーブルを組み合わせます。
select orders.date, orders.order_no, orders.stripe_txn_no, bts.amount, bts.fee, bts.automatic_transfer_id from mycompany.orders join stripe.balance_transactions bts on orders.stripe_txn_no = bts.id;
完了すると、以下の情報が使用できるようになります。
| 日付 | order_no | Stripe_txn_no | 金額 | 手数料 | automatic_transfer_id |
|---|---|---|---|---|---|
| 1 | bt_xcVXgHcBfi83m94 | 500 | 50 | po_rC4ocAkjGy8zl3j |
データセット
利用可能なデータセットのリストは、スキーマドキュメント の データセット で確認できます。
利用可能なデータセットは、地域によって異なる場合があります。また、各地域の製品の提供状況と規制によって異なる場合があります。Data Pipeline は、データが利用可能になると、1つ以上のウェアハウステーブルを含む各データセットを別々に共有します。Data Pipeline は、新しいデータの利用可能状況に基づいて、異なるスケジュールで一部のテーブルを更新します。利用可能なデータセットと更新スケジュールの詳細については、データの鮮度 をご覧ください。
サンドボックスサポート
リスクのない環境であるサンドボックスを使用して、Data Pipeline 機能をテストできます。サンドボックスを使用すると、本番データに影響を与えることなくデータ同期を評価できます。テスト中も、Data Pipeline の無料トライアルは影響を受けないため、サンドボックスのアクティビティーに対する請求は発生しません。
サンドボックスデータを表示するには、TESTMODE スキーマにアクセスし、特定のサンドボックス加盟店 ID でフィルタリングします。この設定により、財務に影響を与えることなく、既存の分析とともにテストデータを分析できます。サンドボックスの設定と管理の詳細については、サンドボックス を参照してください。
Data Pipeline を無効にする
ダッシュボードで プランを管理 をクリックすると、Data Pipeline を無効にできます。