# LLM Proxy による請求

LLM トークンの請求方法をご覧ください。

## 概要

プロキシ API を使用して LLM モデルを呼び出し、顧客ごとの使用量を自動的に記録できます。リクエストをプロバイダーにルーティングし、レスポンスを返却した上で、顧客への自動請求のためにモデルとタイプ別にトークンを帰属させます。

プロキシは、サポートされているすべての AI モデルの最新トークンコストを取得します。具体的な料金の項目は料金テーブルに記載されています。コストは各モデルのプロバイダーが公表する現在の市場レートを反映しています。

**Publisher** は、モデルを作成、所有する組織を示します。

**Provider** は、モデルリクエストを処理し、請求に使用されるレートを設定するサービスを示します。

publisher と provider は常に同じとは限りません。あるモデルがある組織によって公開されていても、別の provider によって提供される場合があります。publisher には OpenAI、Anthropic、Google などが含まれ、provider には Bedrock、Azure、Deepinfra などが含まれます。

## トークンと料金

推論の呼び出しごとに、プロバイダーは消費されたトークン数を返します。トークンタイプが存在するのは、プロバイダーがリクエストの各部分 (プロンプト処理、生成された出力、キャッシュ使用量など) を個別に計測するためです。モデルファミリー (テキスト、画像、マルチモーダル) によってトークン使用量の報告方法が異なり、各タイプのトークン数と対応するレートはプロバイダーが決定します。

- **Cached input:** モデルによる再計算ではなく、キャッシュから読み込まれたプロンプトトークン。
- **Cached output:** 新たに生成されるのではなく、キャッシュから提供されたレスポンストークン。これを独立したトークンタイプとして報告するプロバイダーもあれば、キャッシュ済み入力数に含めるプロバイダーもあります。
- **Input:** プロンプトでモデルに送信されるトークン。
- **Output:** モデルがレスポンスとして生成するトークン。

> #### 料金更新タイムライン
> 
> トークン料金はプロバイダーの現在の料金を反映するよう自動的に更新されます。変更が反映されるまでに若干の遅延が生じる場合があります。

## 料金表 (100 万トークンあたりの料金)

### AI model pricing table

The interactive pricing table is available in the web view. In plaintext and markdown exports, use the filters in the web UI to view current model pricing by publisher, provider, token type, display name, and price threshold.