OpenAI のコスト(1 トークンあたりの見方)
OpenAI の“1 トークンあたり”の考え方を整理し、入力/出力で見積もる方法を説明します。
The problem
「OpenAI cost per token」が分かりにくいのは、単位(input/output)、トークン種類、リトライ増幅が混ざっているからです。
“コスト/トークン”の正しい意味
OpenAI の価格は多くの場合、入力トークンと出力トークンで分かれています。請求は両方の合計に連動します。
コスト分解
- 入力トークン:プロンプト + ツール文脈
- 出力トークン:モデルの応答
- 追加呼び出し:リトライやツールチェーンで増える
例
1 回のリクエストで入力 10k、出力 3k トークンを使うなら、入力/出力のレートに当てはめて、リクエスト回数でスケールします。
よくあるミス
- 出力トークンを見ていない
- 1 回のモデル呼び出し = 1 ユーザー操作だと思い込む
- リトライ増幅を考慮していない
次のステップ
計算機ページで、見積もりを日次/月次コストに変換します。
