SaaS の AI コスト
テナント別の上限、ルーティング、可視化でユニットエコノミクスを安定させる。
The problem
SaaS では AI コストはユニットエコノミクスの一部です。見えないままだとマージンがズレます。
可視化が効く理由
テナントごとに利用状況は違います。重いテナントの挙動が全体のコストモデルを壊してはいけません。
コスト分解
- モデル価格 × トークン
- ワークフローの呼び出し回数
- 失敗時のリトライ挙動
最適化アイデア
- 難易度でルーティング
- よくある手順はキャッシュ
- テナント別キャップと予算
エージェントのガードレール
ツールのリトライ回数を上限化し、収束しないループを止めます。
Next
API コストを見積もる