LLM 成本估算器
跨模型对比:用“每次调用的计费 tokens + refinement 次数”,而不是只看单价。
The problem
不同模型可能完成同一个任务需要不同的调用次数。看起来“更便宜”的模型,也可能因为调用更多而更贵。
核心框架
- 每次调用的计费 tokens
- 每次用户操作的调用次数
- 每个模型的计费 tokens 总量
为什么路由很重要
路由能让你用更便宜模型处理简单步骤,把高价模型留给最终质量。
示例
模型 A:1 次调用。模型 B:2 次调用。即使 B 的 headline rate 更低,A 仍可能更省。
Next
决定 GPT vs Claude