LLM 成本估算器

跨模型对比：用“每次调用的计费 tokens + refinement 次数”，而不是只看单价。

The problem

不同模型可能完成同一个任务需要不同的调用次数。看起来“更便宜”的模型，也可能因为调用更多而更贵。

核心框架

每次调用的计费 tokens
每次用户操作的调用次数
每个模型的计费 tokens 总量

为什么路由很重要

路由能让你用更便宜模型处理简单步骤，把高价模型留给最终质量。

示例

模型 A：1 次调用。模型 B：2 次调用。即使 B 的 headline rate 更低，A 仍可能更省。

Next

决定 GPT vs Claude