AI Cost Save
AICostSave

Claude 成本(你应该关注什么)

用输入/输出 tokens + 你的工作流调用量,估算 Claude 的成本。

The problem

当你的应用不断重复发送上下文,或者 agent 触发额外润色步骤时,Claude 成本就会变得难以直觉理解。

Claude 的“人话版本”

把它想成输入 tokens(上下文) + 输出 tokens(回答),再乘以你产品触发的调用次数。

成本分解

  • 上下文 tokens
  • 输出 tokens
  • 工作流调用:retries、tool calls 与 draft → refine 循环

估算方法

分别用 input/output 的 token 价格乘以 token 数,再按每次用户操作的调用次数缩放。

优化清单

  • 缩短上下文(摘要 + 检索)
  • 限制 max output tokens
  • 加护栏防止 runaway loops