Claude: Kosten pro Token (was tracken)
Claude-Kosten schätzen, inkl. input/output Token und Call-Volume eures Workflows.
The problem
Kosten werden unklar, wenn ihr ständig viel Kontext sendet oder Agents zusätzliche Refinement-Calls auslösen.
Claude in einfache Begriffe übersetzt
Denkt in input Tokens (Kontext) und output Tokens (Antworten) – und addiert das Call-Volume.
Kostenaufteilung
- Kontext (Prompt/Tokens)
- Response/Output Tokens
- Workflow-Calls: Retries, Tools, „draft → refine“-Loops
Beispiel
Input/Output Tokens mit ihren Raten multiplizieren und dann mit Calls pro Nutzeraktion skalieren.
Checkliste
- Kontext kürzen (Summaries + Retrieval)
- max output tokens cap
- Guardrails gegen Runaway-Loops
