Claude: costo per token (cosa tracciare)
Stima i costi Claude separando input/output e considerando il volume di chiamate.
The problem
I costi diventano confusi se invii troppo contesto o se gli agent attivano passaggi di refinement extra.
Claude spiegato semplice
Pensa in input tokens (contesto) e output tokens (risposte). Poi aggiungi il volume di chiamate del tuo prodotto.
Breakdown
- Token di contesto
- Output token
- Calls workflow: retries, tool e loop draft → refine
Esempio
Moltiplica input/output per i rispettivi rate e poi scala per numero di call per azione utente.
Checklist
- Riduci contesto (summary + retrieval)
- Cap max output tokens
- Aggiungi guardrails per i runaway loops
