AI Cost per Agent
Agent cost = workflow cost. Impara a capare retries, evitare loop e tenere i token sotto controllo.
The problem
Le sorprese di costo arrivano quando l’agent va in retry, usa tool chain e non trova convergenza.
Perché gli agent bruciano budget
- retries moltiplicano le chiamate
- ragionamento lungo = più tokens
- loop quando manca un segnale di stop
Breakdown
Agent cost = tokens su tutti i model calls + tokens del contesto tool + retries.
Esempio
L’agent ripete una sequenza di tool call perché la condizione di stop non arriva mai.
Guardrails
- cap retries e depth
- regola di convergenza (stop quando obiettivo è raggiunto)
- budget + alert per agent
Checklist
- stop runaway loops
- routing per step semplici
- tracciare cost per run
