OpenAI: Kosten pro Token (praktisch)
Versteht OpenAI-Kosten und schätzt cost per token für input und output.
The problem
Die Verwirrung kommt von Einheiten/Token-Typen und der Verstärkung durch Retries.
Was „cost per token“ wirklich bedeutet
Pricing ist meist input/output getrennt. Eure Rechnung skaliert mit beidem.
Kostenaufteilung
- Input Tokens: Prompt + Tool-Kontext
- Output Tokens: Modellantwort
- Extra Calls: Retries und Tool-Ketten
Beispiel
Wenn ihr 10k Input und 3k Output pro Request nutzt, multipliziert mit den Raten und skaliert mit eurer Request-Menge.
Häufige Fehler
- Output Tokens ignorieren
- „Ein Call = eine Nutzeraktion“ annehmen
- Retries nicht einrechnen
Nächster Schritt
Mit Calculator-Seiten aus Token-Schätzungen Monatskosten ableiten.
