output-токены.

Почему дорогая LLM дороже: экономика инференса, которую видно в твоём 5-часовом лимите

Это очень интересный длиннопост о том, что именно показывают 5-ти часовые и недельные лимиты в Claude / GPT / Gemini и что происходит под капотом

продолжить чтение