
Сегодня Борис Черный выкатил тред о том, как выжать максимум из новой Opus 4.7 (там есть толковые мысли). Но вот о чем он забыл упомянуть: этот апдейт ломает всё, к чему вы привыкли.

Anthropic выпустили миграционный гайд, который, конечно, никто не будет читать. А зря. Вот три изменения, которые перевернут ваш воркфлоу прямо сейчас:
-
Параметр
budget_tokensтеперь выдает 400-ю ошибку. -
Новый токенизатор берет на 35% больше токенов за тот же текст.
-
Токены размышлений (thinking tokens) теперь скрыты по умолчанию.
Давайте разберем этот бардак по пунктам.
1. Параметр budget_tokens сломан
Если в вашем коде прописано что-то вроде:thinking={"type": "enabled", "budget_tokens": 32000}
…то на Opus 4.7 вы получите ошибку 400 Bad Request. Без предупреждений, без пометки «устарело» (deprecated). Просто ошибка.
Для тех, кто использует Opus в промышленных масштабах, это катастрофа. Вы больше не можете жестко ограничить бюджет на «размышления», чтобы контролировать расходы.
Взамен нам впаривают вот это:thinking={"type": "adaptive"}output_config={"effort": "xhigh"}
Уровни усилия (effort): low, medium, high, xhigh (новый), max.
По умолчанию в Opus 4.7 адаптивное мышление выключено. Модель будет шпарить без глубоких раздумий. Будьте очень осторожны при переименовании модели с 4.6 на 4.7 в своем конфиге — по дефолту она станет работать намного хуже.
2. Токенизатор теперь ест больше
Цена за токен та же, контекстное окно в 1 млн токенов то же (нет, его не увеличили). Но есть подвох.
Новый токенизатор использует в 1.35 раза больше токенов для одного и того же текста.
Плюс куча жалоб на то, что модель стала быстрее «забывать» начало диалога (context rot). То есть фактически цена выросла, а профита для нас — ноль. Не ведитесь на их внутренние бенчмарки серии «мамой клянусь».


Что это значит для вас:
-
Все ваши хардкод-лимиты контекста теперь неверны.
-
Любая оценка токенов на стороне клиента (client-side estimation) теперь врет.
-
Ваш счет за API вырастет при тех же самых промптах.
3. Токены размышлений всё еще спрятаны
Это самая подлая часть.
В Opus 4.6 блоки размышлений по умолчанию отображались как «краткое содержание» (summarised).
В Opus 4.7 дефолт — «пропущено» (omitted).
Блоки thinking в ответе выглядят пустыми, но вы всё равно платите за них по полной программе.
Цитата Anthropic: «С вас всё равно списываются токены за размышления. Пропуск текста снижает задержку (latency), но не стоимость».
В вашем чеке будут токены, которые вы даже не можете увидеть.
Работа с длинным контекстом просто рухнула
На тестах MRCR v2 (понимание контекста в 1 млн токенов):
-
Opus 4.6: 78.3%
-
Opus 4.7: 32.2%

Это провал на 46 пунктов в бенчмарке, который сама же Anthropic и опубликовала.

Борис Черный пытается это оправдать, но разработчики в X (бывший Twitter) уже подняли его на смех. Это не прогресс, это регрессия.


Что говорят разработчики «в полях»
Отзывы просто брутальные.

Opus 4.7 галлюцинирует на ровном месте:
-
Придумывает себе несуществующих коллег (кто, черт возьми, такой Антон?!).

-
Сознается, что выдает полную чушь.

-
Просто игнорирует настройки предпочтений пользователя.

Такое ощущение, что модель сама хочет закончить рабочий день пораньше и выдать хоть какой-то результат.
«Подачка» с лимитами
На фоне шквала критики Anthropic объявили о «постоянном увеличении лимитов запросов» (rate limits).

Я настроен скептично. Конкретных цифр нет. Но даже если они подняли лимиты в 1.35 раза — это просто компенсирует тот факт, что новая модель тратит на 35% больше токенов. Радоваться тут нечему.
Что делать прямо сейчас?
Если у вас есть 5 минут:
Сделайте grep по коду на наличие budget_tokens. Замените это на effort: xhigh для задач по кодингу (в Claude Code тоже ставьте максимум).
Если у вас есть 15 минут:
Внимательно прочитайте релиз-ноты и гайд по миграции, иначе ваши счета за API в конце месяца вас очень неприятно удивят.
Автор: cognitronn


