Opus 4.7 — худший релиз в истории Anthropic?

Сегодня Борис Черный выкатил тред о том, как выжать максимум из новой Opus 4.7 (там есть толковые мысли). Но вот о чем он забыл упомянуть: этот апдейт ломает всё, к чему вы привыкли.

Opus 4.7 — худший релиз в истории Anthropic? - 2

Anthropic выпустили миграционный гайд ^[1], который, конечно, никто не будет читать. А зря. Вот три изменения, которые перевернут ваш воркфлоу прямо сейчас:

Параметр budget_tokens теперь выдает 400-ю ошибку ^[2].
Новый токенизатор берет на 35% больше токенов за тот же текст.
Токены размышлений (thinking tokens) теперь скрыты по умолчанию.

Давайте разберем этот бардак по пунктам.

1. Параметр budget_tokens сломан

Если в вашем коде прописано что-то вроде:
thinking={"type": "enabled", "budget_tokens": 32000}
…то на Opus 4.7 вы получите ошибку 400 Bad Request. Без предупреждений, без пометки «устарело» (deprecated). Просто ошибка.

Для тех, кто использует Opus в промышленных масштабах, это катастрофа. Вы больше не можете жестко ограничить бюджет на «размышления», чтобы контролировать расходы.

Взамен нам впаривают вот это:
thinking={"type": "adaptive"}
output_config={"effort": "xhigh"}

Уровни усилия (effort): low, medium, high, xhigh (новый), max.

По умолчанию в Opus 4.7 адаптивное мышление ^[3] выключено. Модель будет шпарить без глубоких раздумий. Будьте очень осторожны при переименовании модели с 4.6 на 4.7 в своем конфиге — по дефолту она станет работать намного хуже.

2. Токенизатор теперь ест больше

Цена за токен та же, контекстное окно в 1 млн токенов то же (нет, его не увеличили). Но есть подвох.

Новый токенизатор использует в 1.35 раза больше токенов для одного и того же текста.

Плюс куча жалоб на то, что модель стала быстрее «забывать» начало диалога (context rot). То есть фактически цена выросла, а профита для нас — ноль. Не ведитесь на их внутренние бенчмарки серии «мамой клянусь».

Opus 4.7 — худший релиз в истории Anthropic? - 3

Opus 4.7 — худший релиз в истории Anthropic? - 4

Что это значит для вас:

Все ваши хардкод-лимиты контекста теперь неверны.
Любая оценка токенов на стороне клиента (client-side estimation) теперь врет.
Ваш счет за API вырастет при тех же самых промптах.

3. Токены размышлений всё еще спрятаны

Это самая подлая часть.
В Opus 4.6 блоки размышлений по умолчанию отображались как «краткое содержание» (summarised).
В Opus 4.7 дефолт — «пропущено» (omitted).

Блоки thinking в ответе выглядят пустыми, но вы всё равно платите за них по полной программе.

Цитата Anthropic: «С вас всё равно списываются токены за размышления. Пропуск текста снижает задержку (latency), но не стоимость».

В вашем чеке будут токены, которые вы даже не можете увидеть.

Работа с длинным контекстом просто рухнула

На тестах MRCR v2 (понимание контекста в 1 млн токенов):

Opus 4.6: 78.3%
Opus 4.7: 32.2%

Opus 4.7 — худший релиз в истории Anthropic? - 5

Это провал на 46 пунктов в бенчмарке, который сама же Anthropic и опубликовала.

Opus 4.7 — худший релиз в истории Anthropic? - 6

Борис Черный пытается это оправдать, но разработчики в X (бывший Twitter) уже подняли его на смех. Это не прогресс, это регрессия.

Opus 4.7 — худший релиз в истории Anthropic? - 7

Opus 4.7 — худший релиз в истории Anthropic? - 8

Что говорят разработчики «в полях»

Отзывы просто брутальные.

Opus 4.7 — худший релиз в истории Anthropic? - 9

Opus 4.7 галлюцинирует на ровном месте:

Придумывает себе несуществующих коллег (кто, черт возьми, такой Антон?!).

Opus 4.7 — худший релиз в истории Anthropic? - 10

Сознается, что выдает полную чушь.

Opus 4.7 — худший релиз в истории Anthropic? - 11

Просто игнорирует настройки предпочтений пользователя.

Opus 4.7 — худший релиз в истории Anthropic? - 12

Такое ощущение, что модель сама хочет закончить рабочий день пораньше и выдать хоть какой-то результат.

«Подачка» с лимитами

На фоне шквала критики Anthropic объявили о «постоянном увеличении лимитов запросов» (rate limits).

Opus 4.7 — худший релиз в истории Anthropic? - 13

Я настроен скептично. Конкретных цифр нет. Но даже если они подняли лимиты в 1.35 раза — это просто компенсирует тот факт, что новая модель тратит на 35% больше токенов. Радоваться тут нечему.

Что делать прямо сейчас?

Если у вас есть 5 минут:
Сделайте grep по коду на наличие budget_tokens. Замените это на effort: xhigh для задач по кодингу (в Claude Code тоже ставьте максимум).

Если у вас есть 15 минут:
Внимательно прочитайте релиз-ноты и гайд по миграции, иначе ваши счета за API в конце месяца вас очень неприятно удивят.

Автор: cognitronn

Источник ^[4]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29156

URLs in this post:

[1] гайд: https://platform.claude.com/docs/en/about-claude/models/migration-guide

[2] ошибку: http://www.braintools.ru/article/4192

[3] мышление: http://www.braintools.ru/thinking

[4] Источник: https://habr.com/ru/companies/bothub/articles/1026022/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1026022

Нажмите здесь для печати.