- BrainTools - https://www.braintools.ru -

Opus 4.7 — худший релиз в истории Anthropic?

Opus 4.7 — худший релиз в истории Anthropic? - 1

Сегодня Борис Черный выкатил тред о том, как выжать максимум из новой Opus 4.7 (там есть толковые мысли). Но вот о чем он забыл упомянуть: этот апдейт ломает всё, к чему вы привыкли.

Opus 4.7 — худший релиз в истории Anthropic? - 2

Anthropic выпустили миграционный гайд [1], который, конечно, никто не будет читать. А зря. Вот три изменения, которые перевернут ваш воркфлоу прямо сейчас:

  1. Параметр budget_tokens теперь выдает 400-ю ошибку [2].

  2. Новый токенизатор берет на 35% больше токенов за тот же текст.

  3. Токены размышлений (thinking tokens) теперь скрыты по умолчанию.

Давайте разберем этот бардак по пунктам.


1. Параметр budget_tokens сломан

Если в вашем коде прописано что-то вроде:
thinking={"type": "enabled", "budget_tokens": 32000}
…то на Opus 4.7 вы получите ошибку 400 Bad Request. Без предупреждений, без пометки «устарело» (deprecated). Просто ошибка.

Для тех, кто использует Opus в промышленных масштабах, это катастрофа. Вы больше не можете жестко ограничить бюджет на «размышления», чтобы контролировать расходы.

Взамен нам впаривают вот это:
thinking={"type": "adaptive"}
output_config={"effort": "xhigh"}

Уровни усилия (effort): lowmediumhighxhigh (новый), max.

По умолчанию в Opus 4.7 адаптивное мышление [3] выключено. Модель будет шпарить без глубоких раздумий. Будьте очень осторожны при переименовании модели с 4.6 на 4.7 в своем конфиге — по дефолту она станет работать намного хуже.


2. Токенизатор теперь ест больше

Цена за токен та же, контекстное окно в 1 млн токенов то же (нет, его не увеличили). Но есть подвох.

Новый токенизатор использует в 1.35 раза больше токенов для одного и того же текста.

Плюс куча жалоб на то, что модель стала быстрее «забывать» начало диалога (context rot). То есть фактически цена выросла, а профита для нас — ноль. Не ведитесь на их внутренние бенчмарки серии «мамой клянусь».

Opus 4.7 — худший релиз в истории Anthropic? - 3
Opus 4.7 — худший релиз в истории Anthropic? - 4

Что это значит для вас:

  • Все ваши хардкод-лимиты контекста теперь неверны.

  • Любая оценка токенов на стороне клиента (client-side estimation) теперь врет.

  • Ваш счет за API вырастет при тех же самых промптах.

3. Токены размышлений всё еще спрятаны

Это самая подлая часть.
В Opus 4.6 блоки размышлений по умолчанию отображались как «краткое содержание» (summarised).
В Opus 4.7 дефолт — «пропущено» (omitted).

Блоки thinking в ответе выглядят пустыми, но вы всё равно платите за них по полной программе.

Цитата Anthropic: «С вас всё равно списываются токены за размышления. Пропуск текста снижает задержку (latency), но не стоимость».

В вашем чеке будут токены, которые вы даже не можете увидеть.


Работа с длинным контекстом просто рухнула

На тестах MRCR v2 (понимание контекста в 1 млн токенов):

  • Opus 4.6: 78.3%

  • Opus 4.7: 32.2%

Opus 4.7 — худший релиз в истории Anthropic? - 5

Это провал на 46 пунктов в бенчмарке, который сама же Anthropic и опубликовала.

Opus 4.7 — худший релиз в истории Anthropic? - 6

Борис Черный пытается это оправдать, но разработчики в X (бывший Twitter) уже подняли его на смех. Это не прогресс, это регрессия.

Opus 4.7 — худший релиз в истории Anthropic? - 7
Opus 4.7 — худший релиз в истории Anthropic? - 8

Что говорят разработчики «в полях»

Отзывы просто брутальные.

Opus 4.7 — худший релиз в истории Anthropic? - 9

Opus 4.7 галлюцинирует на ровном месте:

  • Придумывает себе несуществующих коллег (кто, черт возьми, такой Антон?!).

Opus 4.7 — худший релиз в истории Anthropic? - 10
  • Сознается, что выдает полную чушь.

Opus 4.7 — худший релиз в истории Anthropic? - 11
  • Просто игнорирует настройки предпочтений пользователя.

Opus 4.7 — худший релиз в истории Anthropic? - 12

Такое ощущение, что модель сама хочет закончить рабочий день пораньше и выдать хоть какой-то результат.


«Подачка» с лимитами

На фоне шквала критики Anthropic объявили о «постоянном увеличении лимитов запросов» (rate limits).

Opus 4.7 — худший релиз в истории Anthropic? - 13

Я настроен скептично. Конкретных цифр нет. Но даже если они подняли лимиты в 1.35 раза — это просто компенсирует тот факт, что новая модель тратит на 35% больше токенов. Радоваться тут нечему.


Что делать прямо сейчас?

Если у вас есть 5 минут:
Сделайте grep по коду на наличие budget_tokens. Замените это на effort: xhigh для задач по кодингу (в Claude Code тоже ставьте максимум).

Если у вас есть 15 минут:
Внимательно прочитайте релиз-ноты и гайд по миграции, иначе ваши счета за API в конце месяца вас очень неприятно удивят.

Автор: cognitronn

Источник [4]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29156

URLs in this post:

[1] гайд: https://platform.claude.com/docs/en/about-claude/models/migration-guide

[2] ошибку: http://www.braintools.ru/article/4192

[3] мышление: http://www.braintools.ru/thinking

[4] Источник: https://habr.com/ru/companies/bothub/articles/1026022/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1026022

www.BrainTools.ru

Rambler's Top100