Anthropic и OpenAI продолжают сражаться за нас. Продолжайте, нам нравится. chatgpt.. chatgpt. Claude.. chatgpt. Claude. claude code.. chatgpt. Claude. claude code. opus.. chatgpt. Claude. claude code. opus. Opus 4.6.. chatgpt. Claude. claude code. opus. Opus 4.6. vibecoding.. chatgpt. Claude. claude code. opus. Opus 4.6. vibecoding. Веб-разработка.. chatgpt. Claude. claude code. opus. Opus 4.6. vibecoding. Веб-разработка. искусственный интеллект.. chatgpt. Claude. claude code. opus. Opus 4.6. vibecoding. Веб-разработка. искусственный интеллект. Машинное обучение.

Компании выпустили новинки с разницей в несколько минут – Claude Opus 4.6 и GPT-5.3-Codex. Сейчас расскажу про Opus (он все же был первый, аж на несколько минут раньше вышел).

Инженеры, это правда?
Инженеры, это правда?

Главная фишка – это контекст 1M токенов. Влезет весь “Мастер и Маргарита” или крупный проект с твоей работы. Модель в тестах MRCR v2 набирает 76% на поиск информации в миллионе токенов – против 18,5% у Sonnet 4.5. Для сравнения: Gemini 3 Pro на такой дистанции скатывается до 26%, хотя у него тоже 1M в спеке.

Бенчмарки: Terminal Bench 2.0 – 65,4% (агентское кодирование в терминале), GDPval-AA – 1606 Elo против 1462 у GPT-5.2 (+144 пункта, то есть примерно 70% побед). Это тесты на “офисную работу”: юридические записки, финмодели, презентации. Humanity’s Last Exam – 53,1% с инструментами, ARC-AGI 2 – 68,8% (человеческий уровень абстрактного мышления). Впечатляет, но есть нюанс, в SWE-bench verified модель осталась на уровне 4.5, а это важный кодинговый бенчмарк.

Что говорят пользователи: в первые часы после релиза на Reddit полно постов в духе: “Opus 4.6 пережил лоботомию” и “Opus 4.6 раздражает”. Люди жалуются, что модель стала заметно хуже писать тексты и документацию, при этом кодить научилась лучше. Вот вам и классический трейдоф: для кода бери 4.6, для текстов оставайся на 4.5. Сам пока не заметил такого, но народ врать не будет.

В Claude Code запустили agent teams (бета) – система разворачивает несколько копий Opus, которые работают параллельно: один занимается фронтендом, другой бэком, третий планирует ваш стартап мечты.


Получается, что Opus 4.6 очень хорошо прокачали для агентских задач и длинного контекста, но если вам нужен универсальный помощник, который и код напишет, и статью, то пока это скорее два разных инструмента, тут мы еще не имеем чего-то универсального (придется еще чуть напрягать мозги, чтобы помнить, куда и что писать).

P.S. Интересная деталь: OpenAI впервые выпустила агентскую модель (GPT-5.3-Codex) раньше обычной GPT-5.3. Похоже, обе компании делают ставку на то, что будущее – это агенты (а то мы не знали), а не чат-ботами.

Надеюсь тебе понравилось. Лучшая благодарность – это твоя подписка на мой Telegram-канал 😊

Автор: ab429

Источник

Rambler's Top100