- BrainTools - https://www.braintools.ru -
GPT-5.1-Codex-Max в прошлый раз [1] сделал ставку на масштаб: компакция контекста и агентные циклы длиной в сутки. GPT-5.2-Codex развивает ту же идею, но делает её более надёжной и прикладной для реальных продакшн-сценариев.
Если 5.1-Codex-Max показывал максимум на SWE-Bench и SWE-Lancer, то 5.2-Codex подтверждает прогресс уже на agent-ориентированных бенчмарках:
SWE-Bench Pro: 56.4% (против 55.6% у GPT-5.2)
Terminal-Bench 2.0: 64.0%, уверенное лидерство [2] в реальных CLI-задачах

Ключевое отличие — эволюция [3] компакции. Если раньше она позволяла «просто не терять контекст», то теперь модель лучше удерживает план, корректирует стратегию после неудач и реже скатывается в повторные попытки. Это особенно заметно на больших рефакторингах и миграциях, где Codex теперь дольше работает автономно.
Вторая крупная ось апдейта — defensive cybersecurity. В отличие от 5.1-Codex-Max, GPT-5.2-Codex целенаправленно прокачан под security-workflow: анализ attack surface, воспроизведение уязвимостей, fuzzing и валидацию багов. На профессиональных CTF-оценках это уже третий подряд скачок качества для линейки Codex.

Показательный кейс — поиск уязвимостей в React Server Components: при работе над известным CVE модель помогла выявить несколько новых багов, которые прошли responsible disclosure и были закрыты апстримом. По сути, Codex здесь выступает как ускоритель полноценного security-ресёрча, а не вспомогательный тул.


Друзья! Эту новость подготовила команда ТГК «AI for Devs [4]» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь [4], чтобы быть в курсе и ничего не упустить!
Автор: python_leader
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/23383
URLs in this post:
[1] в прошлый раз: https://habr.com/ru/news/968164/
[2] лидерство: http://www.braintools.ru/article/1165
[3] эволюция: http://www.braintools.ru/article/7702
[4] AI for Devs: https://t.me/+jl6bJWSS8h4wNWEy
[5] Источник: https://habr.com/ru/news/978286/?utm_source=habrahabr&utm_medium=rss&utm_campaign=978286
Нажмите здесь для печати.