- BrainTools - https://www.braintools.ru -
Новейшая модель искусственного интеллекта [1] Anthropic Claude Opus 4.6 обнаружила [2] более 500 ранее неизвестных серьёзных уязвимостей в библиотеках с открытым исходным кодом практически без каких-либо подсказок.

Перед дебютом команда разработчиков Anthropic протестировала [3] Opus 4.6 в изолированной среде, чтобы проверить, насколько хорошо ИИ может находить ошибки [4] в открытом коде. Она предоставила модели всё необходимое для работы — доступ к Python и инструментам анализа уязвимостей, включая классические отладчики и фаззеры, — но без каких-либо конкретных инструкций или специального обучения [5].
Opus 4.6 обнаружил более 500 ранее уязвимостей нулевого дня в открытом исходном коде, используя только свои «готовые» возможности, и каждая из них была подтверждена либо членом команды Anthropic, либо сторонним исследователем безопасности. Уязвимости варьировались от тех, которые могут быть использованы для сбоя системы, до тех, которые могут повредить память [6].
Так, Claude обнаружил уязвимость в GhostScript, популярной утилите для обработки файлов PDF и PostScript, которая может привести к сбою программы. ИИ также выявил баг переполнения буфера в OpenSC, утилите для обработки данных смарт-карт, и CGIF, инструменте для обработки GIF-файлов.
По словам исследователей, во многих случаях Opus 4.6 использовал новые навыки логического мышления [7], чтобы найти способы обнаружения ошибок даже после того, как традиционные инструменты безопасности не смогли ничего выявить. Например, в случае с уязвимостью GhostScript, ИИ обратился к истории коммитов проекта в Git после того, как фаззинг и ручной анализ не выявили никаких ошибок. После обнаружения уязвимости новая модель предприняла упреждающие шаги для определения наличия аналогичной ошибки в других частях кода.
При работе с CGIF Claude даже заблаговременно разработала собственное доказательство концепции, чтобы подтвердить реальность уязвимости.
«Это гонка между защитниками и злоумышленниками, и мы хотим как можно быстрее предоставить инструменты в руки защитников», — сказал Логан Грэм, руководитель группы по борьбе с вредоносным ПО в Anthropic.
Компания считает, что возможности Opus 4.6 станут огромным достижением для мира безопасности. «Я не удивлюсь, если это станет одним из основных способов обеспечения безопасности открытого программного обеспечения в будущем», — отметил Грэм.
Сама Anthropic добавила средства контроля безопасности в Opus для быстрого выявления и реагирования [8] на действия злоумышленников, которые могут злоупотреблять новыми возможностями кибербезопасности. Это, в том числе, инструменты обнаружения в реальном времени, которые могут блокировать вредоносный трафик.
«Это создаст препятствия для законных исследований и некоторой работы по защите, и мы хотим сотрудничать с сообществом исследователей безопасности, чтобы найти способы решения этой проблемы по мере её возникновения», — предупредила компания.
Грэм сказал, что Anthropic рассматривает способы предоставления возможностей обнаружения уязвимостей более широкому сообществу кибербезопасности, включая потенциальные новые инструменты.
Opus 4.6 представили [9] в начале февраля. Модель дольше удерживает контекст, аккуратнее планирует шаги, стабильнее работает с большими кодовыми базами и лучше находит собственные ошибки при ревью и отладке. Она получила контекстное окно на 1 миллион токенов. В версии fast модель генерирует [10] около 100 токенов в секунду, но стоимость её использования выросла в 6 раз.
На бенчмарке рабочих задач GDPval-AA модель обходит [11] GPT-5.2 от OpenAI на 144 очка Elo, а собственный предыдущий Opus 4.5 — на 190. Opus 4.6 также занял первое место на Terminal-Bench 2.0 (агентное программирование), Humanity’s Last Exam (мультидисциплинарное рассуждение) и BrowseComp (поиск труднодоступной информации в сети).
Однако Anthropic выпустила [12] также системную карту, где подробно описала не только бенчмарки, но и странные тренды в поведении [13] модели. Выяснилось, что Opus 4.6 демонстрирует «находчивость», может «лгать» и «паниковать», а также применяет «стереотипы в мышлении».
Также Claude Opus 4.6 написал [14] свой C-компилятор Claude’s C Compiler с нуля на языке Rust. Однако он провалился [15] в независимом бенчмарке.
Автор: maybe_elf
Источник [16]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/25388
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] обнаружила: https://www.axios.com/2026/02/05/anthropic-claude-opus-46-software-hunting
[3] протестировала: https://red.anthropic.com/2026/zero-days/
[4] ошибки: http://www.braintools.ru/article/4192
[5] обучения: http://www.braintools.ru/article/5125
[6] память: http://www.braintools.ru/article/4140
[7] мышления: http://www.braintools.ru/thinking
[8] реагирования: http://www.braintools.ru/article/1549
[9] представили: https://habr.com/ru/news/993322/
[10] генерирует: https://habr.com/ru/companies/bothub/news/994064/
[11] обходит: https://habr.com/ru/news/993326/
[12] выпустила: https://habr.com/ru/news/993366/
[13] поведении: http://www.braintools.ru/article/9372
[14] написал: https://habr.com/ru/news/993836/
[15] провалился: https://habr.com/ru/news/994300/
[16] Источник: https://habr.com/ru/news/994316/?utm_source=habrahabr&utm_medium=rss&utm_campaign=994316
Нажмите здесь для печати.