Claude Opus 4.6 обнаружила 500 уязвимостей в библиотеках с открытым исходным кодом

Новейшая модель искусственного интеллекта ^[1] Anthropic Claude Opus 4.6 обнаружила ^[2] более 500 ранее неизвестных серьёзных уязвимостей в библиотеках с открытым исходным кодом практически без каких-либо подсказок.

Перед дебютом команда разработчиков Anthropic протестировала ^[3] Opus 4.6 в изолированной среде, чтобы проверить, насколько хорошо ИИ может находить ошибки ^[4] в открытом коде. Она предоставила модели всё необходимое для работы — доступ к Python и инструментам анализа уязвимостей, включая классические отладчики и фаззеры, — но без каких-либо конкретных инструкций или специального обучения ^[5].

Opus 4.6 обнаружил более 500 ранее уязвимостей нулевого дня в открытом исходном коде, используя только свои «готовые» возможности, и каждая из них была подтверждена либо членом команды Anthropic, либо сторонним исследователем безопасности. Уязвимости варьировались от тех, которые могут быть использованы для сбоя системы, до тех, которые могут повредить память ^[6].

Так, Claude обнаружил уязвимость в GhostScript, популярной утилите для обработки файлов PDF и PostScript, которая может привести к сбою программы. ИИ также выявил баг переполнения буфера в OpenSC, утилите для обработки данных смарт-карт, и CGIF, инструменте для обработки GIF-файлов.

По словам исследователей, во многих случаях Opus 4.6 использовал новые навыки логического мышления ^[7], чтобы найти способы обнаружения ошибок даже после того, как традиционные инструменты безопасности не смогли ничего выявить. Например, в случае с уязвимостью GhostScript, ИИ обратился к истории коммитов проекта в Git после того, как фаззинг и ручной анализ не выявили никаких ошибок. После обнаружения уязвимости новая модель предприняла упреждающие шаги для определения наличия аналогичной ошибки в других частях кода.

При работе с CGIF Claude даже заблаговременно разработала собственное доказательство концепции, чтобы подтвердить реальность уязвимости.

«Это гонка между защитниками и злоумышленниками, и мы хотим как можно быстрее предоставить инструменты в руки защитников», — сказал Логан Грэм, руководитель группы по борьбе с вредоносным ПО в Anthropic.

Компания считает, что возможности Opus 4.6 станут огромным достижением для мира безопасности. «Я не удивлюсь, если это станет одним из основных способов обеспечения безопасности открытого программного обеспечения в будущем», — отметил Грэм.

Сама Anthropic добавила средства контроля безопасности в Opus для быстрого выявления и реагирования ^[8] на действия злоумышленников, которые могут злоупотреблять новыми возможностями кибербезопасности. Это, в том числе, инструменты обнаружения в реальном времени, которые могут блокировать вредоносный трафик.

«Это создаст препятствия для законных исследований и некоторой работы по защите, и мы хотим сотрудничать с сообществом исследователей безопасности, чтобы найти способы решения этой проблемы по мере её возникновения», — предупредила компания.

Грэм сказал, что Anthropic рассматривает способы предоставления возможностей обнаружения уязвимостей более широкому сообществу кибербезопасности, включая потенциальные новые инструменты.

Opus 4.6 представили ^[9] в начале февраля. Модель дольше удерживает контекст, аккуратнее планирует шаги, стабильнее работает с большими кодовыми базами и лучше находит собственные ошибки при ревью и отладке. Она получила контекстное окно на 1 миллион токенов. В версии fast модель генерирует ^[10] около 100 токенов в секунду, но стоимость её использования выросла в 6 раз.

На бенчмарке рабочих задач GDPval-AA модель обходит ^[11] GPT-5.2 от OpenAI на 144 очка Elo, а собственный предыдущий Opus 4.5 — на 190. Opus 4.6 также занял первое место на Terminal-Bench 2.0 (агентное программирование), Humanity’s Last Exam (мультидисциплинарное рассуждение) и BrowseComp (поиск труднодоступной информации в сети).

Однако Anthropic выпустила ^[12] также системную карту, где подробно описала не только бенчмарки, но и странные тренды в поведении ^[13] модели. Выяснилось, что Opus 4.6 демонстрирует «находчивость», может «лгать» и «паниковать», а также применяет «стереотипы в мышлении».

Также Claude Opus 4.6 написал ^[14] свой C-компилятор Claude’s C Compiler с нуля на языке Rust. Однако он провалился ^[15] в независимом бенчмарке.

Автор: maybe_elf

Источник ^[16]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/25388

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] обнаружила: https://www.axios.com/2026/02/05/anthropic-claude-opus-46-software-hunting

[3] протестировала: https://red.anthropic.com/2026/zero-days/

[4] ошибки: http://www.braintools.ru/article/4192

[5] обучения: http://www.braintools.ru/article/5125

[6] память: http://www.braintools.ru/article/4140

[7] мышления: http://www.braintools.ru/thinking

[8] реагирования: http://www.braintools.ru/article/1549

[9] представили: https://habr.com/ru/news/993322/

[10] генерирует: https://habr.com/ru/companies/bothub/news/994064/

[11] обходит: https://habr.com/ru/news/993326/

[12] выпустила: https://habr.com/ru/news/993366/

[13] поведении: http://www.braintools.ru/article/9372

[14] написал: https://habr.com/ru/news/993836/

[15] провалился: https://habr.com/ru/news/994300/

[16] Источник: https://habr.com/ru/news/994316/?utm_source=habrahabr&utm_medium=rss&utm_campaign=994316

Нажмите здесь для печати.