- BrainTools - https://www.braintools.ru -
12 июня компания Anthropic сообщила [1], что правительство США временно запретило доступ к моделям Fable 5 и Mythos 5 пользователям из других стран как за пределами США, так и внутри страны, включая иностранных сотрудников самой Anthropic.
Компания утверждает, что доступ к остальным моделям Anthropic это решение не касается. Однако сам факт принудительного отключения доступа к двум передовым моделям снова поднял главный вопрос последних месяцев: насколько быстро развиваются ИИ-системы и готовы ли бизнес, регуляторы и разработчики к рискам, которые появляются вместе с такими возможностями.
Особенно много внимания [2] привлекла Mythos 5 — модель, вокруг которой ещё до этого шли дискуссии из-за её потенциального влияния на кибербезопасность. Разбираемся, что известно о Mythos, почему власти США вмешались в доступ к модели и что эта история значит для российского рынка.
Mythos 5 — это ИИ-модель Anthropic, на которой могут работать чат-боты, ассистенты и другие AI-инструменты. В отличие от обычных пользовательских моделей, Mythos обсуждают прежде всего в контексте кибербезопасности.
По заявлениям Anthropic [3], Mythos может находить неизвестные ранее уязвимости в IT-системах, в том числе в ОС, браузерах и другой инфраструктуре. Речь идёт о об уязвимостях zero-day, или уязвимостях нулевого дня, о которых разработчики и владельцы систем ещё не знают, а значит, у них не было времени выпустить исправление.
В теории такие уязвимые места могут использоваться двумя способами. С одной стороны, они помогают быстрее находить проблемы, анализировать код, проверять конфигурации и закрывать уязвимости до атаки. С другой — если подобный инструмент окажется в руках злоумышленников, он может ускорить поиск слабых мест и снизить порог входа для атак.
Именно из-за этого Anthropic ранее решила не выпускать Mythos в широкий публичный доступ. При этом отдельные технологические компании и банки получили возможность протестировать модель, чтобы оценить риски для своих систем, клиентов и процессов киберзащиты.
До 12 июня обсуждение модели Mythos в основном строилось вокруг её технических возможностей: насколько хорошо модель ищет уязвимости, может ли она помогать в эксплуатации слабых мест и насколько эти риски отличаются от возможностей уже существующих моделей.
Теперь ситуация перешла на другой уровень. Правительство США выпустило директиву, по которой Anthropic должна приостановить доступ к моделям Fable 5 и Mythos 5. В результате компания отключает доступ к этим моделям для всех клиентов, чтобы выполнить требование регулятора.
В статье компании говорится, что в документе не было подробного технического объяснения угрозы. Anthropic понимает позицию властей так: правительство считает, что стало известно о способе обхода защитных механизмов Fable 5, то есть о jailbreak-технике, или о технике взлома.
Jailbreak (взлом) в контексте ИИ — это способ заставить модель обойти встроенные в неё ограничения и выдать ответ, который она должна блокировать. В случае с передовыми моделями такие обходы особенно чувствительны, потому что они могут открывать доступ к опасным возможностям. Например, к инструкциям по кибератакам, эксплуатации уязвимостей или другим вредоносным сценариям.
Однако Anthropic не согласна с тем, что описанный случай должен был привести к фактическому отзыву коммерческой модели. По словам компании, речь идёт не об универсальном способе взлома, который массово снимает ограничения и открывает широкий набор кибервозможностей, а об узконаправленном сценарии. В их изложении он сводится к просьбе модели прочитать конкретную кодовую базу и исправить найденные в ней ошибки [4].
Anthropic утверждает, что продемонстрированные в этом сценарии возможности уже доступны в других публичных моделях и ежедневно используются специалистами по защите систем.
История с Mythos 5 важна не только из-за самой модели. Эта ситуация показывает, что ИИ в кибербезопасности выходит из плоскости технологических экспериментов в зону регулирования, экспортного контроля и национальной безопасности.
Раньше подобные дискуссии чаще велись в формате экспертных предупреждений: модели становятся сильнее, могут помогать искать уязвимости, автоматизировать атаки и ускорять работу злоумышленников. Теперь мы видим ситуацию, где государство напрямую вмешивается в доступ к конкретным ИИ-моделям.
Это меняет контекст для всего рынка. Если раньше вопрос звучал как «насколько опасны такие модели», то теперь он звучит шире: «кто должен решать, какие модели можно выпускать, по каким критериям ограничивать доступ и как отличать реальную угрозу от возможностей, которые уже стали индустриальным стандартом».
Anthropic в своём заявлении как раз настаивает на этом различии. Компания признаёт, что идеальной защиты от взлома сейчас, вероятно, не существует ни у одного поставщика моделей. Anthropic считает, что ограничения должны вводиться в рамках прозрачной и технически обоснованной процедуры, а не на основании узконаправленного сценария, который не даёт модели уникального преимущества по сравнению с уже доступными инструментами.
Anthropic утверждает, что перед запуском Fable 5 провела масштабное тестирование защитных механизмов. В нём участвовали внутренние команды, сторонние организации, представители правительства США и британский AI Security Institute. По словам компании, суммарно на тестирование ушли тысячи часов.
Цель таких проверок — найти способы, которыми модель можно заставить нарушить правила безопасности. Это стандартная практика для крупных ИИ-моделей, особенно если они потенциально могут помогать в решении киберзадач.
Anthropic заявляет, что тесты не выявили универсального метода, который позволял бы широко обходить ограничения модели и открывать доступ к большому набору опасных кибервозможностей. При этом компания признаёт, что неуниверсальные обходы возможны у всех современных моделей. Они могут срабатывать в отдельных сценариях, но не дают полного контроля над поведением [5] системы.
Anthropic выбрала стратегию многоуровневой защиты. Идея в том, чтобы не полагаться на один механизм безопасности, а сочетать несколько уровней: встроенные ограничения модели, мониторинг, анализ пользовательских запросов, хранение данных для расследования инцидентов и быстрое закрытие обнаруженных обходов.
Для Fable компания ввела 30-дневное хранение пользовательских данных. Это непопулярная для части клиентов мера, но Anthropic объясняет её необходимостью исследовать и оперативно устранять сценарии взлома.
Британский AI Security Institute — один из ведущих центров, занимающихся оценкой безопасности ИИ-систем — изучал Mythos Preview. По его выводам, модель стала заметным шагом вперёд по потенциальному влиянию на кибербезопасность.
Среди тревожных признаков эксперты отмечали способность выполнять многошаговые сценарии и находить уязвимости без подробных инструкций со стороны человека. В одном из тестов Mythos Preview работала в 32-шаговой симуляции корпоративной кибератаки The Last Ones: модель прошла сценарий полностью в 3 из 10 попыток, а в среднем выполняла 22 из 32 шагов.
Это не означает, что модель способна взломать любую защищённую систему. Тем не менее такой результат показывает, что ИИ всё ближе подходит к задачам, которые раньше требовали высокой квалификации, времени и ручной работы специалистов.
Часть экспертов считает, что модель Mythos — скорее эволюционный шаг, чем революция. Некоторые уязвимости, о которых говорила Anthropic, могли находить и более дешёвые модели. Кроме того, найти уязвимость и успешно её эксплуатировать — это не одно и то же. Для реальной атаки нужны контекст, доступ, инфраструктура и цепочка действий.
Важно и то, что большинство успешных взломов до сих пор происходят не из-за сложных zero-day уязвимостей, а из-за давно известных проблем: слабой аутентификации, неустановленных обновлений, ошибок конфигурации и уязвимостей, патчи для которых уже давно существуют.
Банки, финтех, платёжные сервисы, телеком, промышленность и госсектор особенно чувствительны к таким технологиям. Для них кибератака — это не только утечка данных или простой отдельного сервиса. В худшем случае сбой может затронуть платежи, переводы, онлайн-банкинг, банкоматы, зарплаты, расчёты между компаниями и доверие клиентов.
Именно поэтому доступ к Mythos ранее получили отдельные крупные компании и банки. Им нужно было понять, как такая модель может использоваться в защите, какие риски она создаёт и насколько быстро подобные инструменты могут изменить ландшафт угроз.
История с директивой США усиливает эту тревогу. Даже если Anthropic права и конкретный взлом был узконаправленным, то сама реакция [6] правительства показывает следующее: передовые модели начинают рассматриваться как инфраструктурный и геополитический фактор. Они становятся не просто продуктом, а технологией, доступ к которой может ограничиваться по соображениям национальной безопасности.
Для России история с Mythos 5 важна не только как новость о зарубежной ИИ-модели. Она показывает несколько тенденций, которые напрямую касаются российских организаций.
1. Автоматизация поиска уязвимостей становится всё более доступной.
Даже если самые мощные модели ограничены, то похожие возможности постепенно появляются у других решений. Это значит, что слабые места в инфраструктурах будут находиться быстрее.
2. Устаревшие системы становятся ещё более рискованными.
Legacy-инфраструктура, неподдерживаемые версии ПО, старые библиотеки, неописанные зависимости и нерегулярные обновления могут быстрее попадать в поле зрения [7] автоматизированных инструментов.
3. Растёт значение доверенной цепочки поставки ПО.
Для организаций становится критически важно понимать, откуда взяты компоненты, кто их сопровождает, как выпускаются обновления, кто отвечает за исправление уязвимостей и можно ли подтвердить происхождение артефактов.
4. Подрядчики становятся частью периметра риска.
Если информационную систему для госорганизации, банка или промышленной компании разрабатывает внешний подрядчик, то безопасность его стека, процессов разработки и используемых компонентов напрямую влияет на заказчика.
5. Регуляторные требования будут всё сильнее пересекаться с практической инженерной безопасностью.
Формального соответствия требованиям становится недостаточно, если инфраструктура остаётся непрозрачной, плохо обновляемой и зависит от компонентов, происхождение и сопровождение которых сложно подтвердить.
На фоне новостей о Mythos легко сделать неправильный вывод: главная угроза теперь — это исключительно сверхмощные ИИ-модели, которые умеют находить zero-day уязвимости. На практике же всё сложнее.
Да, такие модели могут усилить кибератаки. В большинстве случаев злоумышленникам не нужны уникальные уязвимости, если в инфраструктуре уже есть известные и не закрытые проблемы. Необновлённые компоненты, слабые пароли, ошибки конфигурации, отсутствие контроля зависимостей и устаревший стек остаются более массовым и более практичным источником риска.
ИИ здесь работает, скорее, как катализатор. Модель не обязательно создаёт принципиально новую проблему, но делает старые проблемы заметнее и доступнее для эксплуатации. То, что раньше требовало ручного анализа, теперь может частично автоматизироваться.
Для российских компаний главный практический вывод остаётся прежним: нужно не ждать появления идеальной модели-атакующего, а закрывать базовые слабые места уже сейчас.
Mythos 5 — это не доказательство того, что ИИ уже завтра «взломает всё». Это важный сигнал, что модели становятся достаточно сложными, чтобы их обсуждали не только инженеры и исследователи, но и государственные органы, банки, регуляторы и службы национальной безопасности.
Новость от 12 июня усилила этот сигнал. Теперь вопрос не только в том, на что способны такие модели, но и в том, кто контролирует доступ к ним, по каким правилам вводятся ограничения и как бизнесу жить в мире, где ИИ-инструменты могут одновременно помогать защитникам и усиливать атакующих.
Для организаций это означает необходимость пересмотреть устаревшие компоненты, ускорить обновления, наладить контроль зависимостей, проверить процессы разработки и сопровождения ПО, а также заранее понять, кто отвечает за безопасность каждого элемента IT-стека.
В новой реальности уязвимость может быть найдена не только человеком, который неделями изучает систему, но и моделью, которая ускоряет анализ кода, конфигураций и цепочек атаки. И даже если конкретная модель будет ограничена регулятором, сам тренд уже не исчезнет.
Автор: alexbik
Источник [8]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/32032
URLs in this post:
[1] 12 июня компания Anthropic сообщила: https://www.anthropic.com/news/fable-mythos-access
[2] внимания: http://www.braintools.ru/article/7595
[3] По заявлениям Anthropic: https://www.theguardian.com/technology/2026/apr/22/what-is-anthropic-mythos-ai-threat-global-cybersecurity
[4] ошибки: http://www.braintools.ru/article/4192
[5] поведением: http://www.braintools.ru/article/9372
[6] реакция: http://www.braintools.ru/article/1549
[7] поле зрения: http://www.braintools.ru/article/9711
[8] Источник: https://habr.com/ru/companies/axiomjdk/articles/1049202/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1049202
Нажмите здесь для печати.