Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos. ai.. ai. Claude.. ai. Claude. Блог компании BotHub.. ai. Claude. Блог компании BotHub. Будущее здесь.. ai. Claude. Блог компании BotHub. Будущее здесь. ИИ.. ai. Claude. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. ai. Claude. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение.. ai. Claude. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение.. ai. Claude. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное.. ai. Claude. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное. нейросети.

Опасный ИИ? Маркетинговый трюк? Или своеобразная «крыша»?

Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos - 1

Чуть больше недели назад Anthropic представила миру свою модель Claude Mythos — и, надо сказать, у публики на этом месте буквально сорвало крышу. И понять почему нетрудно.
Mythos — это, по сути, кибербезопасностный бот: он умеет просматривать код, находить уязвимости и даже подбирать к ним эксплойты. Всего за несколько недель, как утверждают в Anthropic, Mythos обнаружил тысячи zero-day-уязвимостей во всех основных операционных системах и браузерах.

Разумеется, в самой Anthropic настолько обеспокоены последствиями возможного публичного доступа к такой модели — а также тем, что другие компании могут создать не менее опасные системы, — что пока запускают её лишь в формате preview-доступа: для исследователей, государственных структур и крупнейших разработчиков ПО, чтобы те успели подготовиться к надвигающейся волне кибератак, которую, по их словам, спровоцируют такие модели.

Но, будем откровенны, как и многие AI-бро, Anthropic давно заслужила репутацию компании, в которой маркетингового тумана зачастую больше, чем реальных шагов. Так что стоит спросить прямо: перед нами действительно та самая ИИ-армада, о которой нас предупреждали? Или это просто очередной рекламный спектакль?


Почему здесь стоит быть скептиками

Надо признать: момент, в который состоялся запуск Mythos, выглядит настолько удачно-случайным, что невольно вызывает серьёзные подозрения.

Всего несколько недель назад главный продукт компании — Claude Code — публично полоскали на всех углах. Директор AMD раскритиковал этот кодовый ассистент за то, что тот поглупел и обленился: он уже не справляется с задачами, в которых раньше чувствовал себя уверенно. Это можно объяснить и недавней внутренней запиской OpenAI, где говорится, что Anthropic упёрлась в нехватку вычислительных ресурсов, и сообщениями о том, что Claude регулярно переживает сбои, бьющие по качеству сервиса. Проще говоря, возможно, что Anthropic действительно пришлось «упростить» Claude, чтобы выдержать наплыв бывших пользователей OpenAI.

А потом случилось ещё и вот что: из-за того, что значительная часть обвязки Claude, по сути, была наскорую руку «навайб-кожена», исходный код утёк — и весь мир получил возможность заглянуть внутрь. Ирония, конечно, впечатляющая: компания, существование которой, по сути, невозможно без присвоения огромных массивов чужих защищённых авторским правом материалов — уступая в этом разве что OpenAI, — внезапно заявила, что утекший код является её интеллектуальной собственностью, и отправила порядка 8 000 жалоб по copyright, чтобы зачистить публикации.

С точки зрения этики, кибербезопасности и просто компетентности выглядит это, мягко говоря, не лучшим образом. Особенно если помнить, что к концу года компания собирается выходить на IPO.

И вот на этом фоне Anthropic вдруг заявляет, что создала невообразимо мощный ИИ, настолько опасный, что нам его нельзя даже толком попробовать — не говоря уже о том, чтобы независимо проверить заявленные возможности. Совпадение, конечно, удивительное.
Почти как если бы это был идеальный маркетинговый инструмент, чтобы утопить в шуме все проблемы и прессу, которая обрушилась на Anthropic за последний месяц.

Это, разумеется, не доказывает, что Mythos — исключительно липа. Но, по меньшей мере, говорит о том, что здесь необходима здоровая доза скепсиса.

И важно помнить: к скепсису призывают не только интернет-чудаки вроде меня. Сомнения в истории вокруг Mythos высказали влиятельные исследователи ИИ, отраслевые эксперты и даже инвесторы из Big Tech.

Нейробиолог и исследователь ИИ Гэри Маркус заявил, что риски Mythos раздуты, и добавил: «В некотором смысле у меня есть ощущение, что нас просто разыграли».
Янн Лекун, один из так называемых «крёстных отцов ИИ», вообще отмахнулся от Mythos, назвав всё это «чушью, порождённой самообманом», и отметил, что другие, более компактные модели уже умеют выполнять те же задачи.
Доктор Хайди Хлааф, главный научный сотрудник AI Now Institute, сказала, что заявление о Mythos построено на слишком расплывчатом языке и не содержит тех метрик, которые нужны для проверки заявлений Anthropic. Это заставило её усомниться, не было ли всё это задумано прежде всего для привлечения инвестиций — без излишнего контроля и неудобных вопросов.
Дэвид Сакс, возможно, один из самых одиозных представителей PayPal-мафии — а на мой взгляд, просто законченный кретин, но что куда важнее для нашего разговора, ещё и инвестор Big Tech, — заявил, что у Anthropic уже есть история использования «тактики запугивания» для разогрева хайпа, а значит, к их словам следует относиться с большой осторожностью.

Когда даже такие люди начинают предупреждать, что технологические заявления звучат чересчур раздутыми, это уже само по себе тревожный сигнал.

Иными словами, перед нами хор осведомлённых людей — с очень разными политическими и этическими взглядами, — которые в один голос говорят: с Mythos, возможно, всё не так, как кажется.

Нельзя не упомянуть и то, что независимый анализ эту точку зрения скорее поддержал. AISI — одна из организаций, получивших доступ к превью-версии Mythos и протестировавших её возможности. Да, они признали, что в части моделирования кибератак это шаг вперёд. Но одновременно подчеркнули: это не такой уж гигантский скачок, как пытается представить Anthropic.

И, наконец, в официальной истории Anthropic зияет одна особенно заметная дыра.

Если Mythos настолько выдающийся, почему его не использовали, чтобы предотвратить утечку Claude?
Казалось бы, если ваша компания вот-вот собирается стать чуть ли не главным экспертом по поиску уязвимостей в программном обеспечении, а впереди, как вам кажется, надвигается цунами ИИ-кибератак, то первое, что вы должны сделать, — это применить собственный кибербезопасностный ИИ, чтобы как следует залатать все дыры в своих же системах.

Странно выглядит ситуация, в которой у Anthropic якобы есть модель уровня Mythos — и одновременно происходит столь крупная утечка. Тут возможны разные объяснения:
либо Mythos не умеет того, что ей приписывают;
либо сам Claude настолько хаотично «навайб-кожен», что его баги и уязвимости почти невозможно нормально исправить;
либо Anthropic попросту не доверяет Mythos настолько, чтобы подпустить его к Claude, опасаясь, что тот всё окончательно сломает.

Какой бы ни была правда, эта несостыковка выглядит очень нехорошо.

Итак: скепсис необходим. Хорошо. Но какие именно вопросы следует задавать?


Вопросы, которые задаю себе я

Я не специалист по ИИ. Я всего лишь смертельно выгоревший аутичный мужик с доступом в интернет. Поэтому «правильного» ответа я вам не дам. Но могу, по крайней мере, перечислить вопросы, которые задаю сам, пытаясь понять, что здесь происходит. Возможно, они пригодятся и вам как отправная точка.

1. Насколько вообще «качественны» найденные уязвимости?

То, что Mythos заявляет о тысячах обнаруженных zero-day-уязвимостей, ещё не означает, что речь действительно идёт о взламываемых, эксплуатируемых рисках.
Например, Дэниел Стенберг, основатель и ведущий разработчик cURL, сказал The Register, что подобные инструменты нередко ошибочно помечают неэксплуатируемые баги как уязвимости, тем самым создавая для команд дополнительное давление и море информационного мусора.

Anthropic, конечно, утверждает, что Mythos Preview в 72,4% случаев умеет находить рабочие эксплойты. Но это вполне может оказаться просто рекламным блеском. В конце концов, само понятие «эксплуатируемости» — вещь подвижная.
Нам нужно убедиться, что Mythos не просто швыряет макароны в стену в надежде, что что-нибудь прилипнет, а действительно способна выявлять реальные риски в реальном коде.

Когда организации, уже получившие доступ к Mythos Preview, выйдут за пределы лабораторных бенчмарков — под которые ИИ, как известно, очень легко подгоняется, — и перейдут к полевому тестированию, тогда, вероятно, мы и получим ответ.

2. Насколько узкоспециализирована эта модель?

По целому ряду причин — например, из-за гипотезы Флориди и границы эффективности вычислений — создавать универсальные модели, которые были бы существенно лучше нынешних, становится всё труднее. Следовательно, Anthropic почти наверняка пришлось сильно сузить специализацию Mythos, превратив её из универсального чат-бота вроде Claude или ChatGPT в специализированный кибербезопасностный инструмент.

То, что Anthropic сейчас ограничена вычислительными ресурсами, — ещё один косвенный аргумент в пользу того, что Mythos, скорее всего, очень узкая модель.

И здесь возникает вопрос: насколько именно пришлось сузить её область применения, чтобы она стала эффективной в этой задаче?

Это важно по двум причинам.

Во-первых, сверхузкая модель банально хуже коммерциализируется: она умеет делать одну вещь и только одну.
Во-вторых, если Anthropic действительно пришлось столь радикально специализировать Mythos, значит, компания осознанно создала инструмент, потенциально способный открыть дорогу кибератакам в масштабах, которых мы прежде не видели.

А это уже плохо сочетается с образом «этической компании», который Anthropic так любит продвигать. Более того, это отличный пример того, почему этот рынок нуждается в регулировании. Если бы любая другая индустрия начала целенаправленно производить машины, способные обрушить цифровую инфраструктуру, на которой держится всё наше общество, её бы зарегулировали в пыль.

3. Сколько вообще стоит её запускать?

Если для нормальной работы Mythos нужны нечеловеческие объёмы вычислений и энергии, тогда эта модель не может быть тем массовым риском, о котором говорит Anthropic; не может быть по-настоящему жизнеспособным коммерческим продуктом; и, строго говоря, может оказаться даже шагом назад для всей ИИ-индустрии.

Мы уже знаем, что Mythos очень дорога в эксплуатации: в документации самой Anthropic прямо сказано, что она «очень дорога для нас в обслуживании и будет очень дорога для наших клиентов». Но насколько дорога?

У Anthropic недостаточно глубокие карманы, чтобы долго субсидировать такой инструмент. А учитывая, что инвесторы всё сильнее нервничают из-за возможного ИИ-пузыря, в ближайшее время вряд ли что-то изменится.
Кроме того, если модель чудовищно дорога в запуске, то при подсчёте стоимости одной найденной уязвимости в долларах она может оказаться попросту бесполезной для бизнеса.

Есть и ещё один момент: высокая цена автоматически ограничивает масштаб использования Mythos и удерживает сервис подальше от более зловредных пользователей.

И это, кстати, большая проблема всех современных ИИ-систем. Чтобы сделать их хотя бы немного лучше, чем сейчас, требуется больше вычислений, а значит — и экспоненциально больше затрат. В результате стоимость таких инструментов начинает выходить за пределы разумной полезности.

4. А как Anthropic вообще собирается устранять уязвимости, которые Mythos находит?

Одно дело — обнаружить уязвимость. Совсем другое — исправить её.

Тот же Дэниел Стенберг, которого я уже цитировал, сказал The Register, что инструменты наподобие Mythos, когда сообщают об уязвимостях, не предлагают решений.

Можно, конечно, предположить, что Anthropic просто объединит Mythos с Claude Code, и тот начнёт на ходу «вайб-чинить» найденные дыры. Но, увы, это вряд ли сработает.

ИИ-инструменты для программирования действительно неплохо генерируют небольшие фрагменты кода. Но при этом они ужасно понимают программы как целое и ещё хуже справляются с самостоятельной реализацией задач. В одной из предыдущих статей я разбирал исследование Университета Ватерлоо, показавшее, что даже лучшие генеративные ИИ-кодеры достигают лишь 75% точности на очень простых задачах программирования. Иными словами, даже базовый код, написанный ИИ, в каждом четвёртом случае просто не работает.

Я также анализировал исследование Veracode, где выяснилось, что 45% кода, сгенерированного ИИ, содержат уязвимости, а также работу Coderabbit, согласно которой в ИИ-коде на 70% больше багов, чем в коде, написанном человеком.

Так что нет, Claude Code, вероятнее всего, не сможет объединиться с Mythos и превратиться в полностью автоматическое решение для кибербезопасности «под ключ».

И это уже серьёзная проблема. По сути, получается, что Anthropic просто обманула нас? Если их заявления о Mythos хотя бы наполовину правдивы, а ИИ-кодинг не способен устранять найденные проблемы, то вся индустрия разработки ПО — и без того работающая на пределе — получит на шею экспоненциально растущий объём работы, потому что команды будут вынуждены в срочном порядке исправлять тысячи новых уязвимостей.

И это, прямо скажем, тоже не очень-то похоже на этичное поведение, правда, Anthropic?
Возможно, здесь предпочтительнее выглядело бы отраслевое регулирование. Но нет — вы ведь так отчаянно хотите быть «этичными» олигархами…

5. И наконец: в чём их длинная игра?

Все эти технобро уверены, что играют в четырёхмерные шахматы, хотя на деле перекатывают стеклянные шарики по столу. Их «гениальные стратегии» обычно не так уж сложно разглядеть насквозь. И это, кстати, не баг, а фича: именно такая прозрачность нередко позволяет им подавать сигналы потенциальным инвесторам.

Так чего же Anthropic в действительности хочет добиться с помощью Mythos? Какой сюжет она пытается исподволь навязать?

Мне кажется, здесь вполне может быть странная смесь рэкета под видом защиты и троянского коня. Объясню.

В то время как вся индустрия в целом — а особенно критически важный сектор open source — и без того работает на износ, Mythos, если верить заявлениям, начнёт буквально заваливать разработчиков отчётами, ставя команды под колоссальное давление. И что им тогда делать?

Ну, очевидно, им предложат обратиться к ИИ-инструментам для кодинга вроде Claude Code — тем более что с Mythos он, вероятно, будет работать лучше, чем сторонние решения, — чтобы ускорить выпуск патчей. Но, как мы уже знаем, эти инструменты сами плодят кучу багов, так что никакого настоящего решения тут нет.

Следовательно, отчёты от Mythos будут продолжать сыпаться, а Claude Code — переписывать всё больше и больше кода. И в какой-то момент, если этот цикл повторится достаточно много раз, значительная часть программного обеспечения окажется написанной ИИ — настолько, что человеку будет уже почти невозможно нормально переписать её вручную. А это фактически вынудит разработчиков пользоваться генеративными ИИ-инструментами, чтобы просто поддерживать свои продукты в рабочем состоянии.

Мне кажется, именно такой сюжет Anthropic и пытается продать: разработчики будут платить неприлично дорого за Mythos ради усиления своей кибербезопасности, но лавина отчётов одновременно подтолкнёт их к использованию генеративных ИИ-кодеров — и в итоге вся индустрия разработки программного обеспечения окажется глубоко зависимой от этих инструментов.

Теперь уточню: я не думаю, что именно так всё и произойдёт на практике. Как я уже говорил, ни Mythos, ни Claude Code пока недостаточно хороши, чтобы провернуть подобное. Но мы живём внутри ИИ-пузыря, а значит, реальность вторична. Важно не то, что есть на самом деле, а то, что инвесторы поверят, будто вы движетесь к монопольному господству.

И потому название Mythos кажется здесь особенно удачным. Похоже, оно продаёт не столько продукт, сколько миф о будущем доминировании ИИ — аккурат перед тем, как Anthropic выйдет на биржу.

Разумеется, всё это только гипотеза. Я не знаю наверняка, таковы ли намерения Anthropic. Я всего лишь пытаюсь читать между строк.


Итог

Пока Anthropic не выпустит Mythos в более широкий доступ, мы, скорее всего, не получим внятных ответов ни на один из этих вопросов — и так и не узнаем, что это: реальный прорыв или гигантский PR-трюк.

Пока что нам остаётся лишь жить с пониманием, что мы попросту не знаем, какая доля во всей этой истории приходится на маркетинговую чушь, а какая — на подлинный риск.

Но одно я знаю точно: в отношении Anthropic нам в любом случае стоит сохранять здоровый скепсис.

Автор: Spectrumm

Источник