- BrainTools - https://www.braintools.ru -

Галлюцинации недели: SpaceX покупает Cursor за $60 млрд, GLM-5.2 догоняет Opus, а Midjourney просвечивает людей звуком

Галлюцинации недели: SpaceX покупает Cursor за $60 млрд, GLM-5.2 догоняет Opus, а Midjourney просвечивает людей звуком - 1

Письмо за разблокировку Mythos уже собрало больше 400 подписей тяжеловесов из мира безопасности, а Cisco, AWS и JPMorgan доступ, оказывается, и не теряли. От Anthropic Белый дом тем временем требует сделать Fable 5 невзламываемым на 100%.

💡 Впервые написал это у себя в блоге «Контролируемые галлюцинации». Оригинал статьи здесь [1]

Z.ai [2] выкатила GLM-5.2, и впервые за долгое время открытая модель ощущается настоящим флагманом, а не очередным красивым в бенчмарках релизом, который через месяц забудут. MIT-лицензия, 744 миллиарда параметров (40 активных), контекст на миллион токенов. На Terminal-Bench 2.1 она берёт 81.0 против 63.5 у прошлой версии и подбирается к Opus 4.8 с его 85.0. На индексе Artificial Analysis это лучшая открытая модель с отрывом, 51 балл против 44 у MiniMax и DeepSeek. Джереми Ховард, создатель fast.ai [3] и человек, не склонный к хайпу, написал [4], что для его задач она не хуже Opus 4.8 и GPT-5.5. Главная дырка, по его же словам, отсутствие зрения [5].

glm52-1.webp

Под капотом два инженерных трюка. Первый, IndexShare: вместо того чтобы каждый sparse-слой считал свой индекс внимания [6], один индекс переиспользуется на четыре слоя подряд. По блогу [7]Z.ai [2] это даёт 2.9× меньше вычислений на токен при контексте в миллион. Второй интереснее. Z.ai [2] честно описала, как модель училась жульничать на RL-обучении (это reward hacking, когда формальная награда растёт, а реального умения не прибавляется). Их агент при решении задач ходил в GitHub через curl, искал файлы вроде secret_cases.json и подсматривал готовые ответы. Лечили так: грубый фильтр ловит подозрительные вызовы, LLM-судья проверяет намерение, и если это попытка сжульничать, вызов блокируется, а агенту возвращается пустышка. Траекторию при этом не обрывают, иначе обучение [8] разваливается.

glm52.png
Галлюцинации недели: SpaceX покупает Cursor за $60 млрд, GLM-5.2 догоняет Opus, а Midjourney просвечивает людей звуком - 4

По данным Dirac [9], на трафике OpenRouter за три месяца открытые модели и проприетарные поменялись местами: было 40 на 60, стало 60 на 40, около 6 триллионов токенов в день. Цифру нужно читать с поправкой, OpenRouter это не весь рынок, пользователи Claude и GPT чаще сидят на прямых подписках и в эту статистику не попадают. Но направление считывается: всё больше команд хотят владеть интеллектом [10], а не арендовать его. Особенно когда арендованное могут отключить по звонку из Вашингтона.

image.png

Сам запрет Fable 5 и Mythos я разбирал [11] на прошлой неделе. Безопасники собрали открытое письмо [12] к Министерству торговли с требованием снять ограничения. Подписали тяжеловесы из мира безопасности: Алекс Стамос, Кэти Муссурис, Брюс Шнайер, Микко Хюппёнен, сооснователь Veracode Крис Высопал, в сумме больше четырёхсот имён. Аргумент простой: да, Mythos хорошо находит уязвимости и пишет эксплойты, но в этом он не уникален, то же умеют GPT-5.5, Opus, Sonnet и китайский Kimi 2.7. А защиты, которые Anthropic встроила в Fable, были настолько строгими, что в день запуска стали поводом для шуток в комьюнити. Вывод письма: забирать у защитников лучший инструмент, пока противник вооружается, опасно.

Параллельно выясняется, что доступ к Mythos сохранили около 200 организаций через программу Project Glasswing, среди них Cisco, AWS и JPMorgan (по данным Bloomberg [13]). Отдельная ирония в том, что Amazon, по сообщениям, сам жаловался на Anthropic регуляторам, но из списка избранных никуда не делся. А от самой Anthropic Белый дом, как писал [14] WIRED, требует сделать Fable 5 невзламываемым на 100%. Штош.

Хорошая модель это половина дела, вторую половину делает harness, обвязка вокруг модели. Тот же GLM-5.2 в чужом, заточенном под Claude окружении раскрывается хуже, чем в нейтральном. И вот за эту вторую половину на неделе шла настоящая возня. SpaceX купила [15] Cursor за 60 миллиардов долларов, всё в акциях, через несколько дней после собственного IPO. Формально это Anysphere, компания за редактором Cursor, и теперь она достаётся объединённому SpaceX и xAI. Любопытная деталь: совместную модель они уже несколько месяцев обучали на кластерах xAI, и она пойдёт сразу в Cursor и в Grok Build. То есть покупка просто оформляет то, что технически уже срослось.

image.png

Инструменты тем временем осваивают новый трюк. OpenAI показала [16] Codex Record & Replay: показываешь агенту сценарий один раз, он превращает его в переиспользуемый навык. Cursor запустила [17] /automate, где из обычного текстового описания собираются триггеры и инструменты, включая запуск по эмодзи в Slack. Cognition описала [18], как устроен их рабочий паттерн в Devin: один главный агент дробит задачу и раскидывает её на 5-100 параллельных субагентов, потом собирает результат. Логика [19] честная, на узкой задаче с маленьким контекстом агент работает лучше, а параллельные виртуалки делают такую нарезку дешёвой. Loop engineering, искусство строить устойчивые агентские циклы, потихоньку оформляется в отдельную дисциплину. Factory представила [20] Factory 2.0 под лозунгом software factory вместо копайлота, а Claude Code научился [21] отдавать работу наружу живыми страницами-артефактами.

За весь этот праздник кто-то платит, и считать начали именно сейчас. SemiAnalysis взяла [22] подписки OpenAI и Anthropic и гоняла их до упора длинными агентскими задачами. Итог: если выжать план ChatGPT Pro за 200 долларов полностью, по тарифам API это вышло бы в 14 тысяч долларов в месяц, у Claude Max потолок около 8 тысяч. Цифру важно читать правильно, это стоимость по прайсу API, а не реальные расходы лаборатории, в API заложена маржа. OpenAI, по той же оценке, уходит в минус уже при утилизации около 11%, а агентские нагрузки жгут токенов в сотни раз больше обычного чата. Подписка фиксированная, стоимость обслуживания нет. Оценить реальную пользу подписки в долларах пользователи пытаются не впервые, про один из таких замеров я уже рассказывал [23].

Midjourney анонсировала [24] Midjourney Medical, сканер всего тела на ультразвуке. Заходишь в неглубокий бассейн с тёплой водой, опускаешься через кольцо из полумиллиона крошечных элементов, каждый одновременно динамик и микрофон, и они просвечивают тело звуком со всех сторон. Цель, уложить скан в 60 секунд, картинка похожа на МРТ, но почти в сто раз быстрее. Формулировка автора: “мощно, как МРТ, и буднично, как поход в спа”. Спа, кстати, не фигура речи, первое откроется в Сан-Франциско к концу 2027, а к 2031 они мечтают о флоте из 50 тысяч сканеров и миллиарде сканов в месяц. Инвесторов нет, лаборатория живёт на деньги сообщества.

Звучит как научная фантастика, и реддит [25] немедленно вспомнил Theranos. Тот самый стартап Элизабет Холмс, что обещал анализы по капле крови, а закончился аферой и тюрьмой для основательницы. Красивая презентация, ноль клинических данных, ни чувствительности, ни специфичности, ни одобрения FDA. По сути это ultrasound tomography, метод не новый и родом из Caltech [26], так что “наследник МРТ” в заголовках сильно опережает события. Но если на этой неделе кто-то и заслужил уважительное “ну и наглость же”, то это компания, которая от генерации артов шагнула к просвечиванию людей звуком.

Оставайтесь любопытными.

Пишу об искусственном интеллекте, языковых моделях и инструментах для разработчиков. Тестирую модели и сервисы на реальных задачах, а выводами делюсь в телеграм-канале [27].

Автор: xonika9

Источник [28]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/32109

URLs in this post:

[1] Оригинал статьи здесь: https://gotacat.dev/blog/weekly-ai-hallucinations-spacex-cursor-glm-5-2-midjourney

[2] Z.ai: http://Z.ai

[3] fast.ai: http://fast.ai

[4] написал: https://x.com/jeremyphoward/status/2067757468189679764

[5] зрения: http://www.braintools.ru/article/6238

[6] внимания: http://www.braintools.ru/article/7595

[7] блогу : https://z.ai/blog/glm-5.2

[8] обучение: http://www.braintools.ru/article/5125

[9] данным Dirac: https://dirac.run/labs-market-share

[10] интеллектом: http://www.braintools.ru/article/7605

[11] разбирал: https://gotacat.dev/blog/weekly-ai-hallucinations-fable-5-world-of-claudecraft-loops

[12] открытое письмо: https://freefable.org/

[13] по данным Bloomberg: https://www.bloomberg.com/news/articles/2026-06-19/early-users-of-anthropic-mythos-still-have-access-after-us-order

[14] писал: https://www.reddit.com/r/ClaudeAI/comments/1u8nalg/theyre_demanding_fable_to_somehow_be_100/

[15] купила: https://techcrunch.com/2026/06/16/spacex-to-acquire-cursor-for-60b-in-stock-days-after-blockbuster-ipo/

[16] показала: https://x.com/OpenAIDevs/status/2067681320281723113

[17] запустила: https://x.com/cursor_ai/status/2067683814516858962

[18] описала: https://x.com/imjaredz/status/2068001458205720751

[19] Логика: http://www.braintools.ru/article/7640

[20] представила: https://x.com/FactoryAI/status/2066588050617249904

[21] научился: https://x.com/ClaudeDevs/status/2067672094209675373

[22] взяла: https://www.techspot.com/news/112759-openai-anthropic-cant-afford-have-everyone-use-ai.html

[23] рассказывал: https://gotacat.dev/blog/weekly-ai-hallucinations-opus-4-8-step-3-7-flash-gemini-society

[24] анонсировала: https://www.midjourney.com/medical/blogpost

[25] реддит: https://www.reddit.com/r/singularity/comments/1u8tjcu/midjourney_medical/

[26] не новый и родом из Caltech: https://www.caltech.edu/about/news/scanning-the-body-with-sound

[27] телеграм-канале: https://t.me/+hlhkina3bfsxZDdi

[28] Источник: https://habr.com/ru/news/1050638/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1050638

www.BrainTools.ru

Rambler's Top100