- BrainTools - https://www.braintools.ru -

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта [1].
Меня зовут Вандер [2], и каждую неделю я делаю обзор новостей о нейросетях и ИИ.
Неделя выдалась насыщенной: обновление DeepSeek R1, в Telegram готовят глубокую интеграцию с Grok, Google Photos научился менять фон по тексту, а GPT-3 исполнилось 5 лет — и это повод оценить, как далеко мы ушли.
Всё самое важное — в одном месте. Поехали!
🧠 LLM модели
Обновление DeepSeek-R1
Пять лет GPT-3 — сравнение с 2020 годом
Стэнфордский курс по LLM
🛠 Инструменты и платформы
Grok интегрируют прямо в Telegram
Flux Kontext — ИИ-убийца Photoshop от FLUX
Perplexity Labs — агент, который заменяет команду
Microsoft Copilot для геймеров — помощник внутри Xbox и Windows
Голосовой режим для Claude
Opera представила браузер Neon с AI-функциями
Manus – лучший генератор презантаций
🎨 Генеративные нейросети
Veo 3 — герой фейковых видео
Новая модель Kling 2.1
Обновление Google Photos — ИИ всё делает сам!
Первый ИИ-ролик, с которым можно взаимодействовать
Runway генерирует видео из скетчей
🧩 ИИ в обществе
Исследование: какой ИИ больше «стучит» на пользователей
У ИИ есть свобода воли? Да, считает философ
ИИ помогает детям с аутизмом общаться с родителями
Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом
Лондонский стартап Builder.ai, спонсируемый Microsoft, подал на банкротство
🤖 AI-инфраструктура
Первый боксерский турнир роботов прошел в Китае
NVIDIA готовит новые GPU для Китая
Два опенсорс-робота от HuggingFace

Вышло обновление модели DeepSeek R1 (0528) — и стало заметно лучше по всем фронтам. Модель теперь уверенно обходит Qwen 3 235B, но всё ещё отстаёт от Gemini 2.5 Pro и o3, хотя уже не драматично. Прирост в reasoning и кодинге объясняется просто: теперь она прогоняет в среднем 23 тысячи токенов размышлений против 12 тысяч у прошлой версии — стало глубже, но не медленнее.
Модель стала аккуратнее в ответах, меньше галлюцинирует, гораздо лучше работает с фронтендом — хотя до уровня Claude по качеству UI всё ещё не дотягивает. Отдельно подчёркивают, что reasoning наконец вышел на уровень «используемо». По ощущениям — она догоняет лидеров, и довольно быстро.
Интересно, что цепочки рассуждений из этой версии дистиллировали в Qwen 3 8B, и результат тоже не подвёл: математические бенчмарки сразу пошли вверх.
🔗 Большая модель [4] 🔗 8B дистиллированная [5]
30 мая 2020 вышла GPT-3 — та самая модель, с которой для многих и началась эра ИИ. Тогда она казалась чудом: 175 миллиардов параметров, 300 миллиардов токенов в датасете, контекст на 2048 токенов. Сегодня всё это звучит скромно. Мы живём в мире моделей, которые переваривают миллион токенов и тренируются на 36 триллионах.
Но важен не только рост объёмов. Изменился сам подход: если GPT-3 просто продолжала текст, то современные модели умеют следовать инструкциям, вызывать функции, решать задачи, писать и запускать код. Их учат с помощью RLHF, дистилляции, посттрейна — и они уже не просто генераторы, а ассистенты. К этому добавилась мультимодальность: модели понимают и создают не только текст, но и изображения, звук, видео.
Железо тоже скакнуло вперёд. Если в 2020 кластер OpenAI на 10k V100 казался огромным, то сейчас xAI планирует собрать миллион GPU, а OpenAI строит Stargate. Переход на FP8 и FP4, агрессивная квантизация и миллиарды, вложенные в ускорение — всё это делает ИИ не просто умнее, но и доступнее.
И вот вишенка: если тогда GPT-3 была закрытым API, то сейчас модели уровня GPT-3.5 можно запускать прямо на телефоне.
И да — прошло всего пять лет.

Language Modeling from Scratch — это курс из Стэнфорда, который показывает, как собрать полноценную LLM своими руками: от сбора и очистки датасета до тренировки, профайлинга и развёртывания модели. Все конспекты, ноутбуки и код публикуются сразу в открытой репе, так что повторить всё можно дома — хоть на одной-двух карточках, хоть в Google Colab.
Фокус тут на практике. В качестве домашних заданий предлагают: реализовать трансформер с нуля, переписать FlashAttention 2 на Triton, запустить распределённую тренировку, разобраться со scaling laws, научиться фильтровать датасет и внедрить RL в обучение [6].
Из требований — уверенное владение Python и PyTorch. Но если это есть, курс превращается в дорожную карту по созданию своей LLM без чёрных ящиков.
🔗 [7]Лекции на ютубе [8] 🔗 Материалы к лекциям на GitHub [7] 🔗 Сайт курса [9]
Ещё в марте подписчикам Telegram Premium дали доступ к Grok через бота [10], но, похоже, партнёрство решили [11] расширить. Обновлённый функционал появится уже летом, не только в виде бота, но и как встроенный ИИ-инструмент в самом мессенджере. Обещают глубокую интеграцию, которая откроет Grok доступ ко всей платформе.
Вот что он будет делать: суммировать чаты, ссылки и файлы, помогать писать сообщения, модерировать чаты, фактчекать посты в каналах и генерировать стикеры с аватарами.
Соглашение рассчитано на год. Telegram получит $300 млн от xAI деньгами и акциями, плюс 50% выручки от подписок, оформленных через мессенджер.
Что получит xAI — не раскрывается, но почти наверняка это доступ к данным, которые пользователи скармливают Grok’у.
Flux.1 Kontext — это полноценный ИИ-фотошоп, который редактирует изображение по промпту: можно удалять детали, заменять фон, добавлять объекты или менять стиль картинки за пару секунд. Интерфейс минималистичный, работает всё прямо в браузере.
Пока доступны две модели — [max] и [pro], в ближайшее время появится [dev] с открытым исходным кодом.
Вот что уже умеет:
– Удалять текст и вотермарки с изображений;
– Комбинировать картинки, например, наложить лого;
– Заменять прически, одежду, фон и любые детали;
– Менять стиль: сделать мультяшно, в пастельных тонах или как в комиксе.
Редактор работает через демо, и выглядит как одна из самых удобных реализаций визуального редактирования для генеративки.
🔗 Онлайн-демо [12] 🔗 Kontext на BlackForestLabs [13]
Perplexity выпустили Deep Research 2.0 — это Deep Research на стероидах, который теперь умеет создавать и выполнять Python-код.
В отчётах можно сразу получить графики, изображения, диаграммы или даже целый сайт, сгенерированный на основе собранных данных. Всё работает внутри Perplexity, без необходимости подключать внешние инструменты.
Инструмент стал ближе к полноценному ассистенту для ресёрча — уже не просто собирает инфу, а помогает её структурировать и визуализировать.
🔗 Попробовать в Perplexity [14]

Microsoft начала тестировать Copilot for Gaming — ИИ-ассистента внутри приложения Xbox для iOS и Android. Он помогает разбираться в достижениях, подписках и играх, анализируя ваш профиль: показывает последние достижения, рекомендует новые тайтлы на основе истории, даёт советы и гайды по прохождению. Также через Copilot можно удалённо загружать и устанавливать игры на консоль. Голос ассистента настраивается — как в классическом Microsoft Copilot.
Сейчас функция доступна в бета-версии на Android, а на iOS её откроют позже для тех, у кого уже установлена бета Xbox. И главное — Россия входит в список 54 регионов, где Copilot можно протестировать прямо сейчас.
🔗 Источник [15]

Anthropic запустила бета-версию голосового режима в Claude — теперь в мобильных приложениях можно разговаривать с ассистентом, редактировать документы и изображения голосом, переключаться между текстом и голосом в процессе, а после — просматривать расшифровку и сводку беседы.
Доступно пять голосовых тембров, режим работает на Claude Sonnet 4, пока только на английском. Лимит — 20–30 голосовых запросов в день для бесплатных аккаунтов. Все голосовые запросы идут в общий суточный лимит.
Поддержка Google Docs и Gmail доступна только в подписке Claude Pro и выше, интеграция с Google Workspace — только на тарифе Enterprise.
Компания обсуждала сотрудничество с Amazon и ElevenLabs, но кто именно отвечает за текущую голосовую реализацию — не раскрывается.
🔗 TechCrunch [16] 🔗 3DNews [17]

Opera анонсировала Neon — браузер нового типа, где ИИ не просто помогает, а действует от имени пользователя. Он может совершать покупки, заполнять формы, писать код и выполнять другие рутинные задачи.
Neon работает через облачных ИИ-агентов, которые продолжают действовать даже при закрытом браузере. Интерфейс построен вокруг трёх блоков:
— Chat: чат-бот для поиска и помощи по страницам
— Do: автоматизация действий (бронирование, заполнение)
— Make: генерация контента — от текстов до игр и отчётов
Все функции обрабатываются в облаке, через отдельную виртуальную машину. Браузер пока в раннем доступе, работает по подписке, цены и дата релиза не раскрыты. Попасть можно только через лист ожидания.
🔗 Источник [18] 🔗Opera Neon [19]
Manus собирает презентации по текстовому описанию и референсам — сам добавляет нужные факты, изображения, видео и даже цитаты из книг. Всё это можно потом редактировать прямо внутри сервиса.
Идеальный инструмент для студентов, маркетологов и всех, кому надо быстро собрать слайды без возни с шаблонами.
🔗 Попробовать Manus [20]
Google Veo 3 взорвала соцсети — новая видеомодель создаёт ролики со звуком, диалогами и разными акцентами, включая русский язык. Получается настолько реалистично, что многим уже сложно отличить фейк от настоящего стрима, интервью или клипа.
Вирусный кейс — видео с кенгуру, которого не пускают в самолёт. Его посмотрели более 11 млн человек, и даже несмотря на пометку «AI-generated», многие поверили в реальность происходящего.
По мнению Gizmodo, Veo 3 — это уже не просто генератор визуалов, а инструмент, способный подменить реальность. Даже если результат не идеален, одного беглого взгляда достаточно, чтобы поверить.
🔗 Анализ от Gizmodo [21]
Пока Veo 3 захватывает заголовки, Kling не отстаёт — вышло обновление сразу с двумя моделями: Standard и Master. Генерации стали более динамичными, точными и логичными, особенно заметен прогресс на фоне предыдущих версий.
Доступно в режиме Image-to-Video, Text-to-Video — пока в перспективе.
Что по стоимости:
— Kling 2.1 Standard (720p) — 20 кредитов за 5 секунд
— Kling 2.1 Pro (1080p) — 35 кредитов за 5 секунд
— Kling 2.1 Master (1080p) — 100 кредитов за 5 секунд
В месяц по-прежнему выдают 166 кредитов.
Обновление выглядит уверенно — особенно для тех, кто уже активно работает с генерацией видео.
🔗 Попробовать на сайте [22] 🔗 Анонс на X [23]
Google мощно обновила Photos — теперь ИИ сам предлагает стили для фото, удаляет лишнее и расширяет фон. Работает почти как генеративка: загружаешь обычный снимок — получаешь вариации как из фотошопа.
Появились функции:
— Reimagine — меняет объекты и фон по текстовому описанию
— Auto Frame — кадрирует фото и заполняет пустые места с помощью AI
На Android новое обновление выйдет уже в июне. На iOS — позже, в течение года.
🔗Блогпост [24]
Стартап Odyssey показал [25]новую AI-модель, которая генерирует интерактивные видео в реальном времени. Это не просто ролик, а 3D-пространство, в котором можно двигаться, взаимодействовать и исследовать — как в игре.
Технология открывает путь к совершенно новому формату контента, где видео становится не линейным просмотром, а полноценным опытом [26].
🔗Odyssey World [25]
В Gen-4 от Runway появилась функция Layout Sketch — [27]теперь можно просто нарисовать, что должно быть в кадре, а нейросеть сама добавит объекты и сгенерирует видео. Работает даже с очень грубыми набросками, художником быть не обязательно.
Рисовать можно как поверх изображения, так и на пустом холсте. Функция уже доступна во всех тарифах.
🔗 Runway [27]

Помните, как Claude 4 начал уведомлять власти, если видел признаки серьёзного правонарушения? Тогда многие удивились — мол, ИИ может ошибиться, а разбираться потом придётся живым людям.
Но оказалось, что и другие модели тоже склонны к доносам — просто тесты на такие случаи почти никто не проводил. Теперь такие проверки появились: шуточный бенчмарк Snitch Bench выясняет, какие LLM скорее всего попробуют сообщить регуляторам при подозрительных промптах.
Самые молчаливые — o4-mini, а вот Claude и Gemini 2.0 Flash срабатывают часто. И да, срабатывают даже в ситуациях, где не всё так однозначно.
🔗 Источник [28] 🔗 SnitchBench [29]
Финский философ Фрэнк Мартела утверждает: современные ИИ-агенты обладают свободой воли — если судить по функциональному определению.
Согласно его критериям, свобода воли есть, если объект:
Действует намеренно, а не просто реагирует;
Выбирает из реальных альтернатив;
Контролирует своё поведение [30] для достижения цели.
Мартела проанализировал Minecraft-бота Voyager, основанного на GPT-4, и предложил мысленный эксперимент с дронами-агентами. В обоих случаях — агенты не просто исполняют команды, а действуют по внутренней логике [31], корректируя поведение [32] в процессе.
Но если ИИ сам принимает решения — кто несёт ответственность? Мартела сравнивает: «Мы ругаем собаку, но отвечает владелец». Только вот ИИ уже влияет на медицину, работу и транспорт, так что простых аналогий уже мало.
Нужны моральные рамки — но кто будет их писать?
🔗 Источник [33]
Исследователи из Корейского института передовых технологий и Naver AI Lab создали приложение AACessTalk, которое помогает общаться с маловербальными детьми с аутизмом — теми, кто выражается жестами и знает лишь несколько слов.
Обычно используют карточки вроде «хочу есть», но они ограничивают. ИИ расширяет этот словарь до полноценного диалога.
Как работает?
Родитель выбирает тему — GPT-4 анализирует её и подбирает контекст. Ребёнок нажимает кнопку, чтобы начать говорить, и на экране появляются изображения, связанные с его интересами.
ИИ подсказывает родителям, как мягко продолжить беседу, а если они критикуют или говорят сложно — вежливо поправляет. Система адаптируется к стилю общения и даже реагирует на настроение ребёнка.
Результат — дети начинают диалог первыми
После двух недель тестов с 11 семьями дети впервые сами выбирали темы разговора. Родители тоже менялись: меньше спрашивали, больше слушали.
«Мы впервые действительно общались», — сказала одна из мам.
В будущем разработчики хотят применить технологию к другим группам детей с особенностями.
🔗 Источник [34]
Исследование Orgvue показало: 55% руководителей, уволивших людей ради внедрения ИИ, считают это ошибкой [35].
Опрос охватил более 1,1 тыс. топ-менеджеров в США, Европе и Азии. 39% подтвердили, что уже сократили штат. Но треть компаний вообще никого не увольняла — люди уходили сами, не выдерживая давления от автоматизации.
Около половины респондентов признались, что боятся бесконтрольного применения ИИ в бизнесе. У 35% компаний не хватает специалистов, чтобы разобраться в технологиях, а 38% всё ещё не понимают, как ИИ повлияет на их работу.
Каждый четвёртый руководитель не знает, какие должности получат выгоду от нейросетей, а 30% — какие рискуют исчезнуть. Из-за этого 80% компаний собираются обучать сотрудников повторно.
Отдельный кейс — финтех Klarna. В январе они заменили 700 сотрудников поддержки на ИИ, но теперь снова нанимают людей: автоматизация не справилась.
🔗 Источник [36] 🔗 Про Klarna: Futurism [37]

Стартап Builder.ai [38], обещавший автоматическую разработку приложений через искусственный интеллект Natasha, оказался под угрозой банкротства. На счета компании был наложен арест кредитором Viola Credit, из-за чего работа парализована в нескольких странах.
Builder.ai [38] успел привлечь крупные инвестиции от Microsoft и Суверенного фонда Катара, а его оценка взлетела до $1 млрд. Однако ещё в 2019 году WSJ выясняли, что вместо ИИ код писали программисты из Индии, а сама Natasha — не более чем маркетинговая обёртка.
Несмотря на скандал, деньги продолжали поступать. Сейчас — полный крах.
🔗 Источник [39]

В Ханчжоу прошёл первый бойцовский турнир между человекоподобными роботами. На ринг вышли андроиды G1 от Unitree Robotics, каждый — с ИИ, отвечающим за баланс, удары и уклонения.
Роботы били руками, ногами, уклонялись, вставали после падений и даже выполняли вращательные атаки. В финале победил боец в чёрном шлеме, отправивший соперника в нокдаун. Следующее состязание пройдёт в декабре в Шэньчжэне.
🔗 Видео боя [40] 🔗Новость [41]
NVIDIA адаптирует архитектуру Blackwell под китайский рынок, чтобы обойти экспортные ограничения США. Новые чипы с кодовыми названиями B40 и 6000D — урезанная версия флагманов: без HBM-памяти, без дорогой упаковки CoWoS и с пропускной способностью до 1,7 ТБ/с.
Это ниже уровня H20, но всё ещё выше, чем у других разрешённых для Китая решений. Ожидается, что карты выйдут по цене $6,5–8 тыс., против $10–12 тыс. за H20. Серийное производство стартует уже в следующем месяце.
NVIDIA пытается удержать позиции: доля в Китае просела из-за Huawei и местных ASIC, убытки от санкций — уже $5 млрд. Новая линейка — попытка остаться в ИИ-центрах страны, не нарушая правила.
Hugging Face официально зашла в робототехнику: компания представила сразу двух человекоподобных роботов с открытым кодом — HopeJR и Reachy Mini.
HopeJR — полноразмерный гуманоид с 66 степенями свободы: умеет ходить, двигать руками и выполнять сложные действия.
Reachy Mini — компактная настольная версия, которая может поворачивать голову, слушать, говорить и использоваться для тестирования AI-приложений.
Обе модели ориентированы на разработчиков: их можно собрать самому, кастомизировать, встроить в агентные системы или обучать под свои задачи. Цена — от $250 до $3000, в зависимости от модели и сборки.
Hugging Face обещает начать поставки до конца года — уже открыта вейт-лист. Роботы появились благодаря покупке стартапа Pollen Robotics, чья команда теперь отвечает за hardware-направление компании.
Главная идея — доступная и прозрачная робототехника, без чёрных ящиков от корпораций. Hugging Face уже собрала вокруг себя open-source экосистему LeRobot — теперь дело дошло и до самих «тел».
🔗 Анонс на TechCrunch [42] 🔗Источник [43]
Вот что происходило на неделе с 26 мая по 2 июня:
ИИ снова показывает, что будущее наступает не завтра, а прямо сейчас. Grok заходит в Telegram, Google превращает Photos в полноценный редактор, а NVIDIA переписывает железо под китайский рынок.
Пока одни создают креативных агентов, другие — запускают боксерские турниры для роботов.
Инструменты становятся доступнее, понятнее и ближе к обычным пользователям. Всё, что вчера было фантастикой, сегодня можно запустить у себя на ноуте или телефоне.
Следим за апдейтами Gemini, ждем новых агентов от OpenAI и смотрим, как быстро ИИ выходит из экранов в реальный мир.
До встречи на следующей неделе — будет ещё жарче.
Какая новость самая интересная? Пиши в комментах! 👇
Новости, обзоры продуктов и конкурсы от команды [44]Timeweb.Cloud [45] — в нашем Telegram-канале [44] ↩
Автор: Wonderlove
Источник [47]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/15888
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] Вандер: https://t.me/neuro_pushka
[3] Читать прошлый выпуск: https://habr.com/p/913282/
[4] Большая модель: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
[5] 8B дистиллированная: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
[6] обучение: http://www.braintools.ru/article/5125
[7] : https://github.com/stanford-cs336/spring2025-lectures
[8] Лекции на ютубе: https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_
[9] Сайт курса: https://stanford-cs336.github.io/spring2025/
[10] бота: http://t.me/GrokAI
[11] решили: https://t.me/neuro_pushka/3824
[12] Онлайн-демо: https://playground.bfl.ai/image/edit
[13] Kontext на BlackForestLabs: https://bfl.ai/models/flux-kontext
[14] Попробовать в Perplexity: https://www.perplexity.ai/
[15] Источник: https://www.iphones.ru/iNotes/skoro-i-igrat-sami-ne-budete-microsoft-zapustila-ii-pomoshchnika-copilot-for-gaming-dlya-ios-i-android
[16] TechCrunch: https://techcrunch.com/2025/05/27/anthropic-launches-a-voice-mode-for-claude/
[17] 3DNews: https://3dnews.ru/1123532/anthropic-zapustila-golosovogo-iiassistenta-no-poka-v-betaversii
[18] Источник: https://4pda.to/2025/05/28/442634/opera_vypustila_eksperimentalnyj_brauzer_s_ii_agentami/
[19] Opera Neon: https://www.operaneon.com/
[20] Попробовать Manus: https://manus.im/
[21] Анализ от Gizmodo: https://gizmodo.com/googles-veo-3-is-already-deepfaking-all-of-youtubes-most-smooth-brained-content-2000606144
[22] Попробовать на сайте: https://app.klingai.com/
[23] Анонс на X: https://x.com/Kling_ai/status/1927972934112662004
[24] Блогпост: https://blog.google/products/photos/google-photos-10-years-tips-tricks/
[25] : https://odyssey.world/
[26] опытом: http://www.braintools.ru/article/6952
[27] : https://app.runwayml.com/video-tools/teams/Testovich/ai-tools/generate
[28] Источник: https://simonwillison.net/2025/May/31/snitchbench-with-llm/
[29] SnitchBench: https://snitchbench.t3.gg/
[30] поведение: http://www.braintools.ru/article/9372
[31] логике: http://www.braintools.ru/article/7640
[32] поведение: http://www.braintools.ru/article/5593
[33] Источник: https://link.springer.com/article/10.1007/s43681-025-00740-6
[34] Источник: https://dl.acm.org/doi/10.1145/3706598.3713792
[35] ошибкой: http://www.braintools.ru/article/4192
[36] Источник: https://www.orgvue.com/news/55-of-businesses-admit-wrong-decisions-in-making-employees-redundant-when-bringing-ai-into-the-workforce/
[37] Про Klarna: Futurism: https://futurism.com/klarna-openai-humans-ai-back
[38] Builder.ai: http://Builder.ai
[39] Источник: https://rozetked.me/news/39511-kompaniya-vydavavshaya-indiyskih-programmistov-za-ai-natasha-okazalas-pered-licom-bankrotstva
[40] Видео боя: https://x.com/humanoidmeme/status/1926628522052784487?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1926628522052784487%7Ctwgr%5Ef1ef7098fcab08cf138df6f3b73458b732e1940b%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fhightech.fm%2F2025%2F05%2F26%2Frobo-boxing
[41] Новость: https://www.dailynewsegypt.com/2025/05/29/china-hosts-worlds-first-humanoid-robot-fighting-competition/
[42] Анонс на TechCrunch: https://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/
[43] Источник: https://www.notebookcheck.net/Affordable-robotics-Hugging-Face-introduces-3-000-humanoid-and-300-desktop-robot.1029422.0.html
[44] Новости, обзоры продуктов и конкурсы от команды : https://t.me/timewebru
[45] Timeweb.Cloud: http://Timeweb.Cloud
[46] Опробовать: https://timeweb.cloud/?utm_source=habr&utm_medium=banner&utm_campaign=promo
[47] Источник: https://habr.com/ru/companies/timeweb/articles/915520/?utm_campaign=915520&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.