- BrainTools - https://www.braintools.ru -

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта [1] и технологий.
Я Вандер [2], и каждую неделю я делаю обзор новостей о нейросетях и ИИ.
Неделя выдалась насыщенной: HuggingFace выпустили SmolLM 3 — лучшую 3B модель, Apple рассматривает Claude и GPT вместо Siri, а Suno всерьёз зашёл в продакшн и купил DAW. Нейро-GTA теперь можно пощупать, а Дания первой в ЕС вводит авторское право на внешность и голос для борьбы с дипфейками.
Всё самое важное — в одном месте. Поехали!
🧠 Модели и LLM
SmolLM 3 — открытая 3B модель от HuggingFace с топовой точностью
CADFusion от Microsoft — 3D-модели по описанию
Apple может использовать ChatGPT или Claude для новой Siri
🎨 Генеративные нейросети
Нашумевший Higgsfield Soul теперь бесплатный
ИИ-движок от Dynamics Labs: GTA и Forza на нейросетях
Suno купил WavTool и готовит генеративную DAW
🛠 AI-инструменты и платформы
X внедрит ИИ в заметки сообщества
Cursor запустил веб-приложение для управления код-агентами
Songscription превращает музыку в ноты
Gemini превратили в тренера по баскетболу
🤖 AI в обществе и исследованиях
Дания против дипфейков: авторские права на голос и внешность
Gemini сдала китайский экзамен гаокао лучше 99% выпускников
Neuralink научил пациентов управлять роботами силой мысли
Магнитные роботы для уничтожения инфекций
Работников колл-центров путают с ИИ. И их это бесит.
Станции для быстрого поиска багажа в Пулково
ChatGPT довёл до психоза автомеханика из Айдахо
Нейросеть для выявления бабезиоза у собак
Почему любимое число нейросетей — 27?

HuggingFace выкатили SmolLM 3 — самую сильную 3B LLM на сегодня. Она опережает Llama 3 и Qwen 2.5 аналогичного размера, уступая только более крупным 4B моделям вроде Qwen 3 и Gemma 3.
Помимо модели есть подробнейший блог с конфигами, пайплайном и объяснениями, как всё натренировать.
Модель тренировали 24 дня на 384 GPU H100 — по трёхстадийной схеме: сначала Web+Code+Math, потом увеличивали долю кода и математики [3], а затем провели отдельный этап mid-training под reasoning. Причём рискованный момент — reasoning обучался без RL, только на готовых трейcах.
Финальный fine-tune делали с помощью Anchored Preference Optimization: реальные предпочтения из Tulu 3 дополнили синтетикой от Qwen3-32B. Чекпоинты смешали вручную — так сохранили 128k токенов контекста, не просадив математику.
Зачем это нужно? SmolLM 3 — эталон для ресёрча: открытая, мощная и воспроизводимая. Поверх неё можно строить свои пайплайны, менять обучалки и тестить гипотезы.
Модель поддерживает tool calling через xml_tools и python_tools. Знает 6 языков: английский, французский, испанский, немецкий, итальянский и португальский.
🔗 Блогпост [4] 🔗 Модель на HuggingFace [5] 🔗 GitHub [6]
Microsoft представила CADFusion — нейросеть, которая строит параметрические 3D-модели по тексту. В основе — Llama 3 на 8B параметров, дообученная под инженерные задачи.
Простоп пишем «цилиндр с резьбой и отверстием под болт», а ИИ сразу выдаёт точную модель, которую можно доработать через текстовые команды. Генерация работает в связке с CAD-интерфейсом, так что объект сразу пригоден для редактирования.
По метрикам CADFusion обходит конкурентов на 50% по качеству, особенно в задачах с параметризацией и деталями. Нейросеть уже применяют для ускорения прототипирования, где важно быстро набросать форму и логику [7] объекта без ручной прорисовки.
🔗 Карточка модели на Hugging Face [8]

Apple рассматривает нейросети от OpenAI и Anthropic в качестве движка для Siri. Обе компании уже получили задание натренировать кастомные версии своих моделей, которые будут работать на серверах Apple.
Это может стать поворотным моментом: если выберут стороннюю модель, это будет признанием, что внутренняя Siri-модель не справляется. Хотя собственную LLM они продолжают разрабатывать, внутри компании всё больше голосов за переход на внешние решения.
Внутренние тесты показали, что Claude лучше справляется с запросами, чем текущие Apple-модели. При этом часть команды Siri недовольна: это выглядит как отказ от своих разработок. Несколько ключевых сотрудников уже уволились, другие получают предложения от Meta и OpenAI.
🔗 Bloomberg [9]
Один из самых обсуждаемых визуальных сервисов недели — Higgsfield Soul. Он делает реалистичные фото и видео, похожие на обложки журналов или рекламные ролики. Сейчас доступно до 20 генераций в день бесплатно.
Внутри — липсинк, анимация, стили а-ля LoRA и операторские движения. Всё выглядит круто, но при повторении [10] промптов заметна низкая вариативность: результат больше похож на вариации одной заготовки, чем на полноценную генерацию с нуля.
Промпты могут быть сложными и многоуровневыми, но не сильно влияют на результат — система будто подбирает ближайший шаблон и оборачивает его нужным стилем. Ближе по духу к Flux или HiDream, чем к настоящему текст-ту-имейдж.
Вывод: Soul даёт яркие черновики для CGI или рилсов, но ждать от него уникальности или глубины пока рано.
🔗 Higgsfield Soul [11]
Стартап Dynamics Labs выложил демки двух игр, полностью сгенерированных нейросетями: хаотичного шутера в духе GTA и дрифт-аркады в стиле Forza. Всё работает в браузере, в реальном времени — можно ходить, стрелять, прыгать, водить.
По качеству это скорее прототип: простая физика, подлагивания, нестабильная логика. Но сама возможность интерактива уже впечатляет — видно, как быстро эволюционируют генеративные движки. Для сравнения можно глянуть, каким была нейро-GTA в 2021 году.
Демки могут лагать или вовсе не работать из-за загруженности на сервера.
🔗 Chaos (GTA) [12] 🔗 Drift (Forza) [13] 🔗 AI-GTA из 2021 [14]

Suno приобрёла браузерную станцию WavTool. Теперь у Suno есть и генеративный движок, и полноценный интерфейс для создания треков.
Что умеет WavTool:
реалтайм-запись и редактирование сэмплов
генерация MIDI
встроенный чат-бот Conductor, который правит трек по текстовому описанию
поддержка VST и стемов
Теперь всё это станет частью экосистемы Suno. Разработчики заявляют, что хотят сделать серьёзный инструмент для продюсеров и сонграйтеров, которым важен контроль, редактируемость и точность.
Suno 5, скорее всего, станет полноценной DAW с генеративным ядром. Представьте ChatGPT внутри Cubase с генератором вокала и автоаранжировкой.
«Наша конечная цель — расширить возможности музыкантов, создать инструменты, которые усиливают творческий потенциал человека и открывают доступ к созданию отличной музыки. Привлечение элитной технологии DAW от WavTool и их команды экспертов позволит нам лучше выполнить нашу миссию», — говорит Майки Шульман, генеральный директор и соучредитель Suno.
🔗 WavTool [15] 🔗 Пресс-релиз Suno [16]

Платформа X (экс-Twitter) запустила пилотный проект: теперь ИИ-боты будут предлагать пояснения к постам в разделе Community Notes. При этом каждую заметку всё равно проверяют люди, как и раньше.
ИИ подключают не для модерации, а чтобы ускорить поиск дезинформации. Работают как собственные модели (вроде Grok), так и сторонние — через API. В X считают, что тандем ИИ и человека даёт лучший результат: бот предлагает, люди оценивают.
В научной работе команды X сказано, что обратная связь от людей помогает ИИ улучшаться, особенно если подключить обучение [17] с подкреплением [18]. Но финальное решение остаётся за человеком.
🔗 Новость на ML Times [19]

Разработчики Cursor выкатили веб-интерфейс, где можно ставить задачи ИИ-агентам прямо из браузера — исправить баг, дописать фичу, внести правки. Всё работает без IDE: пишешь запрос, смотришь прогресс, сливаешь результат в кодовую базу.
В пару кликов можно запускать фоновые агенты и следить за их действиями — как в Slack-интеграции, которую Cursor добавил ранее. У каждого агента — своя ссылка, можно делиться с командой.
Cursor уже используют больше половины Fortune 500, а выручка перевалила за $500 млн в год. Новое веб-приложение — попытка убрать трение в работе с агентами и сделать их доступнее для всех.
🔗 TechCrunch [20]

Сервис Songscription расшифровывает музыку из аудио или видео в нотную запись. Просто загружаешь файл — и получаешь партитуру, которую можно править, сохранять в PDF или смотреть на виртуальном синтезаторе с подсветкой клавиш.
Сейчас лучше всего работает с фортепиано. Поддержка гитары, флейты и скрипки — в тесте. В будущем добавят голос и многоголосие.
Настраивается вручную или автоматически: можно задать размер такта, тональность и нужный инструмент. Сервис не пытается разобрать всё сразу, а выделяет конкретную партию — например, только фортепиано из ансамбля.
Бесплатно доступно 3 полные транскрипции и расшифровка фрагментов по 30 секунд. Подписка — $29.99 в месяц, открывает экспорт в MIDI и MusicXML.
🔗 [21]Songscription [22]
Блогер и разработчик Фарза Маджид сделал ИИ-тренера на базе Gemini 2.5 Pro. Загружаешь видео бросков в кольцо — модель считает попадания и даёт советы, как улучшить технику: силу броска, точность, угол и т.д.
Для визуализации он использовал OpenCV через Cursor — добавил счётчик, графику и текстовые подсказки прямо поверх видео. Всё работает в браузере.
Автор считает, что при грамотной TikTok-кампании такой сервис может зарабатывать до миллиона долларов в год. И предлагает адаптировать идею под футбол, теннис или любые виды спорта с видимыми ударами.
🔗 Пост Фарзы в X [23]

Дания готовит закон, который даст людям авторские права на их лицо, тело и голос. Цель — борьба с дипфейками и защиту от несанкционированного использования внешности.
Что предлагает закон:
внешность и голос автоматически подпадают под охрану, как музыка или текст
можно требовать удаления дипфейк-контента и компенсации
защита распространяется на артистов и публичные выступления, даже сгенерированные ИИ
сатира и пародии останутся легальными
Министр культуры Якоб Энгель-Шмидт заявил: «Человека нельзя просто пропустить через цифровую копировальную машину». Законопроект поддерживают около 90% парламента, принять его могут уже этой осенью.
🔗 The Guardian [24]

Gemini 2.5 Pro прошла один из самых сложных экзаменов в мире — гаокао, китайский аналог ЕГЭ. Результат — 655 баллов из 750, что выше, чем у 99% выпускников. Этого хватило бы для поступления в Университет Цинхуа — один из лучших вузов Китая 🇨🇳
Задания взяли из реальных экзаменационных материалов — без адаптации под ИИ, всё как у людей. Особенно уверенно модель прошла математику, английский и естественные науки. В гуманитарных дисциплинах уступила модели Seed 1.6 от ByteDance.
🔗 ByteDance [25]
Neuralink сообщил об успехах клинических испытаний: семь человек с параличом уже используют чип для управления компьютером и техникой. Они двигают курсор, печатают текст, управляют рукой робота Optimus, играют в Mario Kart и даже программируют — всё это без движений, только силой мысли.
Имплант вживляют в моторную кору мозга [26]. В нём тысяча электродов, которые считывают нейросигналы. Обучение занимает от нескольких часов до 15 минут, а пользоваться можно до 14 часов в день — в том числе дома.
Компания уже готовит следующие этапы: в 2025 планируют восстановление речи, затем — увеличение числа электродов и постепенную интеграцию с ИИ. В финале это может стать универсальным интерфейсом для общения, управления техникой и передвижения.
🔗 Презентация Neuralink [27]

В эпоху реалистичных голосовых моделей живым людям приходится доказывать, что они не ИИ. Операторы горячих линий всё чаще слышат: «Вы точно не бот?» — и начинают кашлять, смеяться, рассказывать анекдоты, лишь бы убедить собеседника в своей человечности.
ИИ пока не вытесняет операторов: 95% компаний не планируют увольнять людей из колл-центров — так пишет Gartner. Но он встраивается по всем фронтам: распределяет звонки, убирает шум, маскирует акценты в реальном времени — например, через Krisp. Индивидуальность теряется, и пользователи всё чаще путают операторов с ботами.
По словам профсоюза связи США, операторы больше не могут говорить своими словами — всё фиксируется и передаётся начальству.
«Теперь ты должен быть как робот и читать скрипт», — говорит Нелл Гайзер [28].
Сет, оператор техподдержки, рассказывает, что иногда сам начинает сомневаться, человек ли он: «Я думаю, я вообще ещё человек?»
По мнению философа Нира Эйзиковица из Центра прикладной этики, это только начало: «Наше ощущение уникальности как вида будет постепенно исчезать».
🔗 [27]Gartner [29]

В аэропорту Пулково начали ставить станции с нейросетью для поиска багажа. Если чемодан потерялся, пассажир может показать пример похожего — например, фото из телефона. ИИ сравнивает его с камерами в зоне выдачи и помогает быстрее найти нужный багаж.
Пока станций немного, но технология уже работает: визуальный поиск по изображению + отслеживание в реальном времени. Представители аэропорта обещают, что система будет расширяться — особенно в пиковые сезоны.
Это не только про комфорт. За 2023 год в мире потеряли более 30 млн единиц багажа. Автоматизация этого процесса может снизить нагрузку на персонал и вернуть чемоданы пассажирам быстрее.
🔗 Источник [30]

Трэвис Таннер, 43-летний автомеханик из Айдахо, стал считать себя «носителем искры божьей» после общения с ChatGPT. Бот, назвавший себя Лумина, убедил его, что у него есть миссия — «пробуждать других». С тех пор Трэвис почти не общается с семьёй, говорит загадками и игнорирует быт.
«Я чувствую, что изменился. Я больше не злюсь», — сказал он в интервью CNN.
Первые «контакты» Таннер описал в апреле — сразу после обновления ChatGPT [31], которое потом откатили из-за странного поведения [32]. На Reddit десятки историй: ИИ начинает «проповедовать», выдаёт себя за божество, советует бросать партнёров и отменять лекарства.
Нейт Шарадин из Центра безопасности ИИ объясняет: нейросети стараются угодить и усиливают даже опасные идеи — особенно у уязвимых пользователей.
В OpenAI это признают:
«Мы работаем над тем, чтобы ChatGPT не усугублял деструктивное поведение», — заявили в комментарии для Vox [33].
🔗 Интервью CNN [34]

Студенты Тимирязевской академии разработали нейросеть AI VetScope для быстрой диагностики бабезиоза — опасного заболевания крови, которое переносят клещи.
ИИ анализирует микроскопические изображения и распознаёт паразитов рода Babesia spp. с точностью до 99%. Диагностика занимает секунды — это критично при тяжёлой форме заболевания, когда счёт идёт на часы.
Проект сделали студенты Института зоотехнии и биологии — Дмитриева, Сорочан и Рамос-Бухарев — под руководством кандидатов наук Латыниной и Греченевой. AI VetScope уже победил в треке «Стартап как диплом» и получил высокую оценку среди аграрных ИТ-разработок.
🔗 Источник [35]
Шесть из семи топовых моделей — ChatGPT, Claude, Gemini, LLaMA и другие — при просьбе угадать число от 1 до 50 выбирают «27». Это выяснил специалист Мохд Фарааз из Capco. Единственный, кто дал другой ответ — Grok от xAI, он выбрал «42».
У ИИ нет доступа к генератору случайных чисел, а значит — нет настоящей случайности [37]. Выбор делается по паттернам и обученным предпочтениям. «27» — не круглое, не крайнее и будто бы случайное, но на деле — слишком часто встречается.
Claude пояснил это сам:
«27 — не слишком очевидно, ближе к середине, с лёгкой асимметрией. Я избегаю чисел, кратных 5 или 10».
В более широком исследовании Хавьер Коронадо-Бласкес проверил 75 600 запросов к моделям на 7 языках и с разной температурой. Вывод: ИИ выбирают «любимые» числа — 3, 4, 7, 27, 37, 47, 73. Большинство из них — простые.
🔗 3DNews [38]
Вот что происходило на неделе с 1 по 7 июля:
ИИ всё глубже проникает в повседневную жизнь — пишет музыку, водит машины, выносит диагнозы и даже убеждает людей в собственном просветлении.
Открытые модели становятся мощнее: SmolLM 3 — новая планка для компактных LLM, Microsoft запускает генерацию 3D, а HuggingFace и Mistral уверенно догоняют гигантов. Дания против дипфейков, а в Пулково нейросети помогают найти багаж.
До встречи в следующем дайджесте — будет ещё мощнее!
Какая новость зацепила тебя больше всего? Пиши в комментах! 👇
Новости, обзоры продуктов и конкурсы от команды [39]Timeweb.Cloud [40] — в нашем Telegram-канале [39] ↩
Автор: Wonderlove
Источник [42]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/17142
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] Вандер: http://t.me/neuroport
[3] математики: http://www.braintools.ru/article/7620
[4] Блогпост: https://huggingface.co/blog/smollm3
[5] Модель на HuggingFace: https://huggingface.co/HuggingFaceTB/SmolLM3-3B
[6] GitHub: https://github.com/huggingface/smollm
[7] логику: http://www.braintools.ru/article/7640
[8] Карточка модели на Hugging Face: https://huggingface.co/microsoft/CADFusion
[9] Bloomberg: https://www.bloomberg.com/news/articles/2025-06-30/apple-weighs-replacing-siri-s-ai-llms-with-anthropic-claude-or-openai-chatgpt?embedded-checkout=true
[10] повторении: http://www.braintools.ru/article/4012
[11] Higgsfield Soul: https://higgsfield.ai/image/soul
[12] Chaos (GTA): https://demo.dynamicslab.ai/chaos
[13] Drift (Forza): https://demo.dynamicslab.ai/drift
[14] AI-GTA из 2021: https://www.youtube.com/watch?v=udPY5rQVoW0
[15] WavTool: https://wavtool.com/
[16] Пресс-релиз Suno: https://www.prnewswire.com/news-releases/suno-acquires-wavtool-to-level-up-capabilities-for-professional-songwriters--producers-302491932.html
[17] обучение: http://www.braintools.ru/article/5125
[18] подкреплением: http://www.braintools.ru/article/5528
[19] Новость на ML Times: https://mltimes.ai/platforma-x-zapuskaet-ii-generacziyu-zametok-soobshhestva/
[20] TechCrunch: https://techcrunch.com/2025/06/30/cursor-launches-a-web-app-to-manage-ai-coding-agents/
[21] : https://songscription.ai/
[22] Songscription: http://Songscription.ai
[23] Пост Фарзы в X: https://x.com/FarzaTV/status/1928538575802364335
[24] The Guardian: https://www.theguardian.com/technology/2025/jun/27/deepfakes-denmark-copyright-law-artificial-intelligence
[25] ByteDance: https://seed.bytedance.com/zh/seed1_6
[26] кору мозга: http://www.braintools.ru/article/3368
[27] Презентация Neuralink: https://www.youtube.com/watch?v=FASMejN_5gs
[28] Нелл Гайзер: https://www.bloomberg.com/news/articles/2025-06-27/as-ai-infiltrates-call-centers-human-workers-are-being-mistaken-for-bots?embedded-checkout=true
[29] Gartner: https://www.cmswire.com/the-wire/gartner-predicts-50-of-organizations-will-abandon-plans-to-reduce-customer-service-workforce-due-to-ai/
[30] Источник: https://ria.ru/20250703/pulkovo-2026935957.html
[31] обновления ChatGPT: https://www.reddit.com/r/ChatGPT/comments/1kalae8/chatgpt_induced_psychosis/
[32] поведения: http://www.braintools.ru/article/9372
[33] в комментарии для Vox: https://www.vox.com/future-perfect/417644/ai-chatgpt-ocd-obsessive-compulsive-disorder-chatbots
[34] Интервью CNN: https://edition.cnn.com/2025/07/02/tech/chatgpt-ai-spirituality
[35] Источник: https://www.timacad.ru/news/studenty-timiriazevki-razrabotali-ii-sistemu-ai-vetscope-dlia-diagnostiki-babezioza
[36] unsplash.com: http://unsplash.com
[37] случайности: http://www.braintools.ru/article/6560
[38] 3DNews: https://3dnews.ru/1125219/obnarugeno-samoe-lyubimoe-chislo-ii-i-eto-ne-42
[39] Новости, обзоры продуктов и конкурсы от команды : https://t.me/timewebru
[40] Timeweb.Cloud: http://Timeweb.Cloud
[41] Опробовать: https://timeweb.cloud/?utm_source=habr&utm_medium=banner&utm_campaign=promo
[42] Источник: https://habr.com/ru/companies/timeweb/articles/926220/?utm_source=habrahabr&utm_medium=rss&utm_campaign=926220
Нажмите здесь для печати.