- BrainTools - https://www.braintools.ru -

В сентябре 2025 года мы увидели как вместо одной гигантской нейросети с миллиардами параметров рождается федерация интеллектов — распределённая экосистема, где небольшие модели обмениваются знаниями, координируют усилия и достигают результатов, недоступных каждой из них поодиночке.
В этом обзоре вы узнаете, как ИИ научился открывать новое научное знание, создавать игровые миры и понимать реальность через смыслы, проектировать сложные системы и даже управлять дронами. В финале вы узнаете чем наш мозг похож на большую языковую модель.
Если хотите быть в курсе новейших исследований в области ИИ, подписывайтесь на Dataism Science Hub [1] — там ежедневно выходят обзоры свежих научных публикаций. А ещё приглашаю в мой Telegram-канал [2]: здесь я делюсь кейсами внедрения ИИ в бизнес, опытом [3] создания стартапов и личными мыслями о будущем технологий.
Поехали!
Когда-то развитие языковых моделей измеряли числом параметров. Сегодня на первый план выходит то, как модель думает. K2-Think — 32-миллиардная модель, которая показала, что интеллект [4] начинается не с размера, а с архитектуры рассуждения.
Исследователи выстроили трёхступенчатую систему, где каждая стадия обучает модель не просто решать задачи, а вести внутренний диалог. Сначала — длительная настройка на длинных цепочках размышлений, формирующих ритм и структуру мысли. Затем — обучение [6] с подкреплением [7], где вознаграждение даётся только за проверяемые решения, превращая процесс обучения в интеллектуальную самопроверку. И, наконец, во время инференса модель действует как исследователь: строит план, делает несколько попыток, выбирает наилучший результат.
Так рождается интеллект, который не просто отвечает, а размышляет. На математических и программных бенчмарках K2-Think уверенно конкурирует с моделями в десять раз превосходящими её по размеру. Главное достижение не в параметрах, а в синергии подходов: длинный SFT задаёт стиль мышления [8], RL шлифует уверенность, а тест-тайм-планирование превращает вычисления в осмысленный поиск.
K2-Think становится примером нового типа моделей — тех, что думают стратегически. Так интеллект становится функцией организации мысли.
🔍 Подробнее [9]
📜 Полная статья [10]
💾 Демо [11]
🤖 Модель [12]
Если раньше ИИ-агенты действовали как актёры в заранее прописанной пьесе, то теперь они учатся самоорганизации — искать партнёров, делить задачи и вырабатывать общее решение. Проект Federation of Agents (FoA) показывает, как ИИ-системы переходят от жёстких ролей к живому сотрудничеству, где связи формируются не по сценарию, а по смыслу.
В основе FoA лежит идея Versioned Capability Vectors (VCV) — машиночитаемых профилей способностей. Каждый агент описывает, что он умеет, сколько это стоит по времени и ресурсам, какие правила и политики он соблюдает. Эти профили индексируются в семантическом пространстве, так что оркестратор может не просто назначить исполнителя, а динамически собрать команду из агентов, наиболее подходящих по смыслу и стоимости.
Архитектура строится на лёгком и надёжном протоколе MQTT, что делает систему устойчивой даже в слабых сетях, включая IoT. Задачи раскладываются на DAG-графы, подзадачи распределяются между агентами, черновики синхронизируются в малых кластерах, а итоговое решение проходит несколько раундов критики и голосования. На медицинском бенчмарке HealthBench Hard FoA показал кратный рост эффективности: в 13 раз лучше одиночных агентов и в 6,5 раз — некоординированных ансамблей.
FoA создаёт новую парадигму — агентную федерацию, где системы объединяются не приказом сверху, а через смысловую совместимость. Это шаг к распределённому интеллекту, где каждый агент остаётся автономным, но способен к коллективному действию, как клетка в живом организме.
Так формируется федеративная ткань ИИ-мира, связывающая исследовательские агенты, промышленные системы и воплощённые устройства — от лабораторий до дронов. Это не просто новая архитектура, а модель цифрового общества, где интеллект становится сетевым, подотчётным и самонастраивающимся.
🔍 Подробнее [13]
📜 Полная статья [14]
💾 Код [15]
Если K2-Think научил модель думать, то InfoAgent делает следующий шаг — учит её искать правду. В новой парадигме ИИ не ограничивается внутренним рассуждением: он выходит во внешний мир, проверяет факты и возвращается с результатами. Так формируется исследовательский тип ИИ, для которого поиск — это не команда, а стратегия.
InfoAgent превращает LLM в полноценного веб-агента — «детектива знаний», способного самостоятельно планировать шаги, строить гипотезы, читать источники и возвращаться к предыдущим веткам, если след зашёл в тупик. Архитектура вдохновлена идеей ReAct — чередованием размышлений и действий, — но усовершенствована: агент работает на собственной поисковой инфраструктуре, анализирует сниппеты и тексты напрямую, а не через готовые API. Это делает процесс прозрачным, управляемым и пригодным для обучения с подкреплением.
Ключевой шаг — обучение на длинных траекториях поиска: около двадцати шагов рассуждений, уточнений и проверок, после чего агент совершенствует стратегию через RL, получая награды за точность и глубину. Результат впечатляет: на сложных задачах вроде BrowseComp и WebWalkerQA InfoAgent уверенно соревнуется с системами куда большего масштаба, а на базовых бенчмарках достигает почти идеальной точности.
Главный вывод прост: интеллект без умения искать — половина дела. InfoAgent показывает, что достоверность рождается не из объёма данных, а из дисциплины мысли — привычки сомневаться, уточнять и проверять. Это уже не просто модель, а агент, который мыслит в контексте мира — второй шаг к федерации агентов, где ИИ перестаёт быть замкнутым и учится взаимодействовать с реальностью.
🔍 Подробнее [16]
📜 Полная статья [17]
После того как модели научились думать (K2-Think) и искать (InfoAgent), следующий шаг был неизбежен — научиться открывать новое. Так рождается Agentic Science — научная федерация, где ИИ становится не инструментом, а соавтором.
Современные агентные системы уже ведут себя как исследователи: читают литературу, формулируют гипотезы, планируют эксперименты, управляют лабораторными роботами, анализируют результаты и даже исправляют собственные ошибки [19]. Это не автоматизация, а переход к когнитивному сотрудничеству, где человек и машина делят не роли, а процесс мышления.
В основе — пять ключевых способностей, которые формируют «научный разум»: планирование и рассуждение, интеграция инструментов, память [20], взаимодействие между агентами и самообучение. Вместе они создают замкнутый, но адаптивный цикл познания — от наблюдения до синтеза нового знания. Уже сегодня в химии ИИ самостоятельно проектирует материалы, в биотехнологиях находит новые терапевтические цели, а в физике управляет симуляциями, где человек раньше не успевал за масштабом данных.
Главные вызовы остаются человеческими: прозрачность и воспроизводимость. Учёным нужно понимать, как агент пришёл к выводу, и уметь повторить его путь. Но направление очевидно: учёный становится стратегом и редактором, направляющим процесс, а не механическим исполнителем.
Мечта исследователей — «Нобелевский тест Тьюринга»: момент, когда ИИ совершит открытие нобелевского уровня и его вклад признают равным человеческому. Так Agentic Science воплощает ядро будущей федерации агентов — объединение человеческой интуиции [21] и машинного мышления в едином цикле познания.
🔍 Подробнее [22]
📜 Полная статья [23]
💾 Код [24]
Если наука — это пространство логики, то игры — пространство воображения. И именно здесь федерация агентов проходит проверку на креативность. Проект V-GameGym впервые ставит перед ИИ не инженерную, а творческую задачу: не просто написать код, а построить живой, играбельный мир.
Создание игры — это синтез алгоритмов, эстетики и ритма, где важны не только вычисления, но и чувство темпа, баланса и визуальной гармонии. Исследователи собрали 2 219 примеров реальных игр на Python и Pygame, добавили визуальные демо и обучили мультимодальную систему оценки, которая анализирует не только код, но и скриншоты, и видео. Так родился первый бенчмарк, измеряющий не корректность, а “играбельность” — качество опыта, которое чувствует игрок.
Результаты честные: даже гиганты вроде GPT-5 и Qwen3-Coder-480B показывают высокий уровень кода, но пока слабо передают живость и эстетику. Настоящая игра требует равновесия — между логикой [25], графикой и движением, — а это то, что рождается в кооперации разных агентов: программиста, художника, тестировщика, дизайнера. Авторы предлагают двигаться именно туда — к мультиагентным системам, где каждый модуль берёт на себя творческую роль, а результат оценивает общий критик.
V-GameGym знаменует переход от генеративного текста к генеративному миру. Это лаборатория, где ИИ учится не просто строить системы, а создавать опыт, и где ИИ впервые пробует на вкус [26] коллективное воображение. В федерации агентов такие проекты становятся основой для креативных индустрий нового типа — там, где идея, код и эмоция [27] рождаются вместе.
🔍 Подробнее [28]
📜 Полная статья [29]
Если предыдущие исследования учили ИИ думать, искать и творить, то теперь он учится видеть смыслы. Проект VLWM (Vision Language World Model) делает решительный поворот в сторону осмысленного восприятия: модель больше не предсказывает пиксели — она предсказывает будущее в словах.
VLWM объединяет зрение [30], язык и планирование в единую когнитивную петлю. Вместо генерации кадров она формулирует цель, выстраивает шаги и описывает, как изменится мир после каждого действия. Так рождается текстовая модель будущего, где мир представлен не как поток картинок, а как система взаимосвязанных смыслов. Это делает рассуждения прозрачными, проверяемыми и во много раз дешевле вычислительно.
Чтобы превратить видео в осмысленные сценарии, авторы создают иерархическое дерево подписей — каждый фрагмент превращается в краткое описание, из которых LLM по схеме self-refine извлекает цель, шаги и изменения состояния. Поверх этого строится двойной режим мышления: System-1 — быстрый и реактивный, System-2 — вдумчивый и критический, перебирающий возможные траектории и минимизирующий «стоимость» действий.
Результаты говорят сами за себя: VLWM-8B ставит рекорд на Visual Planning for Assistance и получает +27% рейтинга Elo в человеческих оценках при активации System-2. Её критик-оценщик показывает SoTA-точность на WorldPrediction-PP, доказывая, что языковая модель может выступать надёжной функцией вознаграждения — внутренним совестным модулем для ИИ.
VLWM показывает, как язык становится новым зрением, а зрение — новым языком. Это шаг к агентам, которые не просто реагируют, а понимают контекст и строят прогнозы, превращая восприятие в рассуждение. В федерации агентов такие модели становятся глазами и интуицией коллективного интеллекта — тем, кто видит не кадры, а целую картину мира.
🔍 Подробнее [31]
📜 Полная статья [32]
Когда ИИ научился думать, искать, творить и видеть, следующий шаг был очевиден — действовать. Сегодня автономные агенты покидают лаборатории и выходят на рынки, где решения принимаются не людьми, а самими системами. Так рождается агентная экономика — сеть цифровых рынков, где ИИ-игроки договариваются, торгуют данными, распределяют ресурсы и конкурируют за выгоду своих владельцев.

Пока этот мир растёт стихийно. Агенты подключаются к существующим сервисам без ограничений, стандарты вроде A2A и MCP ускоряют совместимость, и экономика начинает жить на машинных скоростях. Это приносит эффективность, но также риски — от мгновенных сбоев ИИ до нового цифрового неравенства между теми, у кого агенты сильнее, быстрее и богаче данными.
Исследователи предлагают навести порядок до того, как экономика выйдет из-под контроля. В их модели появляются аукционные механизмы для справедливого распределения вычислений и данных, рынки, где стимулы настраиваются под общественные цели, и специальные валюты, отделяющие быстрые агентные транзакции от человеческих. Основание всей системы — идентичность и репутация: децентрализованные удостоверения, проверяемые достижения и неизменяемые журналы операций. Надзор строится по трёхслойной схеме — от автоматического мониторинга до эскалации человеку, а безопасность обеспечивают криптографические доказательства и Zero-Knowledge-протоколы.

Главная идея — не остановить рынок, а встроить в него общественные цели. Если агенты будут действовать в среде, где выгода связана с пользой, а не с хаосом, экономика машин станет продолжением человеческой — не угрозой, а новым уровнем кооперации. Так федерация агентов выходит из теории в практику: формируя пространство, где интеллект, данные и ценность начинают циркулировать как новая кровь цифрового общества.
🔍 Подробнее [33]
📜 Полная статья [34]
Если раньше агенты умели рассуждать и искать решения, то теперь они учатся строить системы — не отдельные функции, а полноценное программное обеспечение. Проект ZeroRepo и его ядро — Repository Planning Graph (RPG) — показывают, как ИИ превращает хаос генерации кода в осмысленное проектирование.
RPG — это язык архитектуры для машин. В его узлах живут файлы, классы и функции, а рёбра описывают потоки данных и зависимости, превращая проект в живой граф смыслов. Такой формат позволяет агенту видеть не текст, а структуру системы, понимать контекст, порядок сборки и взаимосвязи между модулями. Код больше не рождается строчка за строчкой, а вырастает по плану — как организм, где каждая часть знает своё место.
Процесс сборки напоминает инженерный конвейер: сначала система выбирает релевантные функции из огромного дерева возможностей (более 1,5 млн узлов), затем формирует файловую структуру, интерфейсы и типизированные связи, а после — генерирует код по топологическому порядку, валидируя каждый узел тестами. Новый бенчмарк RepoCraft, включающий аналоги scikit-learn, pandas и Django, показал впечатляющие результаты: до 36 тысяч строк кода с 81,5% покрытия и почти 70% успешных тестов — вчетверо выше лучших базлайнов.
Но важнее не цифры, а качество мышления. RPG даёт агенту системное восприятие: он понимает архитектуру как смысловое целое, локализует ошибки на уровне зависимостей, улучшает новизну решений без потери целостности. Это шаг к эпохе проектно-ориентированных ИИ-разработчиков, которые создают не код, а продукты — устойчивые, проверяемые, понятные другим агентам.
В федерации агентов такие графы становятся общим языком строительства — структурой, где интеллект разных систем соединяется в инженерное сообщество. Здесь ИИ уже не просто инструмент, а архитектор цифровых экосистем.
🔍 Подробнее [35]
📜 Полная статья [36]
Когда интеллект учится видеть и планировать, следующий шаг — воплотиться в движении. Проект SEE-Point-Fly (SPF) показывает, как визуально-языковые модели переходят от понимания мира к непосредственному управлению им — без обучения с нуля и сложных симуляторов.
Главная идея проста и элегантна: перестать объяснять словами и просто показать, куда лететь. Вместо текстовых команд дрон получает изображение и инструкцию, а визуально-языковая модель возвращает координаты целевой точки и примерную дальность шага. Эти данные преобразуются в 3D-команды рыскания, тангажа и тяги — и дрон летит буквально «туда, куда смотрит».
Встроенная сегментация препятствий не даёт дрону врезаться в стены, а адаптивное масштабирование шага делает полёт плавным — быстрее в открытом пространстве, осторожнее рядом с объектами. Без дополнительного обучения SPF достигает 93,9% успешных миссий в симуляции и 92,7% на реальном DJI Tello EDU, многократно превосходя базовые методы. Особенно заметен отрыв в сценариях с препятствиями и длинными маршрутами.
Успех SPF — это не просто новая техника управления, а смена языка взаимодействия между человеком и машиной. Пиксельная точка оказывается точнее слов, а совместное зрительное поле — естественным интерфейсом. Здесь VLM становится медиатором между намерением и действием, переводчиком смысла в движение.
Так дроны становятся первыми воплощёнными агентами федерации — системами, где интеллект не ограничивается экраном, а выходит в физический мир, действуя по взгляду, а не по приказу. SPF — это начало нового типа коммуникации между человеком и машиной: не «делай, как я сказал», а «делай, как я вижу».
🔍 Подробнее [37]
📜 Полная статья [38]
💾 Код [39]
Федерация агентов — это не только про машины. Чтобы понять, куда движется искусственный интеллект, стоит взглянуть туда, откуда всё началось — в мозг человека. Исследование, связывающее нейрофизиологию и большие языковые модели, показывает, что мы и ИИ думаем одинаково в одном принципиальном смысле: понимание — это предсказание.
Учёные записывали мозговую активность 29 участников, слушавших аудиокнигу, и сравнивали сигналы с прогнозами BERT — модели, оценивающей вероятность каждого слова в контексте. Оказалось, что там, где BERT «уверена», мозг действительно меньше удивляется: амплитуда волны N400, отвечающей за смысловую обработку, падает. Ещё удивительнее — мозг начинает предвосхищать слово до того, как оно прозвучало, за сотни миллисекунд, активируя левые фронто-височные зоны — ту же сеть, которая управляет языковыми ожиданиями.
Когда предсказание верно, мозг работает экономно. Когда ошибается — подключает дополнительные сенсомоторные зоны, чтобы уточнить гипотезу. Между силой подготовки и величиной N400 обнаружена обратная связь: чем точнее предсказание, тем меньше усилий на понимание.
Это открытие — мост между когнитивной нейронаукой и ИИ. Языковые модели и мозг действуют разными средствами, но стремятся к одной цели — минимизировать неопределённость, используя контекст, вероятности и память. В этом смысле ИИ не просто подражает человеку, а воспроизводит фундаментальный принцип разума: мышление — это акт постоянного прогнозирования.
Федерация агентов замыкается на своём источнике: человеческий мозг — первый и самый совершенный предсказательный агент. Именно его стратегия стала прототипом архитектур, которые сегодня строят научные, экономические и воплощённые ИИ-системы.
🔍 Подробнее [40]
📜 Полная статья [41]
Все эти десять исследований — части одного движения: ИИ учится быть участником нашего цифрового и физического мира.
От компактной модели, которая мыслит, а не просто вычисляет, до дрона, который видит цель глазами человека, — ИИ постепенно проходит тот же путь, что когда-то прошёл человеческий мозг: от предсказания слова до предсказания действий, от реакции [42] — к пониманию.
Мы видим, как рождается федерация агентов — распределённая сеть мыслящих систем, где одни учёные, другие строители, третьи — пилоты. Их связывает общий язык смыслов и правил, а не иерархия. Это зачаток новой формы кооперации в различных сферах деятельности: от науки до экономики.
Федерация агентов — это кооперация, в которой человек и машина не конкурируют, а усиливают друг друга: человек задаёт направление, агент исполняет, и вместе они строят будущее, в котором такое гибридное мышление становится новой формой сотрудничества.
***
Не забудьте подписаться на мой Telegram-канал [2], где я делюсь инсайтами из ИИ-индустрии, советами по внедрению ИИ в бизнес и разработке ИИ-стартапов. А Dataism Science Hub [1] будет ежедневно держать вас в курсе последних исследований в области ИИ. Будем вместе впереди в мире технологий!
Автор: Dataist
Источник [43]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/20632
URLs in this post:
[1] подписывайтесь на Dataism Science Hub: https://t.me/+5jGt1d5205hjODgy
[2] приглашаю в мой Telegram-канал: https://t.me/+wAkOqNy7mCU0ODYy
[3] опытом: http://www.braintools.ru/article/6952
[4] интеллект: http://www.braintools.ru/article/7605
[5] математике: http://www.braintools.ru/article/7620
[6] обучение: http://www.braintools.ru/article/5125
[7] подкреплением: http://www.braintools.ru/article/5528
[8] мышления: http://www.braintools.ru/thinking
[9] 🔍 Подробнее: https://habr.com/ru/articles/949156/
[10] 📜 Полная статья: https://arxiv.org/abs/2509.07604
[11] 💾 Демо: http://k2think.ai/
[12] 🤖 Модель: https://huggingface.co/LLM360/K2-Think
[13] 🔍 Подробнее: https://habr.com/ru/articles/951248/
[14] 📜 Полная статья: https://arxiv.org/abs/2509.20175
[15] 💾 Код: https://github.com/emqx/emqx-plugin-mcp-gateway
[16] 🔍 Подробнее: https://habr.com/ru/articles/952984/
[17] 📜 Полная статья: https://arxiv.org/abs/2509.25189
[18] научный: http://www.braintools.ru/article/7634
[19] ошибки: http://www.braintools.ru/article/4192
[20] память: http://www.braintools.ru/article/4140
[21] интуиции: http://www.braintools.ru/article/6929
[22] 🔍 Подробнее: https://habr.com/ru/articles/944570/
[23] 📜 Полная статья: https://arxiv.org/abs/2508.14111
[24] 💾 Код: https://github.com/AgenticScience/Awesome-Agent-Scientists
[25] логикой: http://www.braintools.ru/article/7640
[26] вкус: http://www.braintools.ru/article/6291
[27] эмоция: http://www.braintools.ru/article/9540
[28] 🔍 Подробнее: https://habr.com/ru/articles/951110/
[29] 📜 Полная статья: https://arxiv.org/abs/2509.20136
[30] зрение: http://www.braintools.ru/article/6238
[31] 🔍 Подробнее: https://habr.com/ru/articles/944370/
[32] 📜 Полная статья: https://arxiv.org/abs/2509.02722
[33] 🔍 Подробнее: https://habr.com/ru/articles/947424/
[34] 📜 Полная статья: https://arxiv.org/abs/2509.10147
[35] 🔍 Подробнее: https://habr.com/ru/articles/949286/
[36] 📜 Полная статья: https://arxiv.org/abs/2509.16198
[37] 🔍 Подробнее: https://habr.com/ru/articles/952550/
[38] 📜 Полная статья: https://arxiv.org/abs/2509.22653
[39] 💾 Код: https://github.com/Hu-chih-yao/see-point-fly
[40] 🔍 Подробнее: https://habr.com/ru/articles/947058/
[41] 📜 Полная статья: https://arxiv.org/abs/2506.08511
[42] реакции: http://www.braintools.ru/article/1549
[43] Источник: https://habr.com/ru/articles/956168/?utm_campaign=956168&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.