Как устроены world models, что показал Google на прошлой неделе и где это меняет gamedev и робототехнику
19 мая 2026 года на Google I/O разработчики DeepMind показали то, что неделей раньше казалось демкой для технотвиттера. Project Genie теперь умеет привязывать сгенерированный 3D-мир к реальным координатам Google Street View. Робот, который пока ездит только по виртуальному Сан-Франциско, сможет получить тренировочную сессию в Лондоне или Токио, не покидая дата-центр. И всё это — за деньги $200 в месяц на тарифе Google AI Ultra.
Директор по робототехнике NVIDIA: языковые модели — тупик, будущее за «моделями мира»
Джим Фан, директор по робототехнике NVIDIA, заявил о смене парадигмы в ИИ. Предсказание следующего слова — прошлый век. Новая цель — предсказание физических состояний мира.Суть в том, что современные VLA-модели для роботов строятся поверх языковых моделей, но большинство их параметров хранят знания («это лого Coca-Cola»), а не физику («наклонишь бутылку — жидкость прольётся»). Это архитектурный тупик.Аргумент от обезьяны: приматы водят гольф-кары, понимая язык хуже BERT. Треть коры мозга обрабатывает зрение, язык — компактная надстройка. Зрение замыкает сенсомоторику напрямую, без слов.
ИИ-ученые 2025: SR-Scientist, DeepEvolve и Kosmos — чем отличаются и зачем. И почему выстрелил Kosmos
В 2025-м на наших глазах складывается новый класс инструментов - ИИ-Ученые (AI-Scientist). Если раньше алгоритмы ИИ могли только генерировать идеи или перерабатывать уже известные решения, то современные системы умеют не просто придумывать гипотезы, но и реализовывать их на практике, тестировать и совершенствовать из раза в раз. Речь не просто про чат-боты и Co-Pilot’ы, речь про агентные системы, которые сами ставят гипотезы, пишут и исполняют код, проверяют результаты и накапливают опыт. В чем сутьВ науке есть 3 сложных момента:понять, что уже известно

