- BrainTools - https://www.braintools.ru -
На связи снова Александр Панов, директор лаборатории когнитивных систем искусственного интеллекта [1] AIRI и Центра когнитивного моделирования в Институте искусственного интеллекта МФТИ.
Как и в прошлые разы, я хочу поделиться с вами впечатлениями [2] от конференции, в которой мне и моим коллегам по научной группе довелось принять активное участие. На этот раз речь пойдёт о крупнейшем научном событии в робототехнике — конференции ICRA 2026, проходившей с 1 по 5 июня в дождливой, но гостеприимной Вене.
Внутри много выжимок из статей и докладов, фото, а также видео с традиционного робопарада!

ICRA расшифровывается как International Conference on Robotics and Automation, то есть центральная тема — это робототехника и автоматизация. Серия с большой историей, я уже немного рассказывал про неё в прошлом репортаже про ICRA 2024, почитать можно тут [3].
Среди ключевых тем этого года — обучение [4] с подкреплением [5], глубокое обучение для перцепции, имитационное обучение, планирование движения и локализация. Конференция неумолимо трансформируется в площадку, посвященную обучаемым подходам, продолжая свою конкуренцию с молодой конференцией CoRL. Подавляющее большинство публикаций ожидаемо поступает из Китая и США, но и Россия тоже заметна на этом празднике роботов — отрадно, что почти половина отечественных статей в этом году подготовлена нашей научной группой. А вот на выставке (про неё ниже) — полное доминирование Китая, даже несмотря на то, что конференция проходит в Европе: 70 компаний из Китая, и по 20 из США, Германии и Австрии.
По доброй традиции показываю пакет участника:
Основной трек конференции длился три дня (со 2 по 4 июня), но мероприятие началось бодро с воркшопов, которых здесь собралось целых 70 штук на любой вкус [6] и цвет. Разумеется, всё не посетить, но про те, на которых я побывал, расскажу подробно.
Начну с воркшопа Generative Digital Twins for Real2Sim and Sim2Real Transfer in Robotics [7] с очень представительным составом участников. Тема улучшения симуляторов и внедрения в них генеративных моделей сейчас критически важна в эпоху слабого масштабирования потока данных с реальных демонстраций.
Открывал день Hengshuang Zhao [8] из Гонконга с беглым обзором техник анализа и синтеза 3D‑реконструкций и облаков точек для VLA. Из мощного у них выделяются PointWorld [9] (масштабирование 3D‑моделей для задач манипуляции) и PlayerOne [10] (генерация симуляционного видео по картинке от первого лица). Не обошлось и без обсуждения VLA: были представлены Any3D‑VLA [11] для повышения стабильности работы моделей и свежая DreamAvoid [12] про test‑time планирование для избегания ошибок стратегии.
Затем выступил Steve Xie [13], CEO компании Lightwheel [14], создающей симуляционные среды на заказ. Он справедливо упирал на то, что для манипуляционной робототехники нужно в 1000 раз больше данных, чем для беспилотников, и симуляция — это единственный масштабируемый путь для обучения и оценки физического ИИ. Из открытых исследований его команды стоит отметить LeHome [15] про симуляцию работы с деформируемыми объектами.
Невероятно производительный Jiajun Wu [16] (в этом году у него 6 статей только на ICRA!) рассказывал про физически правдоподобных цифровых двойников. Он выделил две основные парадигмы:
Самоконтролируемое обучение с дифференцируемыми симуляторами (тут крутая работа NEUROK [17] про генеративную кинематику).
Преобразование состояний из видеомоделей в 4D‑представления с помощью гибридных нейрофизических симуляторов (например, World of Dynamic Objects [18] и генератор сцен по одному изображению WonderPlay [19]).
Отличный доклад прочитал Ajay Mandlekar [20] из NVIDIA, представив SimFoundry [21], — систему для автоматического создания цифровых двойников и аналогов сцен на основе видеоданных реального мира. Также он упомянул расширение области применения симуляций с помощью SoftMimicGen [22] для деформируемого манипулирования и Humanoid Generation [23] для локомоции. Обе работы основаны на ранней модели MimicGen [24], решающей проблему генерации синтетических данных по небольшому числу демонстраций.
В конце этого воркшопа Manolis Savva [25] затронул программную генерацию 3D‑представлений (работы SceneMotifCoder [26], SINGAPO [27] и iTACO [28]), а Ingmar Posner [29] из Оксфорда порадовал докладом про объектно‑центричные модели мира, особенно выделив работу SPARTAN [30] со специальным вариантом разреженной матрицы внимания [31] для лучшего моделирования причинно‑следственных отношений.
Также я заглянул на Workshop on Reinforcement Learning in the Era of Imitation Learning [32]. Гвоздями программы там были Сергей Левайн и Челси Финн, выступавшие онлайн. Сергей описывал симбиоз между специализированными алгоритмами (фреймворк SeRL [33]) и универсальными моделями (фреймворк RLT [34]), а также использование обуславливания без классификатора (CFG [35]) для создания моделей pi0.6 и pi0.7. Челси делилась рецептом итеративного офлайн‑обучения с подкреплением для задач с длинным горизонтом (на примере варки эспрессо процент успеха вырос с 40% до 90%). Её аспирант Perry Dong представил алгоритмы EXPO [36] и EXPO‑FT [37], предназначенные для стабильного онлайн‑дообучения диффузионных стратегий всего на 19 минутах данных.
В первый день ещё успели провести и открытие конференции с разнообразной занимательной статистикой. Например, что из почти 5К статей отобрали 1.8К — уровень принятия традиционно довольно высокий, выше 30%.
В этот день началась сверхплотная программа: одновременно шли постерные сессии (по 500 постеров 2 раза в день), короткие кейноуты от заслуженных ученых, панельные дискуссии и технические доклады. А помимо всего тут ещё шла выставка на 100+ компаний. Постерные сессии были организованы хорошо — немножко тесновато, но зато много места для самого постера, есть столики поставить своего робота, ноутбук с демонстрацией или просто расположить чай/кофе.
Утро открылось пленарным докладом оригинального Ken Goldberg [38] с темой “A Tale of Two Cultures: Can Agentic Coding Close the Gap?”. Его главный посыл заключался в том, что старую добрую инженерию нужно правильно сочетать [39] с современными VLA‑моделями на больших данных. Он продвигал агентное кодирование CaP‑X [40] и бенчмарк Libero‑Pro [41]. Кен подчеркнул, что VLA‑модели резко теряют устойчивость при увеличении вариативности условий, поэтому их нужно подкреплять инженерными структурами, а успех такого гибридного подхода он продемонстрировал на примере проекта Dex‑Net [42], переросшего в коммерческую систему AmbiSort.
На кейноутах были короткие выступления по теме навигации в стиле стендапа. Первый спикер Johannes Betz [43] из TUM рассказал про сверхбыструю навигацию гоночных беспилотников Формулы-1 на скоростях за 200 км/ч (советую их обзор Foundation Models in Autonomous Driving [44]). Aniket Bera [45] из Purdue University обсудил безопасную навигацию в неструктурированной среде (работы FlashSLAM [46] и SELP [47]), подчеркнув, что LLM должны быть лишь источником предложений, а не конечным арбитром безопасности. Hesheng Wang [48] показал применение 4D‑реконструкции динамических сцен и семантического SLAM в работах ARFlow [49] и когнитивных графах [50].
На сессии финалистов на лучшие статьи (award finalists) были представлены отлично проработанные работы:
Uncertainty Comes for Free [51] — использование оценки неопределенности диффузионных моделей для масштабируемого запроса помощи от человека (вместо постоянного human‑in‑the‑loop).
IMR‑LLM [52] — автоматическая генерация графа операций для промышленного планирования с помощью LLM с возможностью верификации формальным солвером.
ETac [53] — легкий и эффективный симулятор тактильного взаимодействия, позволяющий обучать стратегии манипуляции только на тактильной обратной связи.
Ro‑To‑Go! [54] — нейросимвольный подход с использованием сигнальной темпоральной логики для реактивного управления роботом в динамической среде.
В этот день мы не только смотрели чужие постеры, но и представляли свой: Knowledge‑Guided Manipulation Using Multi‑Task Reinforcement Learning [55]. Наш метод объединяет 3D‑графы знаний сцены с RL, что критически помогает не забывать [56] нужную информацию в ситуациях с частичной наблюдаемостью.

Вечером я заглянул на собрание членов сообщества IEEE RAS (членом которого я, кстати, являюсь), где обсуждали влияние ИИ на написание статей. Провели прямо тут на месте несколько онлайн опросов — больше посмеяться и для создания видимости участия в принятии решений 😉. Было принято полезное решение ввести ИИ‑валидацию поданных публикаций и протестировать ассист ИИ‑рецензента, как на ведущих конференциях типа AAAI (кстати, в феврале я делал [57] репортаж оттуда).
Третий день стал экватором конференции. На сессии финалистов вновь отметились сильные работы:
Dexora [58] — open‑source VLA для телеоперации с задержкой 11 мс, где товарищи применяют кинематическую фильтрацию для отбора «хороших» траекторий.
Robotic Dexterous Manipulation Via Anisotropic Friction Modulation Using Passive Rollers [59] — оригинальный схват с пассивными роликами на пальцах, позволяющий делать сложные манипуляции вроде скручивания колпачков.
Bi‑Adapt [60] — эффективная few‑shot адаптация бимануальных манипуляций для неизвестных категорий объектов с использованием семантического соответствия.
OmniRetarget [61] — переразметка демонстраций от человека к гуманоидам на основе интерактивного мэша с сохранением физических контактов.
Push Anything [62] — онлайн‑моделирование и планирование контактов для сложных задач толкания объектов.
Design and Implementation of an Angle‑Bisecting Foot Mechanism for a Leg‑Wheel Transformable Robot [63] — классическая разработка трансформируемого робота с ногами и колесами.
Пленарный доклад Barbara Mazzolai [64] про биологически правдоподобных роботов (растущие корни, мягкие щупальца) был зрелищным, но после первого удивления приходит резонный вопрос — зачем все так усложнять и нужно ли такое прямой подражание [65]? Тем не менее, её аргументы о высокой энергоэффективности организмов и проблеме электронных отходов при массовом внедрении роботов звучат более чем резонно.

На послеобеденных кейноутах Jeannette Bohg [66] (доклад “Do We Still Need Dexterous Hands?”) аргументировала критическую необходимость пятипалых антропоморфных рук для тонкой работы с инструментами, показав технологию SimToolReal [67]. Следом Nikos Tsagarakis [68] представил концепции реконфигурируемых модульных роботов, которые обеспечивают гибкость в неструктурированных промышленных условиях. Больше послушать не успел.
Мы утром презентовали еще одну свою работу — Dynamic Neural Potential Field: Online Trajectory Optimization in Presence of Moving Obstacles [69]. Наш метод генерирует потенциальное поле с помощью нейросети и передает градиент в функцию MPC, что позволяет строить безопасные и гладкие траектории объезда препятствий в реальном времени.
Наконец, дошла очередь до выставки. Огромное количество антропоморфных роботов и пятипалых схватов с тактильными датчиками подтверждает, что манипуляция — абсолютный тренд современности, хотя действительно полезных прикладных кейсов пока демонстрируется немного.
Не обошлось и без традиционного робопарада:
В заключительный день основной программы пленарный доклад читал заслуженный Roland Siegwart [71] из ETH с впечатляющим индексом Хирша — 155. Он рассказал об эволюции воздушной робототехники: от рекордов автономного полета в 81 час до будущих омнидирекциональных дронов, способных безопасно выполнять физический контакт (инспекция, рисование, фрезерование на поверхностях).
Разнообразные кейноуты открыл David Hsu [72] из Сингапура. Его центральная идея заключалась в гибридизации структурированных представлений (MDP, формальные языки) с LLM для безопасного принятия решений роботами в открытом мире (на примере ApBot [73]). Эту же мысль продолжила Stefanie Tellex [74] из Brown University, отметив, что параметризованные навыки и языки типа PDDL повышают объяснимость и переносимость в сравнении с нестабильными end‑to‑end моделями. Noémie Jaquier [75] из Швеции погрузилась в индуктивные смещения на основе геометрии и многообразий (SO(3), SE(3)), улучшающие стабильность моделей. В заключении Paolo Robuffo Giordano [76] показал, как введение «трубок неопределенности» и робастный MPC улучшают переносимость стратегий из симуляции в реальность.
Из устных докладов по «обычным» статьям c сессии Robotic Learning II, где я успел побывать, я бы отметил:
SVR‑GS [77] — рендеринг вероятностных масок для ускорения 3D Gaussian Splatting в 5 раз при минимальной потере качества.
TADPO [78] — дистилляция действий планировщика в реактивный RL‑контроллер для устойчивой навигации по бездорожью.
Learning Problem Decomposition for Efficient Sequential Multi‑Object Manipulation Planning [79] — извлечение замкнутых циклов и подзадач из демонстраций для эффективного мульти‑объектного планирования.
Motion Generation for Modular Robots Using Hierarchical Policies — оригинальная работа с модульными роботами обучение иерархических стратегий для них. Для MoonBot с различными конфигурациями обучают элементарные способности модулей и на их основе синтезируют стабильные целостные движения, преодолевая рост размерности действий и нестабильность.
В IEEE любят друг друга награждать разными дипломами и грамотами. Организаторы пожертвовали обедом ради церемонии награждения лучших статей. Вот победители:
Секция автоматизации: уже упомянутая IMR‑LLM [52].
Секция обучения: Do You Know Where Your Camera Is?
Секция взаимодействия с человеком: HEXAR [80].
Секция механизмы и дизайн: Relaxation Dynamics… [81]
Секция медицинские роботы — Geometry‑Aware… [82]
Секция мультироботов: Dynamics Modeling… [83]
Секция манипуляции и локомоции: финалист OmniRetarget [61].
Секция перцепции: FindAnything [84].
Секция сервисных роботов: Planar‑Sector… [85]
Отдельно хотел бы поздравить команду Центра робототехники Сбера, которая заняла на местном соревновании [86] от AgiBot по VLA моделям для разных манипуляционных задач заняли третье место! Молодцы🎉!

В завершающий день были воркшопы самой разной тематики: от космических роверов до VLA моделей. Я, конечно, выбрал парочку, которые связаны с последними.
На воркшопе Bridging the Gap between Robot Learning and Human‑Robot Interaction [87] Erdem Bıyık [88] из USC объяснял, что коллаборативный робот должен выстраивать двунаправленную коммуникацию, похожую на ту, как люди учат друг друга (отмечу его работы Hand me the data [89] и Robometer [90]). Под занавес конференции Roberto Martín‑Martín [91] из Техаса презентовал систему MIcobot и оригинальные датасеты робо‑фейлов (OopsieBench и DamageSim) в среде OOPSIVERSE.
Самым насыщенным стал воркшоп From Data to Decisions: VLA Pipelines for Real Robot [92], собравший спикеров из Toyota, Boston Dynamics, NVIDIA и Physical Intelligence. Masha Itkina [93] из Тойоты подробно разбирала правильную статистическую оценку VLA‑стратегий с помощью метрики NSCORE (Beyond Binary Success [94]) и двухстадийный детектор фейлов FAIL‑Detect [95]. Из устных докладов также порадовали MolmoB0T [96] (миллионы симуляционных демонстраций и модели на основе pi0) и Humanoid Everyday [97] (огромный набор бытовых данных от первого лица для гуманоидов).
Великолепный доклад сделал Yuke Zhu [98] из NVIDIA про использование видеогенеративных моделей в качестве нейросимуляторов для обучения VLA. Он показал работы DreamZero [99] и DreamDojo [100], использующие огромный масштаб эго‑скейл данных (500+ часов телеоперации). Затем Alberto Rodriguez [101] поделился инсайдами из Boston Dynamics о разработке Atlas для сборочных линий Hyundai. Их главные выводы: отличный VR‑интерфейс телеоперации и демонстрации интервенций в стиле DAgger решают больше, чем простое масштабирование данных (успех укладки деталей достиг 90% при бюджете всего в 10 часов данных).
Завершил программу Karl Pertsch [102] из Physical Intelligence, рассказав про Steerable VLA [103] — методы подправления ошибающейся модели на фазе инференса через инструкции, изображения или траектории (как это реализовано в pi0.7).
И на этом мы прощаемся с ICRA 2026 и с Веной. Очень гостеприимный город и уже практически привычная площадка, куда отлично вписалась огромнейшая выставка и куда в целом удобно приезжать как с Азии, так и с Америки. Прогресс робототехники здесь ощущается в полной мере, будем и мы в этот прогресс вкладывать по мере сил🦾

Автор: grafft
Источник [104]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/31781
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] впечатлениями: http://www.braintools.ru/article/2012
[3] тут: https://habr.com/ru/companies/airi/articles/817499/
[4] обучение: http://www.braintools.ru/article/5125
[5] подкреплением: http://www.braintools.ru/article/5528
[6] вкус: http://www.braintools.ru/article/6291
[7] Generative Digital Twins for Real2Sim and Sim2Real Transfer in Robotics: https://awesomedigitaltwin.github.io/2026_ICRA.html
[8] Hengshuang Zhao: https://scholar.google.com/citations?user=4uE10I0AAAAJ&hl=en&oi=ao
[9] PointWorld: https://arxiv.org/html/2601.03782v1
[10] PlayerOne: https://arxiv.org/abs/2506.09995
[11] Any3D‑VLA: https://arxiv.org/abs/2602.00807
[12] DreamAvoid: https://arxiv.org/abs/2605.11750
[13] Steve Xie: https://www.linkedin.com/in/stevexiecbs/?isSelfProfile=false
[14] Lightwheel: https://lightwheel.ai/
[15] LeHome: https://arxiv.org/abs/2604.22363
[16] Jiajun Wu: https://scholar.google.com/citations?user=2efgcS0AAAAJ&hl=en&oi=ao
[17] NEUROK: https://jiajunwu.com/papers/neurok_cvpr.pdf
[18] World of Dynamic Objects: https://yanzhelyu.github.io/chord/
[19] WonderPlay: https://kyleleey.github.io/WonderPlay/
[20] Ajay Mandlekar: https://scholar.google.com/citations?user=MEz23joAAAAJ&hl=en
[21] SimFoundry: https://openreview.net/forum?id=s0YXBjERQh
[22] SoftMimicGen: https://arxiv.org/abs/2603.25725
[23] Humanoid Generation: https://arxiv.org/abs/2605.27724
[24] MimicGen: https://arxiv.org/abs/2310.17596
[25] Manolis Savva: https://scholar.google.com/citations?user=4D2vsdYAAAAJ&hl=en&oi=ao
[26] SceneMotifCoder: https://arxiv.org/abs/2408.02211
[27] SINGAPO: https://openreview.net/forum?id=OdMqKszKSd
[28] iTACO: https://arxiv.org/pdf/2506.08334?
[29] Ingmar Posner: https://scholar.google.com/citations?user=dPk-iwsAAAAJ&hl=en&oi=ao
[30] SPARTAN: https://proceedings.neurips.cc/paper_files/paper/2025/hash/e2c33c1753e1f1924f5560b11fc4444f-Abstract-Conference.html
[31] внимания: http://www.braintools.ru/article/7595
[32] Workshop on Reinforcement Learning in the Era of Imitation Learning: https://rl4il-icra.github.io/#schedule
[33] SeRL: https://arxiv.org/abs/2401.16013
[34] RLT: https://www.pi.website/research/rlt
[35] CFG: https://arxiv.org/abs/2505.23458
[36] EXPO: https://arxiv.org/abs/2507.07986
[37] EXPO‑FT: https://arxiv.org/abs/2605.25477
[38] Ken Goldberg: https://scholar.google.com/citations?user=8fztli4AAAAJ&hl=en&oi=ao
[39] правильно сочетать: https://www.science.org/doi/full/10.1126/scirobotics.aea7390
[40] CaP‑X: https://arxiv.org/abs/2603.22435
[41] Libero‑Pro: https://arxiv.org/abs/2510.03827
[42] Dex‑Net: https://www.science.org/doi/full/10.1126/scirobotics.aau4984
[43] Johannes Betz: https://scholar.google.com/citations?user=6cuqviYAAAAJ&hl=en&oi=ao
[44] Foundation Models in Autonomous Driving: https://ieeexplore.ieee.org/abstract/document/11370877
[45] Aniket Bera: https://scholar.google.com/citations?hl=en&user=q3UdHk4AAAAJ
[46] FlashSLAM: https://arxiv.org/abs/2412.00682
[47] SELP: https://arxiv.org/pdf/2409.19471
[48] Hesheng Wang: https://scholar.google.com/citations?user=q6AY9XsAAAAJ&hl=en&oi=ao
[49] ARFlow: https://openreview.net/forum?id=iJ7cyttpVj
[50] когнитивных графах: https://ieeexplore.ieee.org/abstract/document/11278513/
[51] Uncertainty Comes for Free: https://arxiv.org/abs/2503.01876
[52] IMR‑LLM: https://arxiv.org/abs/2603.02669
[53] ETac: https://arxiv.org/abs/2604.20295
[54] Ro‑To‑Go!: https://arxiv.org/abs/2503.05792
[55] Knowledge‑Guided Manipulation Using Multi‑Task Reinforcement Learning: https://arxiv.org/abs/2603.24083
[56] забывать: http://www.braintools.ru/article/333
[57] делал: https://habr.com/ru/companies/airi/articles/993572/
[58] Dexora: https://arxiv.org/abs/2605.18722
[59] Robotic Dexterous Manipulation Via Anisotropic Friction Modulation Using Passive Rollers: https://arxiv.org/abs/2603.27452
[60] Bi‑Adapt: https://arxiv.org/abs/2602.08425
[61] OmniRetarget: https://arxiv.org/abs/2509.26633
[62] Push Anything: https://arxiv.org/abs/2510.19974
[63] Design and Implementation of an Angle‑Bisecting Foot Mechanism for a Leg‑Wheel Transformable Robot: https://rasevents.org/presentation?id=174956&sessionId=29732
[64] Barbara Mazzolai: https://scholar.google.com/citations?user=x4jb-YgAAAAJ&hl=en&oi=ao
[65] подражание: http://www.braintools.ru/article/5584
[66] Jeannette Bohg: https://scholar.google.com/citations?user=rjnJnEkAAAAJ&hl=en&oi=ao
[67] SimToolReal: https://arxiv.org/abs/2602.16863
[68] Nikos Tsagarakis: https://scholar.google.com/citations?user=-ykAQ-0AAAAJ&hl=en&oi=ao
[69] Dynamic Neural Potential Field: Online Trajectory Optimization in Presence of Moving Obstacles: https://arxiv.org/abs/2410.06819
[70] канал: https://t.me/ai_panov/2784
[71] Roland Siegwart: https://scholar.google.com/citations?user=MDIyLnwAAAAJ&hl=en&oi=ao
[72] David Hsu: https://scholar.google.com/citations?user=S9LHLKEAAAAJ&hl=en&oi=ao
[73] ApBot: https://arxiv.org/abs/2505.20424
[74] Stefanie Tellex: https://scholar.google.com/citations?user=Pd8-ju0AAAAJ&hl=en&oi=ao
[75] Noémie Jaquier: https://scholar.google.com/citations?user=j3rJXU4AAAAJ&hl=en&oi=ao
[76] Paolo Robuffo Giordano: https://scholar.google.com/citations?user=dpayTBUAAAAJ&hl=en&oi=ao
[77] SVR‑GS: https://arxiv.org/abs/2509.11116
[78] TADPO: https://arxiv.org/abs/2603.05995
[79] Learning Problem Decomposition for Efficient Sequential Multi‑Object Manipulation Planning: https://arxiv.org/abs/2408.06843
[80] HEXAR: https://arxiv.org/abs/2601.03070
[81] Relaxation Dynamics…: https://rasevents.org/presentation?id=174962&sessionId=29732
[82] Geometry‑Aware…: https://rasevents.org/presentation?id=171962&sessionId=29669
[83] Dynamics Modeling…: https://rasevents.org/presentation?id=176444&sessionId=29765
[84] FindAnything: https://arxiv.org/abs/2504.08603
[85] Planar‑Sector…: https://rasevents.org/presentation?id=176453&sessionId=29765
[86] соревновании: https://agibot-world.com/challenge2026
[87] Bridging the Gap between Robot Learning and Human‑Robot Interaction: https://sites.google.com/vt.edu/icra2026-learning-hri/
[88] Erdem Bıyık: https://scholar.google.com/citations?user=P-G3sjYAAAAJ&hl=en&oi=ao
[89] Hand me the data: https://arxiv.org/abs/2505.20455
[90] Robometer: https://arxiv.org/abs/2603.02115
[91] Roberto Martín‑Martín: https://scholar.google.com/citations?user=XOJE8OEAAAAJ&hl=en&oi=ao
[92] From Data to Decisions: VLA Pipelines for Real Robot: https://icra2026vlapipeline.github.io/
[93] Masha Itkina: https://scholar.google.com/citations?user=JAmTk5gAAAAJ&hl=en&oi=ao
[94] Beyond Binary Success: https://arxiv.org/abs/2603.13616
[95] FAIL‑Detect: https://arxiv.org/abs/2503.08558
[96] MolmoB0T: https://arxiv.org/abs/2603.16861
[97] Humanoid Everyday: https://arxiv.org/abs/2510.08807
[98] Yuke Zhu: https://scholar.google.com/citations?user=mWGyYMsAAAAJ&hl=en&oi=ao
[99] DreamZero: https://arxiv.org/abs/2602.15922
[100] DreamDojo: https://arxiv.org/abs/2602.06949
[101] Alberto Rodriguez: https://scholar.google.com/citations?user=AC93g9kAAAAJ&hl=en&oi=ao
[102] Karl Pertsch: https://scholar.google.com/citations?user=3oe0I0QAAAAJ&hl=en&oi=ao
[103] Steerable VLA: https://arxiv.org/abs/2602.13193
[104] Источник: https://habr.com/ru/companies/airi/articles/1047528/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1047528
Нажмите здесь для печати.