- BrainTools - https://www.braintools.ru -

Google DeepMind прокачала мозги роботов. Встречаем Gemini Robotics-ER 1.6

Google DeepMind прокачала мозги роботов. Встречаем Gemini Robotics-ER 1.6 - 1

Google DeepMind выпустила крупное обновление своей модели воплощенного интеллекта [1] — Gemini Robotics-ER 1.6. Это не просто софт, а полноценный центр управления для робототехники, который отвечает за пространственное понимание, планирование задач и детекцию успеха, фактически выступая в роли «стратега». Важно понимать, что версия ER не управляет приводами напрямую — за моторные команды по-прежнему отвечает отдельная модель Gemini Robotics 1.5, в то время как новинка подсказывает ей последовательность действий и при необходимости вызывает внешние инструменты, включая Google Search.

Google DeepMind прокачала мозги роботов. Встречаем Gemini Robotics-ER 1.6 - 2

Одной из ключевых инноваций стала совместная работа с Boston Dynamics, в рамках которой модель научили интерпретировать аналоговые приборы. Теперь роботы, такие как Spot, могут обходить промышленные объекты и самостоятельно считывать данные с манометров, уровнемеров и цифровых табло. Это нетривиальная задача: модель сначала зумирует нужный участок снимка, затем расставляет точки по ключевым элементам шкалы и через код высчитывает пропорции, что позволяет достичь точности в 93% (против 86% без использования ризонинга).

Google DeepMind прокачала мозги роботов. Встречаем Gemini Robotics-ER 1.6 - 3

Кроме того, разработчики значительно подтянули базовые навыки: указание пиксельных координат стало точнее, улучшилась обработка отношений «от-до» и построение траекторий захвата. Модель стала гораздо эффективнее работать в мультикамерных сетапах, лучше сопоставляя виды с обзорной камеры и камеры на манипуляторе. Это критично для динамичных сцен: без надежной детекции завершения шага агент не понимает, нужно ли повторять [2] попытку или можно переходить к следующему этапу плана.

По части безопасности DeepMind заявляет о лучшем результате в линейке: новая Gemini на 10% точнее распознает травмоопасные ситуации на видео по сравнению с версией 3.0 Flash.

Фактически мы наблюдаем переход от простых алгоритмов к глубокому ризонингу, где робот не просто выполняет команду, а осознает контекст физического мира и соблюдает физические ограничения. Gemini Robotics-ER 1.6 уже доступна через Gemini API и Google AI Studio, а для быстрого старта компания подготовила Colab с примерами промптов для типовых задач.


Делегируйте часть рутинных задач вместе с BotHub! [3] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник [5]

Автор: cognitronn

Источник [6]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29088

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] повторять: http://www.braintools.ru/article/4012

[3] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=OPENAI_PLANS

[4] По ссылке: https://bothub.chat/?invitedBy=iTNi-351UcHgc1BxGFWim

[5] Источник: https://deepmind.google/blog/gemini-robotics-er-1-6/

[6] Источник: https://habr.com/ru/companies/bothub/news/1025738/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1025738

www.BrainTools.ru

Rambler's Top100