Робот-поводырь: как ИИ пришел туда, где раньше были только собаки и благотворительность

В сферу помощи людям с ограниченными возможностями венчурный капитал и топ-исследователи никогда не спешили. Слишком маленький рынок, сложный пользователь, долгая окупаемость. Но теперь ИИ-индустрия заходит на эту территорию всерьез — полноценным научным проектом на главной конференции года по искусственному интеллекту ^[1].

Команда Бингемтонского университета создала робота-поводыря с LLM внутри. В отличие от обычной собаки, он разговаривает с человеком по ходу маршрута: спрашивает, куда нужно, предлагает варианты пути, объясняет, что происходит вокруг. Работу представили в январе 2026 года на конференции AAAI в Сингапуре.

Само по себе появление такого робота — еще не сенсация: каждый месяц на конференциях по ИИ показывают десятки прототипов. Интересно вообще другое. Похожие проекты запускают по всему миру независимо друг от друга. Все используют практически одинаковое железо, похожие языковые модели и решают почти одну и ту же задачу.

Узнаем, как сфера социальных проектов для людей с ОВЗ становится новой индустрией и свежим плацдармом для инженерных вызовов.

Как роботы собак вытесняют

Робот за полторы тысячи долларов ведет слепого человека по офисному коридору, и по дороге они разговаривают.

Человек говорит: «Хочу пить».

Робот отвечает: «На этом этаже есть торговый автомат с бутылками воды и фонтан. До фонтана нужно пройти 40 метров через длинный коридор и зайти в дверь слева на кухню».

Человек выбирает. Робот ведет.

Робот-поводырь: как ИИ пришел туда, где раньше были только собаки и благотворительность - 2

Только что я описал реальный эксперимент команды Бингемтонского университета (SUNY, штат Нью-Йорк), представленный в начале 2026 года на конференции AAAI в Сингапуре.

Руководитель проекта — доцент Шики Чжан, специалист по общему искусственному интеллекту. Проект пришел из сферы автономного транспорта и языковых моделей, а не из систем помощи слепым.

Робот, который они используют — серийный Unitree Go2 с GPT-4 и алгоритмом планирования маршрутов внутри. Получилось устройство, которое работает как обычная собака-поводырь, но умеет разговаривать, обсуждать варианты пути и комментировать происходящее вокруг. К поводырю добавляется вербальная коммуникация — это и делает проект интересным.

Как проходил эксперимент?

В реальных тестах участвовали семь слепых людей в возрасте от 40 до 68 лет. Двое из них раньше работали с настоящими собаками-поводырями и объективно могли оценивать качество работы нового устройства.

В качестве среды для испытаний выбрали многокомнатный офис. Задача: добраться до конференц-зала на другом конце здания. Робот спрашивал, куда нужно идти, предлагал варианты маршрутов с расчетом времени, а пользователь делал выбор.

Параллельно с живым экспериментом провели симуляцию без участия слепых. Шестнадцать студентов сформулировали 77 запросов — от прямых («хочу в туалет») до расплывчатых («хочу посидеть и отдохнуть»). Систему проверили на устойчивость к плохому распознаванию речи: искусственно искажали почти каждый третий символ во входных фразах, имитируя шумную улицу или сбой микрофона. Робот все равно понимал, что от него хотят.

Итоговая точность определения цели — 94,8%. ^[2]

Но есть и обратная сторона: у участников эксперимента не хватало полноценного доверия к роботу, особенно у тех, кто уже взаимодействовал с традиционными поводырями. По их словам, алгоритм быстро понимает, чего от него хотят, и красиво проговаривает план, но все равно не хватает ощущения в духе «рядом со мной живое существо, которое не подведет». Доверие пока самое слабое место проекта.

Исследователи в разных частях света начинают идти одной дорогой

Уже несколько лет в Университете Глазго существует проект RoboGuide — ИИ-квадрупед для навигации в общественных пространствах вроде музеев и торговых центров. Платформа реализации та же — линейка Unitree, начинали со старшей модели Go1 за $2,700, постепенно перешли на более дешевые версии. В данном случае команда сразу работала с реальной городской средой.

Точно такой же проект реализуют в Аризонском университете (лаборатория LENS Lab) под руководством энтузиаста и ученого Рансалу Сенанаяке. Работают с тем же Unitree Go2.

В Сингапуре, в Национальном университете, создали еще более интересный проект — RDog, систему немного другой философии. Здесь вместо голосовой связи сделали ставку на физическое ощущение через рукоятку, тактильные сигналы и заблаговременные голосовые подсказки. В сравнительных тестах с белой тростью (обычный девайс слепого), «умной» тростью (носимый гаджет-помощник с ИИ и камерами) и RDog последний показал более быструю и плавную навигацию, меньше столкновений и меньшую когнитивную нагрузку на пользователя.

Робот-поводырь: как ИИ пришел туда, где раньше были только собаки и благотворительность - 3

В Китае история со слепыми разворачивается в масштабе национальной политики. Недавно выявилась проблема: на страну с примерно 10 миллионами слепых приходится всего около 400 собак-поводырей. Фактическая доступность — одна на 25 тысяч человек.

В июле 2025 года Федерация инвалидов Китая (CDPF) объявила, что страна продвигает высокотехнологичные решения для людей с инвалидностью, включая бионические протезы и роботов-поводырей. Программа предполагает сотрудничество государственных ведомств, университетов и технологических компаний. Идут активные тесты и внедрения с участием слепых (проекты Сяосуань, Daystar Bot GS, шестиногий робот SJTU и другие).

Практически во всех проектах заметны общие черты. За основу робота берут Unitree Go2, иногда прошлую модель Go1. Никто в принципе не делает робота с нуля. Для сравнения: похожий по характеристикам Spot от Boston Dynamics стоит 74500 $ — в 46 раз дороже, и при этом без встроенного софта для подобных задач, программу все равно пришлось бы писать с чистого листа.

Десять лет назад «робот-поводырь» означал научный ^[3] проект на миллионы долларов, где разрабатывали и корпус, и механику. Сегодня это сборка из готовых деталей.

Поверх ставят большую языковую модель, доступную любому разработчику — чаще GPT-4 или ее аналоги. Никто не тренирует специальный «ИИ для слепых». Берут общую модель и подстраивают под задачу. В некоторых проектах появляются более сложные решения — например, в Guide-LLM из Глазго, где ИИ работает с картой здания, превращенной в текст, замечает опасности вроде таблички «осторожно, мокрый пол» и предлагает обойти их другим маршрутом. Но даже это надстройка над общим, общедоступным ИИ, а не отдельная разработка.

Тестируют все это уже не в лабораториях. RDog ходит по офисам и улицам Сингапура, команда из ASU работает над уличным режимом, Глазго — с реальными общественными пространствами, а в Китае все это оформляется как часть городской инфраструктуры.

Если собрать картину целиком, видно: речь уже не про разрозненные эксперименты в разных университетах. Это сложение одинаковых компонентов по одинаковой логике ^[4] в разных точках мира — дешевое железо, общедоступный ИИ, реальная среда. Так выглядит зарождающаяся индустрия. И поднимают ее обычные технологические команды, которые увидели в задаче инженерный вызов (хотя заниматься этим в первую очередь должны благотворительные фонды и государства).

Что мешало развивать технологию раньше?

Все ключевые компоненты существуют уже давно. Unitree выпустила первого доступного четвероногого робота Go1 в 2021 году. GPT-3, который умел вести связный диалог, появился в 2020-м. Массовые LiDAR-камеры стали обычным делом к 2022-му. Соединить эти три части и получить разговаривающего робота-поводыря технически можно было еще три-четыре года назад. Но никто этого не делал.

Почему? Ответ прост и неудобен. Все это время таланты и деньги ИИ-индустрии шли в другие направления: рекламные алгоритмы, рекомендательные ленты, генерация картинок, чат-боты для бизнеса, ассистенты-копирайтеры. Туда, где рынок — миллиарды зрячих пользователей с подписками и кошельками, а не сотни миллионов слепых и слабовидящих, у большинства которых нет даже обычной собаки-поводыря. Технологии идут за деньгами.

Робот-поводырь: как ИИ пришел туда, где раньше были только собаки и благотворительность - 4

Но что изменилось именно сейчас?

Рынок и капитализация ИИ ширится к стадии сюрреализма и пока не спешит останавливаться. Люди — от рядовых пользователей до венчурных инвесторов — несут огромные деньги, оценки IPO бьют рекорды. Кажется, денежная масса, стремящаяся к ИИ, скоро начнет конкурировать с массой Земли.

Но есть несколько причин, почему в рынке инклюзивных ИИ-технологий появились перспективы.

Другие рынки постепенно пресыщаются

На рекламных алгоритмах и рекомендательных лентах уже сидят все, кому это интересно: Google, Meta, ByteDance и десятки специализированных компаний. Чат-боты для бизнеса делает каждый второй стартап. Генерировать картинки умеют практически все.

Если вы ИИ-исследователь или инвестор и ищете, куда вложить силы и деньги в следующие год-два, очевидных свободных направлений с большим хайпом и реальным эффектом осталось немного. Социальная сфера в этом коротком списке есть.

Изменилась логика работы самих лабораторий

Когда ИИ был дефицитом, академические команды решали красивые задачи: победить человека в го, сгенерировать фотореалистичное лицо, написать стихи. Это давало известность, цитирование и деньги на следующий грант.

Сейчас этими задачами уже никого не удивишь. На верхушке исследовательской пирамиды начался обратный сдвиг: теперь важно делать осмысленно. ИИ решает ранее неприступные математические задачи, ускоряет поиск лекарств и новых материалов, берет на себя куски инженерной рутины, управляет роботами и постепенно становится интерфейсом между человеком и сложной средой.

Пришла мода на «воплощенный ИИ» (embodied AI)

Несколько лет языковые модели жили внутри экрана: чат, текст, картинка. Следующий очевидный шаг — переместить их в физический мир. Робот-поводырь, кажется, станет одним из таких кейсов. Задача понятная, социально одобряемая, регуляторных барьеров почти нет (это не дрон-доставка и не автономный грузовик). Технологически интересный челлендж, и при этом морально безопасная площадка для экспериментов. Такое Кремниевая долина не могла пропустить.

Все три причины работают одновременно

И ни одна из них на самом деле не про доброту: в реальной истории технологий мотивы редко бывают святыми. Но вторичной выгодой от наработок становится инклюзивность — и сфера двинется дальше, к глухим, маломобильным и другим людям с ОВЗ.

Распознавание речи давно работает в смартфонах, перевод жестового языка идет как отдельное исследовательское направление, носимые устройства с ИИ-фильтрацией шума постепенно выходят на рынок. По той же логике: дешевое железо плюс общая модель плюс реальная среда. Маломобильные получат экзоскелеты, умные кресла, роботизированных помощников по дому. Пожилым в изоляции достанутся компаньоны, телеприсутствие, ИИ-консьержи, которые умеют распознать, когда что-то пошло не так. Сюда же — люди с когнитивными нарушениями: ассистенты памяти ^[5], навигаторы по повседневности. Везде тот же шаблон, который мы разобрали на роботе-поводыре. И во многих направлениях работа уже идет, просто известно о них меньше (без эффекта AAAI).

Какие выводы можно сделать?

А такие.

Помощь людям с ОВЗ обычно относится к зоне ответственности государства, фондов или волонтеров. Теперь на эту территорию врываются технологические команды с другими сильными и слабыми сторонами. Сильные — масштаб, цена, скорость итераций. Одно рабочее решение можно развернуть на миллион пользователей по цене смартфона.

Слабые — обезличенность, отсутствие эмоциональной связи, плохое понимание конкретного человека. Социальный работник знает о своем подопечном больше, чем любая модель когда-либо узнает. Робот за 1600 $ не знает ничего, но умеет безупречно делать то, что его попросят, при минимальных затратах на внедрение.

До сих пор социальная помощь работала в основном наоборот: знала много, но была в дефиците. Государство, НКО и волонтеры всегда упирались либо в деньги, либо в людей. Технология упирается в другое: в качество понимания контекста, надежность и безопасность.

Это другой класс проблем, и решать их будут другие люди. Раньше над проблемой слепоты работали врачи, реабилитологи, тренеры собак, социальные работники. Теперь к ним присоединились инженеры в Бингемтоне, Глазго, Сингапуре, Аризоне и Шэньчжэне. Не вместо первых, а рядом с ними, и постепенно все эффективнее.

Хорошо это или плохо — разговор отдельный. Логику, впрочем, отрицать сложно. Социальная сфера покидает территорию только социальной сферы. И спорить с этим будут не на конференциях по реабилитации, а в офисах продуктовых команд.

А мы посмотрим, что получится.

Автор: Andvecher

Источник ^[6]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/30337

URLs in this post:

[1] интеллекту: http://www.braintools.ru/article/7605

[2] : https://studyfinds.com/robot-guide-dog/

[3] научный: http://www.braintools.ru/article/7634

[4] логике: http://www.braintools.ru/article/7640

[5] памяти: http://www.braintools.ru/article/4140

[6] Источник: https://habr.com/ru/companies/ru_mts/articles/1035652/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1035652

Нажмите здесь для печати.