Агент UI-Ins от TongyiLab обошёл Gemini в тестах на AndroidWorld. ai.. ai. gemini.. ai. gemini. Блог компании BotHub.. ai. gemini. Блог компании BotHub. Будущее здесь.. ai. gemini. Блог компании BotHub. Будущее здесь. ИИ.. ai. gemini. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. ai. gemini. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение.. ai. gemini. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение.. ai. gemini. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное.. ai. gemini. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное. нейросети.
Агент UI-Ins от TongyiLab обошёл Gemini в тестах на AndroidWorld - 1

TongyiLab и исследователи из Renmin University of China представили нового интерфейсного агента UI-Ins, который умеет работать с мобильными приложениями и понимать смысл пользовательских действий. В отличие от большинства решений, он воспринимает команды не как набор кликов, а как задачу, требующую рассуждений и планирования.

Агент UI-Ins от TongyiLab обошёл Gemini в тестах на AndroidWorld - 2

UI-Ins анализирует контекст, строит гипотезы, оценивает последствия и только потом действует. Такой подход делает его устойчивее в реальных сценариях, где интерфейс может меняться, а приложение зависеть от состояния устройства.

Агент UI-Ins от TongyiLab обошёл Gemini в тестах на AndroidWorld - 3

В тестах AndroidWorld агент показал 74,1% успешных действий. Для сравнения, результат Gemini 2.5 Computer Use — 69,7%. Это серьёзный скачок в качестве, который демонстрирует потенциал reasoning-агентов, способных не просто выполнять команды, а думать над их смыслом.

Агент UI-Ins от TongyiLab обошёл Gemini в тестах на AndroidWorld - 4

UI-Ins выпускается в двух версиях:

UI-Ins-7Bлёгкая модель для тестирования и пользовательских сценариев

UI-Ins-32B версия с повышенной точностью и устойчивостью для сложных интерфейсов

Разработчики отмечают, что агент хорошо справляется с заполнением форм, навигацией по вкладкам, запуском и управлением приложениями. Фактически он приближается к роли универсального ассистента, который может действовать от имени пользователя.


Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Автор: cognitronn

Источник

Rambler's Top100