- BrainTools - https://www.braintools.ru -

Fara-7B: компактная модель ИИ от Microsoft

Fara-7B: компактная модель ИИ от Microsoft - 1

Fara-7B – компактная система искусственного интеллекта [1], предназначенная для автоматизации пользовательских интерфейсов исключительно на основе визуального ввода. Несмотря на скромные размеры, модель способна конкурировать с более сложными системами, работая полностью локально на потребительских устройствах.

Разработанная на базе Qwen2.5-VL-7B от Alibaba, Fara-7B, по данным Microsoft, использует исключительно визуальную информацию. Вместо анализа DOM-дерева или HTML-кода модель работает напрямую со скриншотами интерфейса по принципу «наблюдай-думай-действуй»: она прогнозирует координ��ты кликов и генерирует нажатия клавиш. Для принятия решений система использует три последних скриншота, историю действий и пользовательский ввод.

Обладая всего 7 миллиардами параметров, Fara-7B достаточно легка для работы непосредственно на устройстве пользователя. Microsoft утверждает, что такой подход не только снижает задержки, но и повышает конфиденциальность, поскольку все данные обрабатываются локально.

Fara-7B: компактная модель ИИ от Microsoft - 2

Ключевой прорыв команды Microsoft — решение проблемы нехватки обучающих данных. Вместо трудоёмкого ручного сценария записи действий компания использовала синтетический конвейер генерации данных на собственной мультиагентной платформе Magentic-One. В этой системе агент-оркестратор составлял пошаговые планы, а агент WebSurfer их выполнял. В результате было собрано около 145 000 успешных сценариев общей сложностью в миллион шагов, которые затем были использованы для обучения [2] компактной Fara-7B.

Fara-7B: компактная модель ИИ от Microsoft - 3

Команда использовала собственную мультиагентную платформу Magentic-One [3] для автоматического создания решений задач. Агент Orchestrator составляет пошаговые планы, а агент WebSurfer их выполняет. Затем Microsoft собрала данные об успешных выполнениях задач – примерно 145 000 траекторий с общим количеством шагов в один миллион – и преобразовала их в более компактную модель Fara-7B.

Согласно внутренним тестам Microsoft, модель демонстрирует впечатляющие результаты для своего размера. В тесте WebVoyager показатель успешности Fara-7B составил 73,5%, что превышает результаты модели UI-TARS-1.5-7B и даже коммерческого GPT-4o от OpenAI в этой конкретной задаче. Независимая оценка, проведенная Browserbase с привлечением людей-экспертов, подтвердила высокую эффективность модели с показателем успешности 62%.

Fara-7B: компактная модель ИИ от Microsoft - 4

Особое внимание [4] Microsoft уделяет эффективности модели: Fara-7B в среднем выполняет задачи за 16 шагов, в то время как конкурирующие решения, такие как UI-TARS, требуют в среднем 41 шага. Это напрямую влияет на стоимость использования и скорость выполнения операций.

Fara-7B: компактная модель ИИ от Microsoft - 5

Делегируйте часть рутинных задач вместе с BotHub [5]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [6] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник [7]

Автор: MrRjxrby

Источник [8]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/22567

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] обучения: http://www.braintools.ru/article/5125

[3] мультиагентную платформу Magentic-One: https://the-decoder.com/microsoft-tests-ai-agents-that-can-order-shawarma-and-ask-humans-for-help/

[4] внимание: http://www.braintools.ru/article/7595

[5] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=COMPACT_AI_MODEL_FROM_MICROSOFT

[6] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[7] Источник: https://the-decoder.com/microsoft-unveils-fara-7b-a-compact-model-for-running-ai-driven-computer-control-locally/

[8] Источник: https://habr.com/ru/companies/bothub/news/971630/?utm_source=habrahabr&utm_medium=rss&utm_campaign=971630

www.BrainTools.ru

Rambler's Top100