- BrainTools - https://www.braintools.ru -
Новый агент AI под названием Manus, разработанный китайским стартапом Monica, демонстрирует возможности решения сложных задач от планирования путешествий до финансового анализа без вмешательства человека. Хотя ранние демонстрации привлекли внимание [1], система остается в ограниченном выпуске, а ключевые технические детали не разглашаются.

Веб -сайт Manus [2] демонстрирует, как агент обрабатывает реальные задачи, показывая примеры его рабочего процесса от первоначального запроса до конечного результата. Примеры включают задачи, варьирующиеся от создания маршрута путешествия до построения панели управления.
Система работает с помощью текстовых подсказок — пользователи описывают, чего они хотят достичь, а Manus преобразует эти инструкции на естественном языке в выполненные задачи. Например, когда дается подсказка об анализе акций Tesla, система автоматически создает и публикует интерактивную панель мониторинга на общедоступном URL-адресе [3].
Соучредитель и главный научный [4] сотрудник Monica Ичао Пик Цзи объясняет в видеопрезентации, как Manus выходит за рамки традиционных чат-ботов и систем рабочих процессов. В отличие от инструментов, которые только предлагают предложения, Manus может выполнять действия напрямую через веб-интерфейсы. Название происходит от «Mens et Manus» (лат. «разум и рука»), что отражает его двойную способность планировать и выполнять веб-задачи — аналогично Operator от OpenAI [5] и Claude Computer Use от Anthropic [6].
По словам Моники, Manus превосходит функцию глубоких исследований OpenAI [7] на бенчмарке GAIA, который оценивает агентов AI на практических задачах. Однако компания мало что рассказала о своей базовой технологии, что затрудняет независимую проверку этих заявлений о производительности.
Первоначальное тестирование [9] показывает, что Manus работает как в стандартном, так и в высокопроизводительном режиме. Это говорит о том, что он использует модель рассуждений, похожую на Operator от OpenAI [10], которая улучшает качество вывода за счет дополнительного времени обработки [11]. Operator достигает этого с помощью модели o3, которая была настроена с помощью обучения с подкреплением [12] специально для веб-задач.
Пользователи поделились примерами на X, [13] демонстрирующими такие возможности, как автоматизированное редактирование подкастов. Реакция [14] была в основном положительной [15] , некоторые ранние тестировщики сравнивали его [16] с Deepseek [17] — еще одним китайским стартапом, который удивил отрасль, сравнившись с западными возможностями AI.
Перед разработкой Manus основатель Сяо Хун основал Monica в 2022 году [18], создав расширение браузера, которое интегрировало несколько языковых моделей для международных рынков. Стартап получил поддержку от известных китайских инвесторов ZhenFund и Tencent, а соучредитель Цзи Ичао поделился опытом [19], полученным в ходе его работы по созданию Peak Labs и разработке поисковой системы Magi.
Хун, известный как «Рэд», получил степень инженера-программиста в Университете науки и технологий Хуачжун (Huazhong University of Science and Technology, HUST). В его послужном списке — основание Nightingale Technology, где он разработал двух помощников с искусственным интеллектом [20] — «Yi Ban» и «Wei Ban», — которые привлекли более двух миллионов корпоративных пользователей.
South China Morning Post [21] сообщает, что неожиданный спрос привел к ранним ограничениям, поставив под сомнение возможности системы. Партнер по продукту Чжан Тао признает, что их инфраструктура была разработана только для демонстраций, описывая текущую версию как «все еще находящуюся в зачаточном состоянии, далекую от того, что мы стремимся предоставить в нашем конечном продукте».
Остаются вопросы о технологии, на которой работает Manus. Хотя система, скорее всего, основана на существующих больших языковых моделях (LLM), команда не уточнила, на каких именно. Похожие вопросы возникают и вокруг Deepseek, еще одной китайской компании ИИ, которая, как сообщается, использовала данные, сгенерированные OpenAI, для обучения [22].
В настоящее время система функционирует в режиме веб-превью, доступ к которому возможен только по приглашению, а в этом году планируется открыть исходный код некоторых частей технологии, что подтверждает ее принадлежность к разработкам с открытым исходным кодом.
Гонка за разработку автономных агентов AI продолжается, с переменным прогрессом в отрасли. OpenAI запустила свою систему Operator и новую многоагентную структуру под названием «Swarm» [23], хотя раннее тестирование Operator выявило значительные проблемы с надежностью [24].
Агент браузера [25] Google Mariner использует аналогичный подход, включая расширенные возможности планирования и несколько типов памяти [26]. Лидеры отрасли сохраняют оптимизм — и Хассабис из Google DeepMind, и Хуан из Nvidia [27] ожидают появления функциональных систем агентов в течение двух лет.
Однако исследователи безопасности подчеркивают осторожность. Недавние исследования показывают, что агентами ИИ можно манипулировать [28] , создавая особые риски, когда эти системы имеют доступ к персональным веб-сервисам и аккаунтам пользователей.
Источник [29]
Автор: dilnaz_04
Источник [30]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12963
URLs in this post:
[1] внимание: http://www.braintools.ru/article/7595
[2] -сайт Manus: https://manus.im/usecases
[3] общедоступном URL-адресе: https://pljclduq.manus.space/
[4] научный: http://www.braintools.ru/article/7634
[5] Operator от OpenAI: https://the-decoder.com/openais-operator-and-computer-using-agent-bring-autonomous-ai-agents-closer-to-reality/
[6] Claude Computer Use от Anthropic: https://the-decoder.com/anthropic-releases-updated-smarter-claude-haiku-3-5-and-sonnet-3-5-model/
[7] функцию глубоких исследований OpenAI: https://the-decoder.com/openais-deep-research-aims-to-compress-hours-of-online-research-into-minutes/
[8] лидерство: http://www.braintools.ru/article/1165
[9] тестирование: https://x.com/BugNinza/status/1898604141645324644
[10] Operator от OpenAI: https://the-decoder.com/some-examples-of-how-early-users-are-trying-to-use-chatgpts-operator/
[11] улучшает качество вывода за счет дополнительного времени обработки: https://the-decoder.com/study-shows-test-time-compute-scaling-is-a-path-to-better-ai-systems/
[12] с помощью модели o3, которая была настроена с помощью обучения с подкреплением: https://the-decoder.com/openais-o3-model-shows-major-gains-through-reinforcement-learning-scaling/
[13] примерами на X,: https://x.com/minchoi/status/1898399796991344884
[14] Реакция: http://www.braintools.ru/article/1549
[15] в основном положительной: https://x.com/ai_for_success/status/1898393871698301208
[16] сравнивали его: https://x.com/DeryaTR_/status/1898574779289894991
[17] Deepseek: https://the-decoder.com/deepseeks-language-models-could-deliver-massive-profits-even-priced-far-below-openai/
[18] основатель Сяо Хун основал Monica в 2022 году: https://hybrid-rituals.com/everything-we-know-about-the-founder-of-manus-ai-so-far/
[19] опытом: http://www.braintools.ru/article/6952
[20] интеллектом: http://www.braintools.ru/article/7605
[21] China Morning Post: https://www.scmp.com/tech/big-tech/article/3301547/was-manus-another-deepseek-moment-chinese-ai-agent-faces-doubts-after-rapid-rise-fame
[22] еще одной китайской компании ИИ, которая, как сообщается, использовала данные, сгенерированные OpenAI, для обучения: https://the-decoder.com/microsoft-and-openai-say-they-blocked-suspicious-accounts-possibly-linked-to-deepseek-last-fall/
[23] новую многоагентную структуру под названием «Swarm»: https://the-decoder.com/openai-introduces-experimental-multi-agent-framework-swarm
[24] раннее тестирование Operator выявило значительные проблемы с надежностью: https://the-decoder.com/some-examples-of-how-early-users-are-trying-to-use-chatgpts-operator
[25] Агент браузера: https://the-decoder.com/google-launches-gemini-2-0-focusing-on-ai-agents-and-multimodal-capabilities#three-specialized-ai-agents
[26] памяти: http://www.braintools.ru/article/4140
[27] Хассабис из Google DeepMind, и Хуан из Nvidia: https://the-decoder.com/what-comes-after-o1-openai-builds-multi-agent-research-team
[28] исследования показывают, что агентами ИИ можно манипулировать: https://the-decoder.com/ai-agents-can-be-easily-tricked-into-doing-stupid-things-study-says
[29] Источник: https://the-decoder.com/manus-ai-agent-could-be-the-next-deepseek-moment-for-western-ai-labs/
[30] Источник: https://habr.com/ru/companies/bothub/news/889426/?utm_source=habrahabr&utm_medium=rss&utm_campaign=889426
Нажмите здесь для печати.