Новый продукт от OpenAI: что известно об инструменте на основе AI, который может управлять компьютером

OpenAI, возможно, близок к выпуску инструмента на основе AI, который может управлять вашим ПК и выполнять действия от вашего имени. Тибор Блахо, инженер-программист, известный тем, что точно предсказывает появление новых продуктов AI, утверждает ^[1], что обнаружил доказательства существования давно обсуждаемого инструмента Operator ^[2] от OpenAI. Ранее, в том числе ^[3] в Bloomberg, сообщалось ^[4] об Operator, который, как говорят, представляет собой «агентскую ^[5]» систему, способную автономно выполнять такие задачи, как написание кода и бронирование билетов.

Согласно ^[6] The Information, OpenAI планирует выпустить Operator в январе. Код, обнаруженный Blaho в эти выходные, подтверждает эту информацию.

По словам Блахо, в клиенте ChatGPT ^[7] от OpenAI для macOS появились скрытые на данный момент опции для определения сочетаний клавиш «Переключить оператора» и «Выключить оператора». По словам Блахо, OpenAI добавила ссылки на Operator на свой веб-сайт, хотя пока они не доступны публично.

По словам Блахо, сайт OpenAI также содержит еще не опубликованные таблицы, сравнивающие производительность Operator с другими компьютерными системами искусственного интеллекта ^[8]. Таблицы вполне могут быть заполнителями. Но если цифры точны, они предполагают, что Operator не надежен на 100%, в зависимости от задачи.

В OSWorld, тестовой системе, созданной для моделирования реальных условий работы компьютера, «OpenAI Computer Use Agent (CUA)», вероятно, модель искусственного интеллекта, которая лежит в основе Operator, демонстрирует результат в 38,1%, опережая модель управления компьютером ^[9] Anthropic, но значительно уступая на 72,4% людям. OpenAI CUA превосходит людей по результатам в WebVoyager, который оценивает способность AI перемещаться по веб-сайтам и взаимодействовать с ними. Но, согласно просочившимся в сеть результатам тестов, модель не дотягивает до показателей человеческого уровня в другом веб-тесте WebArena.

Operator также сталкивается с трудностями при выполнении задач, которые человек мог бы выполнить легко, если верить утечке. В тесте, в ходе которого требовалось зарегистрироваться у облачного провайдера и запустить виртуальную машину, Operator добивался успеха только в 60% случаев. При создании биткоин-кошелька Operator добивался успеха только в 10% случаев.

Неизбежное появление OpenAI на рынке AI-агентов происходит на фоне того, что конкуренты, в том числе вышеупомянутая Anthropic, Google ^[10] и другие, борются за зарождающийся сегмент. AI-агенты могут быть рискованными и спекулятивными ^[11], но технологические гиганты уже рекламируют их как следующую большую вещь ^[12] в сфере AI. По данным ^[13] аналитической компании Markets and Markets, к 2030 году рынок AI-агентов может составить 47,1 миллиарда долларов.

Сегодняшние агенты довольно примитивны. Но некоторые эксперты обеспокоены их безопасностью в случае стремительного развития технологий.

На одной из просочившихся в сеть диаграмм видно, что Operator хорошо справляется с некоторыми тестами на безопасность, в том числе с тестами, которые пытаются заставить систему выполнять «незаконные действия» и искать «конфиденциальные личные данные». Как сообщается ^[6], тестирование безопасности является одной из причин длительного цикла разработки Operator. В недавнем посте ^[14] соучредитель OpenAI Войцех Заремба раскритиковал Anthropic за выпуск агента, в котором, по его мнению, отсутствуют меры безопасности.

«Я могу только представить себе негативную реакцию ^[15], если бы OpenAI выпустила что-то подобное», — написал Заремба.

Стоит отметить, что исследователи AI, в том числе бывшие сотрудники OpenAI, критиковали ^[16] компанию за то, что она якобы уделяла меньше внимания ^[17] безопасности в пользу быстрого внедрения своей технологии.

Источник ^[18]

Автор: mefdayy

Источник ^[19]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/11392

URLs in this post:

[1] утверждает: https://x.com/btibor91/status/1881110210867290191

[2] Operator: https://techcrunch.com/2024/11/13/openais-take-on-ai-agents-could-come-in-january/

[3] в том числе: https://www.axios.com/2025/01/19/ai-superagent-openai-meta

[4] сообщалось: https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users

[5] агентскую: https://techcrunch.com/2024/12/15/what-exactly-is-an-ai-agent/

[6] Согласно: https://www.theinformation.com/articles/why-openai-is-taking-so-long-to-launch-agents

[7] ChatGPT: https://techcrunch.com/tag/chatgpt/

[8] интеллекта: http://www.braintools.ru/article/7605

[9] модель управления компьютером: https://techcrunch.com/2024/10/22/anthropics-new-ai-can-control-your-pc/

[10] Google: https://techcrunch.com/2024/12/11/google-unveils-project-mariner-ai-agents-to-use-the-web-for-you/

[11] рискованными и спекулятивными: https://www.fool.com/investing/2025/01/15/could-ai-agents-be-next-billion-dollar-investment/

[12] следующую большую вещь: https://techcrunch.com/2024/12/17/salesforce-plans-to-hire-2000-people-to-sell-its-ai-products/

[13] По данным: https://www.marketsandmarkets.com/Market-Reports/ai-agents-market-15761548.html

[14] посте: https://x.com/woj_zaremba/status/1867744126755901914

[15] реакцию: http://www.braintools.ru/article/1549

[16] критиковали: https://techcrunch.com/2024/05/18/this-week-in-ai-openai-moves-away-from-safety/

[17] внимания: http://www.braintools.ru/article/7595

[18] Источник: https://techcrunch.com/2025/01/20/openais-agent-tool-may-be-nearing-release/

[19] Источник: https://habr.com/ru/companies/bothub/news/875318/?utm_source=habrahabr&utm_medium=rss&utm_campaign=875318

Нажмите здесь для печати.