- BrainTools - https://www.braintools.ru -
OpenAI, возможно, близок к выпуску инструмента на основе AI, который может управлять вашим ПК и выполнять действия от вашего имени. Тибор Блахо, инженер-программист, известный тем, что точно предсказывает появление новых продуктов AI, утверждает [1], что обнаружил доказательства существования давно обсуждаемого инструмента Operator [2] от OpenAI. Ранее, в том числе [3] в Bloomberg, сообщалось [4] об Operator, который, как говорят, представляет собой «агентскую [5]» систему, способную автономно выполнять такие задачи, как написание кода и бронирование билетов.

Согласно [6] The Information, OpenAI планирует выпустить Operator в январе. Код, обнаруженный Blaho в эти выходные, подтверждает эту информацию.
По словам Блахо, в клиенте ChatGPT [7] от OpenAI для macOS появились скрытые на данный момент опции для определения сочетаний клавиш «Переключить оператора» и «Выключить оператора». По словам Блахо, OpenAI добавила ссылки на Operator на свой веб-сайт, хотя пока они не доступны публично.
По словам Блахо, сайт OpenAI также содержит еще не опубликованные таблицы, сравнивающие производительность Operator с другими компьютерными системами искусственного интеллекта [8]. Таблицы вполне могут быть заполнителями. Но если цифры точны, они предполагают, что Operator не надежен на 100%, в зависимости от задачи.
В OSWorld, тестовой системе, созданной для моделирования реальных условий работы компьютера, «OpenAI Computer Use Agent (CUA)», вероятно, модель искусственного интеллекта, которая лежит в основе Operator, демонстрирует результат в 38,1%, опережая модель управления компьютером [9] Anthropic, но значительно уступая на 72,4% людям. OpenAI CUA превосходит людей по результатам в WebVoyager, который оценивает способность AI перемещаться по веб-сайтам и взаимодействовать с ними. Но, согласно просочившимся в сеть результатам тестов, модель не дотягивает до показателей человеческого уровня в другом веб-тесте WebArena.
Operator также сталкивается с трудностями при выполнении задач, которые человек мог бы выполнить легко, если верить утечке. В тесте, в ходе которого требовалось зарегистрироваться у облачного провайдера и запустить виртуальную машину, Operator добивался успеха только в 60% случаев. При создании биткоин-кошелька Operator добивался успеха только в 10% случаев.
Неизбежное появление OpenAI на рынке AI-агентов происходит на фоне того, что конкуренты, в том числе вышеупомянутая Anthropic, Google [10] и другие, борются за зарождающийся сегмент. AI-агенты могут быть рискованными и спекулятивными [11], но технологические гиганты уже рекламируют их как следующую большую вещь [12] в сфере AI. По данным [13] аналитической компании Markets and Markets, к 2030 году рынок AI-агентов может составить 47,1 миллиарда долларов.
Сегодняшние агенты довольно примитивны. Но некоторые эксперты обеспокоены их безопасностью в случае стремительного развития технологий.
На одной из просочившихся в сеть диаграмм видно, что Operator хорошо справляется с некоторыми тестами на безопасность, в том числе с тестами, которые пытаются заставить систему выполнять «незаконные действия» и искать «конфиденциальные личные данные». Как сообщается [6], тестирование безопасности является одной из причин длительного цикла разработки Operator. В недавнем посте [14] соучредитель OpenAI Войцех Заремба раскритиковал Anthropic за выпуск агента, в котором, по его мнению, отсутствуют меры безопасности.
«Я могу только представить себе негативную реакцию [15], если бы OpenAI выпустила что-то подобное», — написал Заремба.
Стоит отметить, что исследователи AI, в том числе бывшие сотрудники OpenAI, критиковали [16] компанию за то, что она якобы уделяла меньше внимания [17] безопасности в пользу быстрого внедрения своей технологии.
Источник [18]
Автор: mefdayy
Источник [19]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/11392
URLs in this post:
[1] утверждает: https://x.com/btibor91/status/1881110210867290191
[2] Operator: https://techcrunch.com/2024/11/13/openais-take-on-ai-agents-could-come-in-january/
[3] в том числе: https://www.axios.com/2025/01/19/ai-superagent-openai-meta
[4] сообщалось: https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users
[5] агентскую: https://techcrunch.com/2024/12/15/what-exactly-is-an-ai-agent/
[6] Согласно: https://www.theinformation.com/articles/why-openai-is-taking-so-long-to-launch-agents
[7] ChatGPT: https://techcrunch.com/tag/chatgpt/
[8] интеллекта: http://www.braintools.ru/article/7605
[9] модель управления компьютером: https://techcrunch.com/2024/10/22/anthropics-new-ai-can-control-your-pc/
[10] Google: https://techcrunch.com/2024/12/11/google-unveils-project-mariner-ai-agents-to-use-the-web-for-you/
[11] рискованными и спекулятивными: https://www.fool.com/investing/2025/01/15/could-ai-agents-be-next-billion-dollar-investment/
[12] следующую большую вещь: https://techcrunch.com/2024/12/17/salesforce-plans-to-hire-2000-people-to-sell-its-ai-products/
[13] По данным: https://www.marketsandmarkets.com/Market-Reports/ai-agents-market-15761548.html
[14] посте: https://x.com/woj_zaremba/status/1867744126755901914
[15] реакцию: http://www.braintools.ru/article/1549
[16] критиковали: https://techcrunch.com/2024/05/18/this-week-in-ai-openai-moves-away-from-safety/
[17] внимания: http://www.braintools.ru/article/7595
[18] Источник: https://techcrunch.com/2025/01/20/openais-agent-tool-may-be-nearing-release/
[19] Источник: https://habr.com/ru/companies/bothub/news/875318/?utm_source=habrahabr&utm_medium=rss&utm_campaign=875318
Нажмите здесь для печати.