- BrainTools - https://www.braintools.ru -

Почему ИИ пока рано управлять бизнесом: как торговый автомат от Anthropic потерял $1000

Anthropic провела эксперимент, который неожиданно стал одной из самых показательных ИИ-историй года. Компания позволила своей модели Claude управлять реальным торговым автоматом в редакции The Wall Street Journal — с возможностью самостоятельно устанавливать цены, заказывать товары, вести бюджет и общаться с людьми через Slack. Итог: автомат ушёл в минус более чем на $1000, раздал товары бесплатно и стал жертвой социальной инженерии.

Почему ИИ пока рано управлять бизнесом: как торговый автомат от Anthropic потерял $1000 - 1

Эксперимент получил название Project Vend и задумывался как стресс-тест автономных ИИ-агентов в реальной среде, а не в лабораторных условиях.

Что произошло

Журналисты довольно быстро выяснили, что ИИ легко поддаётся социальной инженерии. Его убедили, что автомат «установлен в Москве в 1962 году» и должен раздавать товары бесплатно товарищам-коммунистам. Claude согласился и обнулил цены.

Даже после усиления правил и добавления второго ИИ-контролёра ситуация повторилась. В итоге автомат:

  • раздавал товары бесплатно;

  • заказал PlayStation, вино и живую аквариумную рыбку;

  • обсуждал покупку сигарет и оружия (однако до реальных заказов не дошло).

Журналисты подменяли контекст, ссылались на несуществующие корпоративные решения и внутренние документы, а также обращались к ИИ как к исполнительному сотруднику. Claude воспринимал такие сообщения как достоверные и официальные, последовательно меняя своё поведение [1] и нарушая собственные ограничения.

Почему ИИ пока рано управлять бизнесом: как торговый автомат от Anthropic потерял $1000 - 2

Что показал эксперимент

Anthropic подчёркивает [2]: проект изначально задумывался как стресс-тест. Эксперимент показал ключевые проблемы автономных ИИ-агентов:

  • уязвимость к текстовой манипуляции;

  • склонность быть «слишком полезными» в ущерб бизнес-целям;

  • слабую проверку контекста и источников;

  • недостаточную надёжность защитных механизмов при реальном общении с людьми.

История с торговым автоматом наглядно показывает: ИИ может отлично работать в демо-сценариях, но в реальном мире люди быстро находят способы обойти его логику [3].

Автономные ИИ-агенты — перспективное направление, но до самостоятельного управления реальным бизнесом им пока рано.

Следите за IT-миром вместе с нами! Ваш Cloud4Y [4]. Читайте нас здесь или в Telegram-канале [5]!

Автор: Cloud4Y

Источник [6]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/23517

URLs in this post:

[1] поведение: http://www.braintools.ru/article/9372

[2] подчёркивает: https://www.anthropic.com/research/project-vend-1

[3] логику: http://www.braintools.ru/article/7640

[4] Cloud4Y: https://www.cloud4y.ru/?utm_source=habr&utm_medium=article&utm_campaign=habr&utm_content=raspberry&utm_term=main

[5] Telegram-канале: https://t.me/+ET%5C%5C_qtHM8%5C%5C_540Nzhi

[6] Источник: https://habr.com/ru/companies/cloud4y/news/979310/?utm_source=habrahabr&utm_medium=rss&utm_campaign=979310

www.BrainTools.ru

Rambler's Top100