
Perplexity выпустила инструмент BrowseSafe, который защищает ИИ-агентов от промпт-инъекций, спрятанных в структуре веб-страниц. Речь идет о скрытых командах, которые злоумышленники размещают в HTML через комментарии, невидимые поля, специальные теги и другие элементы, не отображаемые пользователю. Поскольку ИИ-ассистенты читают страницу полностью, включая такие зоны, их можно заставить выполнять нежелательные действия без ведома человека. BrowseSafe решает эту проблему за счет встроенного анализа: система проверяет поступающий контент в реальном времени и блокирует подозрительные инструкции до того, как они попадут в контекст основной модели.

Одновременно Perplexity представила тестовый набор BrowseSafe-Bench. В него вошло более четырнадцати тысяч сценариев атак, которые позволяют разработчикам проверять устойчивость своих агентов к разным видам промпт-инъекций. Компания отмечает, что существующие защитные решения не покрывают достаточное количество сценариев и плохо выявляют сложные манипуляции, поэтому BrowseSafe создавался как легковесная, но хорошо масштабируемая система, пригодная для работы в реальном вебе.
По словам Perplexity, BrowseSafe особенно важен на фоне роста агентных моделей, которые способны самостоятельно перемещаться по сайтам, читать документы, формировать запросы и выполнять последовательные действия. В таких сценариях даже простая незаметная команда может привести к утечке данных или неправильному поведению модели. BrowseSafe дополняет инфраструктуру компании и должен стать основой для безопасного развития ИИ-браузеров.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


