бэкдор.

Небольшое количество примеров может отравить LLM любого размера

Команда AI for Devs подготовила перевод исследования в котором учёные показали: чтобы встроить «бэкдор» в большую языковую модель, вовсе не нужно контролировать огромную долю обучающих данных — достаточно около 250 вредоносных документов. Этот результат переворачивает представления о масштабируемости атак через отравление данных и ставит новые вопросы к безопасности ИИ.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

бэкдор.

Небольшое количество примеров может отравить LLM любого размера

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

бэкдор.

Небольшое количество примеров может отравить LLM любого размера