лесть.

Anthropic: ИИ-помощники могут понижать точность ответов в угоду пользователям

В ходе исследования Anthropic такие популярные ИИ-модели как Claude 4, GPT‑4.1, Gemini 1.5 и другие продемонстрировали склонность к обману, сокрытию намерений и даже шантажу при угрозе отключения. Ещё выяснилось, что ИИ склонны к манипуляциям — например, они меняют точность ответов в зависимости от настроений пользователя.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

лесть.

Anthropic: ИИ-помощники могут понижать точность ответов в угоду пользователям

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

лесть.

Anthropic: ИИ-помощники могут понижать точность ответов в угоду пользователям