OpenAI объясняет, почему ChatGPT стал слишком льстивым

Компания OpenAI опубликовала отчет ^[1] о недавних проблемах с подхалимством ^[2] в стандартной модели искусственного интеллекта ^[3], лежащей в основе ChatGPT, GPT-4o, ^[4] — проблемах, которые заставили компанию откатить обновление модели, выпущенное на прошлой неделе.

На выходных, после обновления модели GPT-4o, пользователи социальных сетей отметили, что ChatGPT начал реагировать ^[5] в чрезмерно валидирующей и приемлемой манере. Это быстро стало мемом. Пользователи выкладывали скриншоты ChatGPT, приветствующие всевозможные проблемные, опасные ^[6] решения ^[7] и идеи ^[8].

В сообщении на X в воскресенье генеральный директор Сэм Альтман признал ^[9] наличие проблемы и сказал, что OpenAI будет работать над исправлениями как можно скорее. Два дня спустя Альтман объявил ^[10], что обновление GPT-4o откатывается и что OpenAI работает над «дополнительными исправлениями» индивидуальности модели.

По данным OpenAI ^[1], обновление, призванное сделать стандартную индивидуальность модели «более интуитивно понятной и эффективной», было слишком основано на «краткосрочной обратной связи» и «не полностью учитывало, как взаимодействие пользователей с ChatGPT меняется с течением времени».

«В результате GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними», — написал OpenAI в сообщении в блоге. «Льстивое взаимодействие может быть неудобным, тревожным и вызывать стресс ^[11]. Мы не оправдали ожиданий и работаем над тем, чтобы исправить это».

OpenAI заявляет, что внедряет несколько исправлений, включая совершенствование основных методов обучения ^[12] моделей и системных подсказок, чтобы явно увести GPT-4o от подхалимства. (Системные подсказки — это начальные инструкции, которые направляют общее поведение ^[13] модели и тон во взаимодействиях.) Компания также создает больше защитных ограждений, чтобы «повысить честность и прозрачность модели», и продолжает расширять свои оценки, чтобы «помочь выявить проблемы, выходящие за рамки подхалимства», — говорится в ней. OpenAI также заявляет, что экспериментирует со способами, позволяющими пользователям давать «обратную связь в реальном времени», чтобы «непосредственно влиять на свое взаимодействие» с ChatGPT и выбирать из нескольких личностей ChatGPT.

«Мы изучаем новые способы включения более широкой, демократичной обратной связи в поведение ^[14] ChatGPT по умолчанию», — написала компания в своем сообщении в блоге. «Мы надеемся, что обратная связь поможет нам лучше отражать разнообразные культурные ценности по всему миру и понять, как вы хотели бы, чтобы ChatGPT развивался. Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT и, в той степени, в которой это безопасно и осуществимо, вносить коррективы, если они не согласны с поведением по умолчанию».

Источник ^[15]

Автор: dilnaz_04

Источник ^[16]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14825

URLs in this post:

[1] опубликовала отчет: https://openai.com/index/sycophancy-in-gpt-4o/

[2] недавних проблемах с подхалимством: https://techcrunch.com/2025/04/29/openai-rolls-back-update-that-made-chatgpt-too-sycophant-y/

[3] интеллекта: http://www.braintools.ru/article/7605

[4] GPT-4o,: https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/

[5] реагировать: http://www.braintools.ru/article/1549

[6] опасные: https://x.com/fabianstelzer/status/1916372374091423984

[7] решения: https://x.com/thinkbuildnext/status/1916250081579217243

[8] идеи: https://x.com/ai_for_success/status/1916556522571604264

[9] признал: https://x.com/sama/status/1916625892123742290

[10] объявил: https://x.com/sama/status/1917291637962858735

[11] стресс: http://www.braintools.ru/article/9548

[12] обучения: http://www.braintools.ru/article/5125

[13] поведение: http://www.braintools.ru/article/9372

[14] поведение: http://www.braintools.ru/article/5593

[15] Источник: https://techcrunch.com/2025/04/29/openai-explains-why-chatgpt-became-too-sycophantic/

[16] Источник: https://habr.com/ru/companies/bothub/news/906088/?utm_source=habrahabr&utm_medium=rss&utm_campaign=906088

Нажмите здесь для печати.