- BrainTools - https://www.braintools.ru -
Компания OpenAI опубликовала отчет [1] о недавних проблемах с подхалимством [2] в стандартной модели искусственного интеллекта [3], лежащей в основе ChatGPT, GPT-4o, [4] — проблемах, которые заставили компанию откатить обновление модели, выпущенное на прошлой неделе.

На выходных, после обновления модели GPT-4o, пользователи социальных сетей отметили, что ChatGPT начал реагировать [5] в чрезмерно валидирующей и приемлемой манере. Это быстро стало мемом. Пользователи выкладывали скриншоты ChatGPT, приветствующие всевозможные проблемные, опасные [6] решения [7] и идеи [8].
В сообщении на X в воскресенье генеральный директор Сэм Альтман признал [9] наличие проблемы и сказал, что OpenAI будет работать над исправлениями как можно скорее. Два дня спустя Альтман объявил [10], что обновление GPT-4o откатывается и что OpenAI работает над «дополнительными исправлениями» индивидуальности модели.
По данным OpenAI [1], обновление, призванное сделать стандартную индивидуальность модели «более интуитивно понятной и эффективной», было слишком основано на «краткосрочной обратной связи» и «не полностью учитывало, как взаимодействие пользователей с ChatGPT меняется с течением времени».
«В результате GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними», — написал OpenAI в сообщении в блоге. «Льстивое взаимодействие может быть неудобным, тревожным и вызывать стресс [11]. Мы не оправдали ожиданий и работаем над тем, чтобы исправить это».
OpenAI заявляет, что внедряет несколько исправлений, включая совершенствование основных методов обучения [12] моделей и системных подсказок, чтобы явно увести GPT-4o от подхалимства. (Системные подсказки — это начальные инструкции, которые направляют общее поведение [13] модели и тон во взаимодействиях.) Компания также создает больше защитных ограждений, чтобы «повысить честность и прозрачность модели», и продолжает расширять свои оценки, чтобы «помочь выявить проблемы, выходящие за рамки подхалимства», — говорится в ней. OpenAI также заявляет, что экспериментирует со способами, позволяющими пользователям давать «обратную связь в реальном времени», чтобы «непосредственно влиять на свое взаимодействие» с ChatGPT и выбирать из нескольких личностей ChatGPT.
«Мы изучаем новые способы включения более широкой, демократичной обратной связи в поведение [14] ChatGPT по умолчанию», — написала компания в своем сообщении в блоге. «Мы надеемся, что обратная связь поможет нам лучше отражать разнообразные культурные ценности по всему миру и понять, как вы хотели бы, чтобы ChatGPT развивался. Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT и, в той степени, в которой это безопасно и осуществимо, вносить коррективы, если они не согласны с поведением по умолчанию».
Источник [15]
Автор: dilnaz_04
Источник [16]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/14825
URLs in this post:
[1] опубликовала отчет: https://openai.com/index/sycophancy-in-gpt-4o/
[2] недавних проблемах с подхалимством: https://techcrunch.com/2025/04/29/openai-rolls-back-update-that-made-chatgpt-too-sycophant-y/
[3] интеллекта: http://www.braintools.ru/article/7605
[4] GPT-4o,: https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/
[5] реагировать: http://www.braintools.ru/article/1549
[6] опасные: https://x.com/fabianstelzer/status/1916372374091423984
[7] решения: https://x.com/thinkbuildnext/status/1916250081579217243
[8] идеи: https://x.com/ai_for_success/status/1916556522571604264
[9] признал: https://x.com/sama/status/1916625892123742290
[10] объявил: https://x.com/sama/status/1917291637962858735
[11] стресс: http://www.braintools.ru/article/9548
[12] обучения: http://www.braintools.ru/article/5125
[13] поведение: http://www.braintools.ru/article/9372
[14] поведение: http://www.braintools.ru/article/5593
[15] Источник: https://techcrunch.com/2025/04/29/openai-explains-why-chatgpt-became-too-sycophantic/
[16] Источник: https://habr.com/ru/companies/bothub/news/906088/?utm_source=habrahabr&utm_medium=rss&utm_campaign=906088
Нажмите здесь для печати.