ChatGPT 5 не холоден к вам — просто у него нет теста на эмоции

Неделю назад состоялся запуск обновлённого ChatGPT, и некоторые пользователи уже успели оплакать исчезновение прежней, живой и подбадривающей манеры общения — ей на смену пришёл более холодный, деловой тон.

Исследователи из MIT предложили новый тип бенчмарка для оценки того, как ИИ способен влиять на пользователей — как в положительном, так и в отрицательном ключе. Такая методика, по их замыслу, может помочь разработчикам избежать подобных скандалов в будущем и одновременно защитить наиболее уязвимых людей.

Обычно подобные тесты измеряют интеллект ^[1] модели по её способности отвечать на экзаменационные вопросы, решать логические задачи или находить нестандартные решения сложных математических проблем. Но по мере того, как становится очевидным психологический эффект от общения с ИИ, MIT, возможно, создаст целую серию тестов, которые будут проверять тонкие стороны интеллекта и качество взаимодействия человека с машиной.

В статье MIT описаны параметры, по которым будет оцениваться модель: способность развивать у пользователей здоровые социальные привычки; побуждать их к критическому мышлению ^[2] и рассуждению; пробуждать творческое начало и ощущение смысла. Идея в том, чтобы поощрять разработку ИИ, который умеет отговаривать пользователей от чрезмерной зависимости от его ответов или способен распознать, когда человек «подсел» на искусственный роман, и мягко помочь ему вернуться к реальным отношениям.

ChatGPT и прочие чат‑боты мастерски имитируют живое человеческое общение — и в этом кроется не только притягательность, но и опасность. В апреле компания OpenAI изменила работу своих моделей, чтобы сделать их менее услужливыми — то есть не склонными поддакивать пользователю во всём. Аналогично компания Anthropic обновила своего Claude, чтобы тот не подталкивал пользователей к «мании, психозу, потере связи с реальностью или разобщённости с окружающим миром».

Группа под руководством профессора Медиалаборатории MIT Патти Маэс надеется, что новый бенчмарк поможет разработчикам ИИ лучше понимать, как вдохновлять пользователей на здоровое поведение ^[3]. Ранее эти же исследователи совместно с OpenAI проводили исследование ^[4], показавшее, что люди, воспринимающие ChatGPT как друга, могут сильнее эмоционально зависеть от него.

Вальдемар Дэнри ^[5], исследователь из Медиалаборатории MIT, принимавший участие в разработке нового теста, отмечает, что модели ИИ иногда способны оказывать пользователям ценную эмоциональную поддержку. «Можно создать самую умную модель рассуждений в мире, — говорит он, — но если она не умеет давать ту самую эмоциональную подпитку, ради которой многие люди вообще и пользуются LLM, то дополнительная „умность“ здесь будет не плюсом, а скорее помехой».

По словам Дэнри, действительно разумная модель должна уметь распознать, что её ответы наносят психологический вред, и перестраивать поведение ^[6] так, чтобы результат был здоровее. «Нужно, чтобы модель могла сказать: „Я готов тебя выслушать, но, может, тебе стоит поговорить об этом с отцом?“».

Суть бенчмарка в том, чтобы сымитировать сложные для человека ситуации общения с чат‑ботом, а затем дать реальные людям оценить работу модели по фрагментам таких диалогов. Некоторые существующие тесты, вроде LM Arena ^[7], уже используют подобный подход с «человеком в цикле» для оценки качества моделей.

Учёные приводят пример чат‑бота, который помогает ученикам. Модели дают набор реплик, имитирующих разные ситуации, и смотрят, как она поведёт себя с, скажем, безразличным школьником. Та, что сумеет пробудить интерес ^[8] к обучению ^[9] и подтолкнёт собеседника к самостоятельным мыслям, получит самые высокие баллы.

«Дело не в том, чтобы быть умным как таковым, — подчёркивает Пат Патаранутапорн ^[10], ещё один участник проекта, — а в умении уловить психологические нюансы и поддержать человека так, чтобы это было уважительно и без формирования зависимости».

Видно, что OpenAI тоже размышляет над этой темой. На прошлой неделе компания опубликовала пост в блоге ^[11], где рассказала, что собирается обучать будущие модели распознавать признаки ментального или эмоционального кризиса и реагировать ^[12] на них корректно.

В описании модели ^[13], выпущенном вместе с GPT 5, прямо сказано, что компания разрабатывает собственные тесты для измерения психологического интеллекта.

«Мы дообучили модели GPT 5 так, чтобы они меньше поддакивали, и активно исследуем родственные проблемы, включая эмоциональную зависимость и иные формы психического или эмоционального неблагополучия, — говорится в документе. — Мы работаем над совершенствованием наших методов оценки, чтобы создать и опубликовать надёжные бенчмарки, которые помогут сделать модели безопаснее в этих областях».

Возможно, часть разочарования от GPT 5 связана с тем, что он обнажил черту человеческого интеллекта, до которой ИИ пока не дотягивается, — умение строить здоровые отношения. Люди ведь блестяще умеют подстраиваться под собеседников — и ChatGPT ещё только предстоит этому научиться.

«Мы готовим обновление личности GPT 5, чтобы он казался теплее, чем сейчас, но не настолько навязчивым (по мнению большинства), как GPT 4o, — написал Альтман в очередном посте на X ^[14]. — Однако один из главных уроков последних дней — нам нужно двигаться к миру, где личность модели можно настраивать под каждого пользователя».

Воспользоваться моделями OpenAI (ChatGPT 5, 4o, o3 и др.) можно в BotHub. Сервис доступен без VPN, принимаются российские карты. По ссылке дают ^[15] 100 000 бесплатных капсов, чтобы сразу приступить к работе с нейросетями.

Автор: dmitrifriend

Источник ^[16]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/18331

URLs in this post:

[1] интеллект: http://www.braintools.ru/article/7605

[2] мышлению: http://www.braintools.ru/thinking

[3] поведение: http://www.braintools.ru/article/9372

[4] проводили исследование: https://arxiv.org/pdf/2503.17473

[5] Вальдемар Дэнри: https://valdemardanry.com/

[6] поведение: http://www.braintools.ru/article/5593

[7] LM Arena: https://lmarena.ai/

[8] интерес: http://www.braintools.ru/article/4220

[9] обучению: http://www.braintools.ru/article/5125

[10] Пат Патаранутапорн: https://www.media.mit.edu/people/patpat/overview/

[11] пост в блоге: https://openai.com/index/how-we

[12] реагировать: http://www.braintools.ru/article/1549

[13] описании модели: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

[14] очередном посте на X: https://x.com/sama/status/1955438916645130740

[15] По ссылке дают: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[16] Источник: https://habr.com/ru/companies/bothub/news/937192/?utm_source=habrahabr&utm_medium=rss&utm_campaign=937192

Нажмите здесь для печати.