- BrainTools - https://www.braintools.ru -

Издание BBC обнаружило [1], что четыре самых популярных чат-бота неточно резюмируют новости. В рамках собственного исследования редакция BBC попросила ChatGPT от OpenAI, Copilot от Microsoft, Gemini и Perplexity прочитать новости со своего сайта, а затем задавала им вопросы, связанные с содержанием материалов. Как утверждают в BBC, в полученных ответах были «значительные неточности и искажения».
Журналисты попросили чат-ботов прочесть 100 новостей. После серии вопросов по содержанию материалов они оценили качество ответов. Выяснилось, что в 51% всех ответов ИИ были «существенные проблемы в той или иной форме», а в 19% были грубые фактические ошибки [2]. Например, чат-бот Google Gemini переврал заявление Национальной службы здравоохранения Великобритании о вейпинге, а ChatGPT и Copilot заявили, что политики Риши Сунак и Никола Стерджен, ушедшие в отставку, до сих пор работают.
Помимо фактических ошибок, чат-боты «с трудом различали мнение редакции и объективные факты и часто упускали существенный контекст». При этом Copilot и Gemini допускали больше серьёзных ошибок, чем ChatGPT и Perplexity, отмечают в BBC.
Как заявил директор программы BBC по генеративному ИИ Пит Арчер, издатели «должны контролировать, используется ли их контент и как он используется, а компании, которые разрабатывают ИИ-сервисы, должны раскрывать масштаб и объём ошибок и неточностей, которые они допускают».
Автор: AnnieBronson
Источник [3]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12189
URLs in this post:
[1] обнаружило: https://www.bbc.com/news/articles/c0m17d8827ko
[2] ошибки: http://www.braintools.ru/article/4192
[3] Источник: https://habr.com/ru/news/882344/?utm_source=habrahabr&utm_medium=rss&utm_campaign=882344
Нажмите здесь для печати.