AI не справляется с высокоуровневыми историческими экзаменами: исследование показало лишь 46% точности

AI может превосходно справляться с определёнными задачами, такими как программирование или создание подкастов. Однако ему сложно сдать экзамен по истории на высоком уровне, как показало новое исследование.Команда исследователей разработала новый бенчмарк для проверки трёх ведущих моделей больших языков (LLM) — GPT-4 от OpenAI, Llama от Meta и Gemini от Google — на исторических вопросах. Этот бенчмарк, названный Hist-LLM, оценивает

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

экзамен.

Последний экзамен человечества: насколько «умен» ИИ?

AI не справляется с высокоуровневыми историческими экзаменами: исследование показало лишь 46% точности

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

экзамен.

Последний экзамен человечества: насколько «умен» ИИ?

AI не справляется с высокоуровневыми историческими экзаменами: исследование показало лишь 46% точности