Языковые модели ИИ тестируют на способность рассуждать в игре «Phoenix Wright: Ace Attorney»
Исследователи подвергли ведущие модели ИИ новому виду тестирования, которое показывает, насколько хорошо они могут рассуждать, чтобы одержать победу в суде. Результаты выявили некоторые явные различия как в производительности, так и в стоимости.