Критика и альтернативные взгляды на возможности современных языковых моделей
Команда Apple протестировала ведущие модели в классических логических головоломках, таких как Ханойская башня, и обнаружила, что даже продвинутым системам по-прежнему трудно выполнять простые алгоритмы правильно и в полном объеме. Основываясь на этих результатах, авторы утверждают, что LLM не имеют истинно обобщаемых рассуждений, вместо этого действуя как сопоставители шаблонов, которые упускают из виду более глубокие структуры.