
Исследователи из Google и Чикагского университета выяснили, почему reasoning-модели вроде DeepSeek-R1 и QwQ-32B так много “думают вслух”: они фактически симулируют спор нескольких персонажей внутри одного ответа. Авторы назвали этот феномен “обществом мыслей” (society of thought) — модель как будто разыгрывает диалог между экспертами с разными характерами и специализациями, которые задают друг другу вопросы, не соглашаются и ищут компромисс.
Анализ более 8000 задач показал, что reasoning-модели используют характерные паттерны диалога: вопросы и ответы, смену перспективы, конфликт точек зрения и примирение. Обычные instruction-tuned модели тех же размеров такого поведения почти не демонстрируют — они выдают “монолог” без внутренней дискуссии. При этом разница не объясняется просто длиной ответа: даже при одинаковом количестве токенов reasoning-модели спорят сами с собой значительно чаще.
Чтобы проверить причинно-следственную связь, исследователи нашли в активациях модели “фичу разговорного удивления” — нейронный паттерн, который срабатывает на словах вроде “Oh!” и “Wait” в контексте смены точки зрения. Усиление этой фичи вдвое повысило точность на арифметических задачах — с 27% до 55%. Подавление, наоборот, ухудшило результаты. Эффект работал и через когнитивные стратегии: модель чаще проверяла свои шаги, возвращалась к предыдущим решениям и разбивала задачу на подцели.
Отдельный эксперимент показал, что диалоговая структура ускоряет обучение. Модели, которые перед reinforcement learning натренировали на синтетических диалогах между “персонами”, быстрее набирали точность, чем модели с монологическим chain-of-thought — даже при идентичных задачах и правильных ответах в обучающей выборке. Авторы предполагают, что reasoning-модели воспроизводят механизм коллективного интеллекта: разнообразие точек зрения помогает находить ошибки и исследовать пространство решений, как это происходит в спорах между людьми.
P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть“, где я рассказываю про ИИ с творческой стороны.
Автор: runaway_llm


