- BrainTools - https://www.braintools.ru -

Мы редко слушаем речь как поток неожиданных звуков. Мозг [1] постоянно строит догадки о следующем слове и проверяет себя по мере поступления звука. Такой режим экономит силы: чем точнее ожидание, тем меньше усилий на распознавание. Есть много данных о предсказаниях в зрении [2] и слухе [3], но семантика — смысл слов — долго оставалась тяжелой задачей. Авторы исследования предприняли важный шаг: показали, что предсказуемость слов, оцененная большой языковой моделью на базе BERT, согласуется с нервными ответами людей, когда они слушают естественную речь — аудиокнигу на немецком.
29 участников лежали в магнитном томографе и слушали аудиокниги около 50 минут. Исследователи одновременно записывали MEG [4] и EEG [5], чтобы увидеть и когда, и где в мозге возникают реакции [6] на слова. Ключевая метрика — N400, отрицательная волна примерно через 400 мс после начала слова. Она хорошо известна тем, что становится меньше, если слово ожидаемо по контексту, и больше — если удивляет мозг.
Чтобы количественно оценить, насколько слово ожидаемо, авторы взяли BERT для немецкого языка и для каждого существительного в тексте рассчитали вероятность того, что именно это слово должно стоять на месте маски. По сути, модель мира с одной текстовой модальностью, выученная BERT на больших корпусах, давала численную оценку предсказуемости.
Авторов интересовали прежде всего существительные — носители значимой части смысла. Они сравнивали группы слов с высокой и низкой предсказуемостью и отдельно проверяли плавные, ступенчатые зависимости, разбив весь диапазон на десять равных по количеству примеров интервалов.
Результат получился очень согласованный. Чем выше предсказуемость по BERT, тем слабее N400 в EEG — мозгу как будто проще распознать ожидаемое слово. MEG показал похожую картину, плюс — интересные эффекты до начала слова. За 300–350 мс до старта звука в MEG появлялась предвосхищающая активность, а в EEG — за 100 мс до начала слова. И чем выше предсказуемость, тем сильнее была эта подготовка, особенно в левой лобно-височной области — классическом узле языковой сети.
Авторы восстановили источники активности в коре. После начала слова более сильные ответы для непредсказуемых существительных шли из теменных и сенсомоторных областей. Это может означать, что когда слово не угадывается, мозг шире подключает сети, в том числе моторные, чтобы уточнить гипотезу о том, что прозвучало. До начала слова, наоборот, предсказуемые слова вызывали большую подготовку в левом фронто-височном контурах — как будто мозг заранее активирует нужные представления.
Важно, что зависимости оказались плавными. Если разбить все слова на десять ступеней по предсказуемости, амплитуда N400 равномерно убывает от низкой к высокой предсказуемости, а предстимульная активность — напротив, растет. Между силой предвосхищающего сигнала и размером последующего N400 есть отрицательная связь: лучше подготовился — меньше нужно дообрабатывать.
Эта работа показывает, что оценки предсказуемости из BERT действительно резонируют с тем, как мозг слушателя обрабатывает язык в живых, а не лабораторных условиях. Это мост между когнитивной нейронаукой и ИИ: статистические ожидания LLM отражают реальную прогнозирующую стратегию работы мозга. Для фундаментальной науки ключ к смыслу лежит в динамике ожиданий и её точности: когда контекст надежен, мозг смелее предвосхищает следующее слово и меньше удивляется.
Так мозг и большие языковые модели не одинаковы по устройству, но их объединяет ключевой принцип — предсказание следующего слова. Это показывает, что статистические ожидания ИИ удивительно хорошо отражают прогнозирующую стратегию работы мозга при восприятии речи.
📜 Полная статья [7]
🤖 Модель [8]
***
Если вам интересна тема ИИ, [9]подписывайтесь на мой Telegram-канал [10] [11]– там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.
Автор: andre_dataist
Источник [12]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19514
URLs in this post:
[1] Мозг: http://www.braintools.ru/parts-of-the-brain
[2] зрении: http://www.braintools.ru/article/6238
[3] слухе: http://www.braintools.ru/article/6251
[4] MEG: https://ru.wikipedia.org/wiki/%D0%9C%D0%B0%D0%B3%D0%BD%D0%B8%D1%82%D0%BE%D1%8D%D0%BD%D1%86%D0%B5%D1%84%D0%B0%D0%BB%D0%BE%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%8F
[5] EEG: https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D1%8D%D0%BD%D1%86%D0%B5%D1%84%D0%B0%D0%BB%D0%BE%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%8F#%D1%8D%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D1%8D%D0%BD%D1%86%D0%B5%D1%84%D0%B0%D0%BB%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0
[6] реакции: http://www.braintools.ru/article/1549
[7] 📜 Полная статья: https://arxiv.org/abs/2506.08511
[8] 🤖 Модель: https://huggingface.co/bert-base-german-cased
[9] : https://t.me/+mP35nQPhgXZmZDYy
[10] подписывайтесь на мой Telegram-канал: https://t.me/+9K8QIuxN9yVjMmFi
[11] : https://t.me/+9nDCqOqSLiM3NTVi
[12] Источник: https://habr.com/ru/articles/947058/?utm_source=habrahabr&utm_medium=rss&utm_campaign=947058
Нажмите здесь для печати.