- BrainTools - https://www.braintools.ru -

Внутренний голос: как электроды и ИИ возвращают речь парализованным людям

Представьте ситуацию: вы составляете фразу в своей голове, но произносит ее компьютерный помощник, а не вы. Для миллионов людей, которые лишены речи из-за паралича, инсульта [1] или нейродегенеративных заболеваний, это становится реальностью. Импланты, сверхтонкие электроды и искусственный интеллект [2] позволяют преобразовать электрическую активность мозга [3] в слова. От калифорнийских лабораторий до российских стартапов — ученые и компании учатся возвращать голос тем, кто молчал годами. Сегодня предлагаю разобраться, как это работает и какие проекты меняют жизни уже сейчас.

Внутренний голос: как электроды и ИИ возвращают речь парализованным людям - 1

Что за технология?

Созданные устройства умеют считывать электрическую активность той части мозга, которая управляет движениями мышц, необходимых для речи — губ, языка, гортани и лица в целом. Когда человек пытается говорить, электроды, имплантированные в мозг, регистрируют эти сигналы.

Продвинутые алгоритмы ИИ расшифровывают эти паттерны, преобразуя их в синтетическую речь почти в реальном времени. Технология опирается на глубокое обучение [4] и нейросети. Их учат интерпретировать индивидуальные сигналы мозга, адаптируясь к каждому пациенту. Цель специалистов — создать систему, которая работает так же естественно, как обычный разговор, сохраняя интонацию и эмоциональную окраску.

Забегая вперед, о Neuralink я не рассказываю. Сегодня мы говорим о восстановлении речи, а Neuralink фокусируется на интерфейсах мозг-компьютер (BCI) для управления ПК и другими устройствами. Хотя их импланты с тысячами электродов теоретически могут поддерживать речевые приложения, публичные результаты Neuralink касаются других задач — например, управления курсором, а не синтеза голоса.

Примеры проектов

Исследователи и компании по всему миру разрабатывают нейропротезы речи, используя разные подходы. Но каким бы ни был проект, люди, потерявшие возможность говорить, снова получают шанс быть услышанными. Ниже — несколько примеров.

Университет Калифорнии, Сан-Франциско (UCSF)

С начала 2010-х годов команда под руководством нейрохирурга Эдварда Чанга в UCSF разрабатывает нейропротезы речи — имплантируемые устройства, позволяющие восстанавливать способность к речи у людей с параличом. В этом проекте работают ученые из Университета Калифорнии в Сан-Франциско и Беркли. Исследования финансирует Национальный институт — он занимается проблемами слуха [5] и нарушениями общения (NIDCD).

Разработка основана на высокоплотных электродах, размещенных на поверхности моторной коры мозга. Как и писала выше, они регистрируют нейронную активность, связанную с речью. Сигналы обрабатываются в реальном времени с помощью глубоких рекуррентных нейросетей, преобразующих их в синтетическую речь.

Алгоритмы, аналогичные тем, что используются в голосовых помощниках, обеспечивают потоковое воспроизведение речи с задержкой менее одной секунды. Это суммарный технический лаг всей цепочки: от регистрации нейронной активности, ее обработки ИИ, декодирования в текст и генерации синтетической речи.

Пациентка с имплантатом, подключаемом к генератору голоса. Источник

Пациентка с имплантатом, подключаемом к генератору голоса. Источник [6]

В апреле 2025 года команда под руководством нейрохирурга Эдварда Чанга опубликовала [6] исследование в Nature Neuroscience, посвященное женщине, потерявшей речь 18 лет назад из-за инсульта. До операции пациентка не могла говорить. После установки имплантата ситуация изменилась: теперь она мысленно «произносит» фразы, используя специальный набор из 1 024 самых распространенных слов — именно на таком словаре ученые обучали систему. Последняя улавливает ее мозговые сигналы и превращает их в речь, которую слышат окружающие. Благодаря этой технологии задержка между мыслью и появлением звука сократилась с восьми секунд до одной, что уже близко к обычной речи. Скорость распознавания [7] — 47,5 слов в минуту, это примерно треть от темпа нормального разговора.

Сейчас ученые хотят создать беспроводную версию устройства: его будет гораздо удобнее использовать. Еще ведутся исследования по передаче эмоций [8] компьютерному голосу, но это уже следующий этап развития технологии.

Precision Neuroscience

Основанная в 2021 году в Нью-Йорке компания Precision Neuroscience разрабатывает [9] интерфейсы мозг-компьютер (BCI) для клинического применения, включая восстановление речи. Она основана Бенджамином Рапопортом, который раньше был в команде Neuralink, и Майклом Магером. Precision стремится создать минимально инвазивные, биосовместимые и высокоточные нейроинтерфейсы для пациентов с неврологическими нарушениями.

Ключевой элемент системы — интерфейс Layer 7 [10]. Это тонкая микропленка толщиной в пятую часть человеческого волоса, содержащая 1 024 платиновых электрода. Гибкая структура повторяет изгибы тканей мозга. Ее устанавливают поверх коры через микроразрез менее 1 мм. Интерфейс умеет регистрировать и стимулировать [11] нейронную активность, обеспечивая высокую точность обработки сигналов.​

Вот так выглядит установленный электрод в мозге человека. Источник

Вот так выглядит установленный электрод в мозге человека [12]. Источник [10]

Система использует алгоритмы искусственного интеллекта для обработки электрических сигналов мозга. Их преобразуют в команды или речь.

Компания провела испытания [13] с 37 пациентами, а 17 апреля 2025 года получила разрешение FDA оставлять сенсоры в мозге до 30 дней. Генеральный директор Майкл Магер комментирует, что благодаря этому за год его команда сможет собрать самую большую в мире коллекцию точных записей мозговой активности. В будущем Precision хочет сделать все компоненты системы настолько маленькими и безопасными, чтобы можно было создать постоянные импланты и использовать эту технологию для помощи людям после инсульта или с боковым амиотрофическим склерозом (БАС).

Университет Калифорнии, Дэвис (UC Davis)

Лаборатория нейропротезирования UC Davis основана в начале 2010-х годов. Под руководством нейроинженеров Сергея Стависки и нейрохирурга Дэвида Брандмана команда ученых разрабатывает интерфейсы мозг-компьютер (BCI). В первую очередь для восстановления речи у пациентов с неврологическими нарушениями — паралич, БАС, инсульт.

Пациент испытывает возможности импланта. Источник

Пациент испытывает возможности импланта. Источник [14]

Система использует [15] имплантированные в моторную кору микромассивы электродов (Utah arrays): они регистрируют электрическую активность тканей мозга, связанную с попытками говорить. Алгоритмы глубокого обучения, включая сверточные и рекуррентные нейронные сети, обрабатывают эти сигналы, преобразуя их в текст или синтетическую речь. В некоторых случаях синтезированный голос моделируется на базе записей пациента до утраты речи. Это позволяет восстановить индивидуальные особенности звучания.​

В исследовании под руководством Сергея Стависки участвовал 67-летний мужчина с боковым амиотрофическим склерозом. Результаты весьма неплохие: точность распознавания речи до 97% и скорость произношения до 32 слов в минуту.

К сожалению, синтетический голос пока не передает интонацию и эмоциональную окраску. Команда работает над улучшением алгоритмов и электродов, чтобы цифровая речь звучала естественно, с возможностью контролировать высоту и ритм для пения или выразительного общения.

BrainGate

BrainGate — консорциум научных организаций, занятых восстановлением речевых возможностей парализованных пациентов. Начал работу в США в 2000-х годах при участии университетов Брауна, Стэнфорда, Массачусетса, Кейс Вестерн и других. Основная задача команды — создание интерфейсов мозг-компьютер (BCI) для восстановления речи, моторики и управления устройствами у людей с параличом, вызванным инсультом, травмами или нейродегенеративными заболеваниями.

Технология основана на имплантируемых микроэлектродных матрицах, которые устанавливаются в моторную кору мозга [16]. Массивы фиксируют нейронную активность, связанную с попытками говорить или совершать движения. Данные с электродов анализируются с помощью нейросетей: сигналы декодируются в текст, команды для управления техникой или в синтетическую речь, зачастую на основе ранее записанного голоса пациента.

Проведение испытания. Источник

Проведение испытания. Источник [17]

BrainGate провела [17] клинические испытания. В 2023 году пациентка с БАС Пэт Беннетт смогла набирать текст со скоростью 62 слова в минуту буквально силой мысли. В 2024 году система декодировала полные предложения с точностью распознавания до 75% у пациента с полным параличом, синтезируя голос на основе его прошлых записей. Технологию клинически испытали на 20 пациентах, причем успешно.

НейроЧат

В России созданием интерфейсов мозг-компьютер для людей с тяжелыми нарушениями речи и движений занимается «НейроЧат» [18]. Цель — позволить пациентам с инсультом, травмами позвоночника и боковым амиотрофическим склерозом снова общаться, отправлять сообщения или управлять устройствами.

Клинические испытания технологии. Источник

Клинические испытания технологии. Источник [18]

Что с перспективами

Обучение систем, показанных выше, дело небыстрое. Оно занимает десятки или сотни часов, пока пациенты мысленно «произносят» текстовые подсказки, а нейросети все это анализируют и обучаются. Для ускорения процесса команда под руководством Ника Рэмси исследует [14], насколько схожи паттерны моторной коры у разных людей. Если они близки, модели, обученные на предыдущих пациентах, могут сократить время подготовки для новых пользователей.

Есть еще одна проблема, связанная с оборудованием. Современные электроды не всегда способны точно уловить все нюансы мозговых сигналов, которые нужны для естественного звучания голоса. Ученые стараются создать более чувствительные датчики и улучшить алгоритмы, чтобы синтетическая речь стала живой и эмоциональной. Например, для генерации реалистичных голосов уже применяют современные нейросетевые модели — трансформеры (это тот же принцип, на котором работает ChatGPT от OpenAI).

Этические вопросы играют важную роль в разработке технологий восстановления речи. Ник Рэмси подчеркивает, что современные системы не способны и не должны декодировать все мысли человека — они работают только тогда, когда пользователь сознательно пытается что-то сказать. Это важно, потому что многие мысли озвучить не хотелось бы никому из нас. Так что такой подход гарантирует, что управление остается полностью под контролем пользователя.

Недостатков и проблем, конечно, много: технологии синтеза естественной речи на основе нейроинтерфейсов все еще в стадии развития. Но каждый новый шаг в этой области приближает будущее, когда утратившие голос пациенты снова смогут говорить.

Автор: Darya_Frolova

Источник [19]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14626

URLs in this post:

[1] инсульта: http://www.braintools.ru/brain-disease/insult

[2] интеллект: http://www.braintools.ru/article/7605

[3] мозга: http://www.braintools.ru/parts-of-the-brain

[4] обучение: http://www.braintools.ru/article/5125

[5] слуха: http://www.braintools.ru/article/6251

[6] Источник: https://engineering.berkeley.edu/news/2025/03/brain-to-voice-neuroprosthesis-restores-naturalistic-speech/

[7] распознавания: https://www.youtube.com/watch?v=MGSoKGGbbXk

[8] эмоций: http://www.braintools.ru/article/9540

[9] разрабатывает: https://en.wikipedia.org/wiki/Precision_Neuroscience

[10] интерфейс Layer 7: https://precisionneuro.io/product

[11] стимулировать: http://www.braintools.ru/article/5596

[12] мозге человека: http://www.braintools.ru/article/7543

[13] испытания: https://www.biospace.com/press-releases/precision-neuroscience-receives-fda-clearance-for-high-resolution-cortical-electrode-array

[14] Источник: https://arstechnica.com/health/2025/04/neuroscientists-are-racing-to-turn-brain-waves-into-speech/

[15] использует: https://www.nih.gov/news-events/nih-research-matters/brain-computer-interface-helps-paralyzed-man-speak

[16] кору мозга: http://www.braintools.ru/article/3368

[17] Источник: https://med.stanford.edu/news/all-news/2023/08/brain-implant-speech-als.html

[18] «НейроЧат»: https://neurochat.pro/

[19] Источник: https://habr.com/ru/companies/ru_mts/articles/904330/?utm_campaign=904330&utm_source=habrahabr&utm_medium=rss

www.BrainTools.ru

Rambler's Top100