
Начну с главного: в отличие от нашего серого вещества, у кремниевой нейросети нет белка, который слипается в бляшки, нет нейрофибриллярных клубков из тау-белка и много чего еще нет. И хотя к концу контекстного окна модель начинает соображать хуже, списать ее сбои на нейросетевой аналог деменции не выйдет, механизм тут совсем другой. Так что ждать, что сеть сама собой, к концу диалога, доберется до чего-то похожего на настоящую болезнь, не приходится.
Зато смоделировать деменцию в нейросети, к счастью для нейробиологов, можно. И когда исследователи это делают, то есть берут обученную сеть и аккуратно ее ломают, сеть начинает деградировать так, что это на удивление похоже на то, что видят неврологи у живых пациентов. Свежие воспоминания исчезают раньше старых. Конкретное забывается раньше общего. Долго ничего не заметно, симптомы не проявляются, зато потом все обрушивается почти разом.
И это рабочий инструмент вычислительной нейробиологии, которому уже за 30 лет. Давайте разбираться, как он устроен и кому от этого польза.
Что мы не обсуждаем
Когда слышишь «нейросеть все забыла», первой возникает мысль про катастрофическое забывание: дообучили модель новой задаче, и она затерла старую.
Если вы не знали, это фундаментальное ограничение ИИ, при котором интеграция новых данных приводит к радикальной перезаписи синаптических весов.
Это реальная проблема, и тема хоть и интересная (и достаточно популярная), но к нашей отношения не имеет. Это как перезаписать новое видео поверх старого на кассете или флешке, или компакт-диске. Или научить сеть распознавать котов, потом дообучить на собаках — и она тут же забудет, как выглядят коты.
Здесь другое. Мы берем здоровую обученную сеть и повреждаем ее: вырезаем связи между нейронами, глушим веса, понижаем сигнал — и никакого переобучения. Просто разрушение структуры, и это ровно то, что физически происходит в мозге при нейродегенерации, где синапсы и нейроны буквально гибнут.
Вопрос исследователя простой: если сломать модель так же (или хотя бы примерно), как болезнь ломает мозг, повторит ли модель симптомы пациента? И на удивление, ответ будет положительным.
Почему искусственная сеть вообще годится в модели болезни
Идея опирается на важный факт: искусственные нейросети изначально срисованы с простых биологических нейросетей, состоящих из пирамидальных нейронов. И современные глубокие сети не просто вдохновлены мозгом, они неплохо предсказывают и реальную активность зрительной коры приматов. То есть в каких-то узких задачах модель и мозг обрабатывают информацию очень и очень похоже.
Из этого следует логичный шаг. Если здоровая сеть является приличной моделью здорового участка мозга, то сломанная сеть уже кандидат в модели больного мозга. И у нее есть свойство, которого нет ни у одного пациента: с ней можно делать что угодно. Удалить ровно N% связей, откатить повреждение назад, прогнать 100 вариантов прогрессии за вечер. На живых людях такие эксперименты по понятным (надеюсь) причинам невозможны.
|
Что хотим сделать |
Живой мозг (пациент) |
Искусственная сеть |
|
Удалить ровно заданный % связей |
нет |
да, с точностью до связи |
|
Откатить повреждение назад |
нет |
да |
|
Прогнать сотни вариантов прогрессии |
нет |
да, за вечер |
|
Видеть все «нейроны» одновременно |
нет |
да, целиком |
|
Повторить с того же исходного состояния |
нет |
да (фиксируем seed) |
|
Точно знать причину сбоя |
очень трудно |
да, механизм на виду |

Каталог готовых ИИ-моделей
Сервис для запуска и управления LLM в облаке Selectel. Выберите модель, конфигурацию и получите готовый эндпоинт для работы с ней.
Классика жанра: Альцгеймер на сети Хопфилда
Первый заход сделали еще в 1993 году Дэвид Хорн, Эйтан Руппин и коллеги, позже развили Руппин и Реджиа. Они взяли сеть Хопфилда, простую модель ассоциативной памяти, которая умеет восстанавливать целый образ из его обрывка или зашумленной версии. Грубо говоря, вы показываете ей половину знакомого паттерна, а она предсказывает все остальное.
Дальше интереснее. В мозгу при Альцгеймере синапсы гибнут, но уцелевшие физически увеличиваются, то есть становятся сильнее. Мозг, таким образом, компенсирует потери, поддерживая суммарную силу связей. Хорн и Руппин встроили это в модель: удаляли связи, а оставшиеся усиливали так, чтобы средний вход на нейрон не падал.
И получили интересный результат. Оказалось, что компенсация маскирует повреждение. Сеть с наполовину вырезанными связями, но усиленными остатками, работает почти как здоровая — пока деградация не переваливает за порог, после которого все рушится резко. Это объясняет две вещи, которые давно мучили ученых: почему симптомы Альцгеймера появляются поздно и внезапно, и почему количество бляшек в мозге так слабо коррелирует с тяжестью симптомов на ранних стадиях. Мозг долго вывозит за счет компенсации, а потом она исчерпывается.
Я собрал крошечную версию этого эксперимента. Сеть на 200 нейронов, 8 запомненных паттернов, стохастическое обновление (то есть с шумом — иначе эффект компенсации не виден, об этом ниже):
import numpy as np
rng = np.random.default_rng(7)
N, P, NOISE, TRIALS, SWEEPS = 200, 8, 0.20, 60, 12
BETA = 2.2 # обратная "температура": конечный шум при обновлении нейрона
patterns = rng.choice([-1, 1], size=(P, N))
W0 = (patterns.T @ patterns) / N
np.fill_diagonal(W0, 0.0)
def recall_quality(W):
qs = []
for _ in range(TRIALS):
idx = rng.integers(P)
xi = patterns[idx]
s = xi.copy()
flip = rng.choice(N, size=int(NOISE * N), replace=False)
s[flip] *= -1
for _ in range(SWEEPS):
for i in rng.permutation(N):
h = W[i] @ s
p = 1.0 / (1.0 + np.exp(-2 * BETA * h))
s[i] = 1 if rng.random() < p else -1
qs.append(max(np.dot(s, xi) / N, 0)) # 1.0 = идеальное восстановление
return np.mean(qs)
def delete(W, d):
m = rng.random((N, N)) > d
m = np.triu(m, 1); m = m + m.T
return W * m
for d in [0.0, 0.3, 0.5, 0.7]:
Wd = delete(W0, d)
print(f"{d*100:3.0f}% удалено | без компенс.: {recall_quality(Wd):.2f}"
f" | с компенс.: {recall_quality(Wd/(1-d)):.2f}")
Что выдает:
|
Удалено связей |
Без компенсации |
С компенсацией |
|
0% |
0,90 |
0,94 |
|
30% |
0,49 |
0,88 |
|
50% |
0,22 |
0,85 |
|
70% |
0,04 |
0,60 |
То же самое, но сразу по всем уровням повреждения. Красная кривая (без компенсации) ползет вниз почти от старта, зеленая (с компенсацией) долго держится у потолка и обрывается только под конец. Зеленая область между ними и есть тот выигрыш, который дает компенсация:
Без компенсации память сыплется почти сразу: вырезали половину связей и качество восстановления упало с 0,90 до 0,22. С компенсацией та же сеть при 50% повреждений держит 0,85, будто почти ничего не случилось. А потом, ближе к 70–80%, все равно проваливается.
А теперь то же самое на конкретной картинке. Я зашил в такую сеть один образ и стал прогрессивно убивать синапсы. Слева без компенсации, справа с ней, процент удаленных связей одинаковый:

Без компенсации образ тонет в шуме уже к 40% повреждений. С компенсацией он держится четким раза в полтора дольше, а потом все равно растворяется в шуме. Компенсация не спасает от болезни, зато отодвигает момент, когда уже поздно что-то делать.
Кстати, забавная деталь. В первой демо-версии компенсация вообще не работала — кривые совпадали. Оказалось, в «голой» сети Хопфилда нейрон смотрит только на знак входящего сигнала, а умножение всех весов на положительное число знак не меняет. Усиливай не усиливай — решение то же. Компенсация начинает что-то значить, только когда важна величина сигнала, а не только его направление. Поэтому в модели нужен шум: тогда сильный сигнал надежнее пробивается сквозь него, чем слабый. И это ровно тот биологический смысл, который вкладывали авторы: компенсация удерживает уровень сигнала над шумом.
Семантическая деменция: почему сначала забывается частное
Другая ветка работ моделирует семантическую деменцию — расстройство, при котором человек теряет знание о значениях. Здесь в ходу модель «хаб-и-спицы»: есть периферийные зоны под зрение, звук, движение (спицы) и общий смысловой узел-хаб, который их связывает.
Когда в нейросетевой модели повреждают хаб, всплывает характерный узор: частности теряются раньше общего. Пациент (и модель) еще узнает, что перед ним животное, но уже не отличает спаниеля от терьера, потом перестает отличать собаку от лошади, и в пределе остается просто «какая-то картинка». Модели Роджерса, Лэмбон Ральф и коллег воспроизвели и более тонкие эффекты — например, разную уязвимость живого и неживого. Это сильный аргумент: если простая искусственная сеть, сломанная в нужном месте, повторяет специфический клинический узор, значит, в гипотезе про устройство памяти что-то вырисовывается верно.

Что умеют современные глубокие сети
В 2021–2023 годах группа Мура и коллег перенесла подход на сверточные сети — те самые, что распознают объекты на картинках. Они моделировали заднюю корковую атрофию, атипичную форму Альцгеймера, бьющую по зрению, и случайно «травмировали» связи между искусственными нейронами. Сеть постепенно теряла способность узнавать объекты, причем (и это важно) теряла их иерархически: сначала уплывал конкретный объект, а более грубое разбиение по категориям держалось дольше. Тот же мотив «частное раньше общего».
В 2025 в Scientific Reports пошли дальше и добавили нейропластичность: повреждали сеть распадом весов, а затем дообучали — это аналог того, как мозг перестраивается, обходя поломку. Появились даже работы про «старение» более крупных моделей, включая языковые.
Сюжетный твист: чат-боты сдают тест на деменцию
И тут — публикация, которая в конце 2024 года разлетелась по новостям. В BMJ Дайан, Улиэль и Коплевиц с коллегами усадили ведущие чат-боты (версии ChatGPT, Claude, Gemini) проходить MoCA — Монреальский когнитивный тест, которым у пожилых скринят раннюю деменцию. Максимум 30 баллов, норма от 26.
Результат: почти все модели, кроме одной, показали что-то похожее на легкое когнитивное снижение — особенно проседали зрительно-пространственные и исполнительные задачи. Звучит сенсационно, но читать это надо трезво.
Во-первых, статичная модель не стареет: ее веса не меняются между запросами, никакой динамики болезни там нет. Во-вторых, MoCA придуман для людей, и его задания (нарисовать часы, соединить точки) бьют ровно по слабому месту текстовых моделей — у них нет нормального пространственного восприятия. Это скорее несовпадение инструмента и испытуемого. Авторы и сами подавали работу скорее как остроумную провокацию о том, что не стоит спешить заменять врачей чат-ботами.
Полезный вывод тут — «инструмент, которым мы собираемся диагностировать людей, сам спотыкается на том же тесте». Кстати, интересный факт: после этого теста появился бенчмарк по рисованию часов со стрелками, хотя пеликан на велосипеде, как по мне, был интереснее.
И как это помогает людям
Так ради чего ломать сети?
Песочница нам нужна для гипотез. На модели можно проверить идею о механизме болезни за вечер, без больниц и томографов. Гипотеза про компенсацию выше — как раз такой случай: модель показала, почему симптомы запаздывают, и это потом искали (и находили) в реальных данных.
Понимание порога — это вопрос времени вмешательства. Если деградация долго маскируется, а потом обрывается, то ключевой вопрос терапии «сколько осталось до обрыва компенсации». Модель дает язык, чтобы про это думать количественно.
Предсказание прогрессии. Персонализированные модели, настроенные на конкретного пациента, в перспективе помогают прикинуть, как пойдет болезнь и где раньше всего проявится дефицит.
Дизайн ИИ-диагностики. История с MoCA — прямое предупреждение: модели, которые собираются помогать врачам, имеют собственные слепые зоны. И если мы их знаем, значит, не будем доверять ИИ те задачи, где он сыплется.
Где у метода границы
Будет нечестно не упомянуть о границах метода. Совпадение узоров деградации — это, понятное дело, всего лишь аналогия. То, что сломанная сеть забывает, почти как и пациент, не доказывает, что в мозге работает ровно этот механизм; это лишь делает гипотезу правдоподобной. Сами модели — жесткие упрощения: сотни нейронов против десятков миллиардов, без химии и без настоящего тау-белка. И никто, разумеется, «не вылечил Альцгеймер на нейросети» — мы получаем подсказки, куда смотреть, но никак не лекарство (к сожалению).
Поэтому слово «деменция» здесь честнее держать в кавычках. Мы, скорее, строим ее карикатуру, ломаем по правилам, списанным с биологии, и смотрим, не узнаем ли в обломках что-то знакомое. Удивительно часто — узнаем.
Пишите в комментариях, какие еще чисто человеческие «баги» или расстройства, по-вашему, было бы интересно и полезно смоделировать в нейросетях.
Автор: inkedsymon


