Как я превратила Obsidian в структурированную память для ИИ‑агентов

Эта статья про NOUZ — локальный MCP‑сервер между Obsidian и ИИ‑агентом. Он превращает базу заметок в структурированную память ^[1]: с уровнями, связями и сигналами дрейфа.

Внутри — как я пришла к этой архитектуре и что она даёт агенту при работе с базой.

Я плотно работаю с ИИ с момента его широкого распространения в свободном доступе. Сначала у нас были простые чаты, потом мы вывели формулы промптов для лучших результатов. Сейчас всё гораздо интереснее.

Когда я поняла, что агенты могут полноценно работать вместе со мной в Obsidian, я мечтала превратить весь воркспейс в полноценную «общую» рабочую среду — и для кодинга, и для работы с документами.

Вот мой идеал рабочего процесса: выгружаю сырые мысли и логи, фиксирую результаты экспериментов с разными моделями, шлифую тексты, много читаю и думаю. Агент работает с кодом и заметками, а главное — сам понимает, где что хранится, к какому проекту относится и какой контекст сейчас важен.

Реальность оказалась жестокой.

Главной проблемой стали лимиты токенов и ошибки ^[2] распознавания контекста. База у меня разнообразная: заметки про ИИ, системную аналитику, черновики статей, куски исследований, рабочие логи, мысли, гипотезы и много готового контента. А ещё я люблю изучать астрофизику наравне с семиотикой и философией.

Я пробовала строить граф с вики‑ссылками, просила агента читать конкретные документы, давала подробные промпты. Агент мог честно обработать много текста — и всё равно промахнуться по смыслу или потерять информацию. Тогда стало понятно: нужна навигация по структуре базы. Агент должен видеть место заметки на графе: к чему она относится, какой у неё уровень, какие связи подтверждены и что перед ним сейчас — сырой лог, гипотеза, источник, черновик или уже осмысленная единица знания. Нужен был свой MCP-сервер.

Что получилось

NOUZ — сервер‑посредник между моей базой в Obsidian и ИИ‑агентом. Он работает локально: заметки, индекс и эмбеддинги хранятся у меня. Если я подключаю облачного агента, наружу уходит только тот контекст, который я сама отдаю через MCP‑клиент. Код открыт, всё можно прочитать и запустить у себя.

NOUZ как прослойка между Markdown-базой и ИИ-агентом

Снаружи это выглядит довольно просто: есть хранилище с Markdown‑файлами, YAML‑фронтматтер, локальный SQLite‑индекс и MCP‑инструменты, через которые агент может работать с базой. Мне нужно было, чтобы агент видел базу как структуру.

Каждая заметка для NOUZ имеет несколько слоёв. Первый слой — место в графе. Заметка может быть ядром, паттерном, модулем, квантом или артефактом. Паттерны дают агенту дополнительный слой знаний. Модули получились функциональными единицами, выпускающими контент. Квант — смысловая единица: пост, исследование, статья, стратегия. Артефакт — сырьё: лог, ссылка, кусок диалога, черновая заметка, спецификация, ссылка на внешний источник (а ещё поступление артефактов в базу можно автоматизировать).

Второй слой — связи. Заметка может иметь родителей и детей. Иногда связь строгая, иногда временная, иногда это мост между разными областями.

Третий слой — знаки. Знак ядра показывает, вокруг какой смысловой области вращается заметка. Знак артефакта показывает роль материала: гипотеза, мысль, черновик, спецификация. Классификация здесь тоже зависит от данных.

Как я пришла к ядрам

В этот момент я начала активно изучать эмбеддинги. Мне нужно было понять, как дать агенту не просто набор файлов, а навигацию: где заметка находится, к чему относится и какую роль играет.

И тут я подумала: а что если взять модель для эмбеддингов, прогнать через неё каждую заметку, получить по одному вектору на файл — и сравнивать заметки между собой и с эталонными текстами моих основных рабочих областей? Эталон играет роль смыслового магнита: показывает, насколько этот текст ближе к «системному анализу», чем к «физике» или «вычислениям». Если представить векторы как точки на упрощённой схеме, эталон становится центром притяжения, а знак ядра — рамкой, которую я накладываю сверху. Так у заметки появляется не только текст, но и смысловая координата внутри базы.

Параллельно появилась другая линия: насколько вообще можно переносить принципы живого интеллекта ^[3] на искусственный? Не буквально, скорее как инженерные эвристики. Меня зацепили статьи про позиционную идентичность нейральных стволовых клеток — у них есть память о своём положении, и это влияет на их дальнейшую роль. Я не пыталась доказать, что граф заметок устроен как мозг ^[4], мне нужен был перенос принципа: если элемент системы имеет место, историю и окружение, эти признаки стоит хранить явно.

Так я начала смотреть на заметки как на ноды графа. У каждой ноды есть текст и координаты: родитель, уровень, домен, связи, соседние узлы. Чтобы это отслеживать, я ввела обозначения и уровни. Сначала это было похоже на ID: если у заметки есть положение, родитель, уровень и соседние связи, у неё должен быть короткий способ сказать «я отсюда».

Смысловые области базы: мои рабочие ядра и роли заметок в графе. — *Смысловые области базы: мои рабочие ядра и роли заметок в графе*.

Ядро в NOUZ — это крупный смысловой центр, вокруг которого собирается информация. Я интересуюсь наукой ^[5], веду проекты Семиотроники, собираю материалы для курса, пишу код, думаю про ИИ, физику и системный анализ. Для своей базы я определила такие ядра: системная аналитика, наука и вычисления. В другой базе ядра будут другими: продукт, клиенты, юридические документы, обучение ^[6], дизайн, медицина, финансы. Важен сам принцип: человек задаёт свои крупные оси внимания ^[7]. Я отдельно подробно остановилась на ядрах, потому что от настройки эталонных текстов сильно зависит дальнейшая работа агента с базой. Меня радует, что настроить конфиги с эталонами достаточно 1 раз.

Зачем это агенту

Когда агент работает через NOUZ, он видит положение заметки в системе: где она находится, какие у неё соседи, с чем она связана, какие переходы уже подтверждены, а какие пока остаются кандидатами.

Если я прошу помочь с текстом или идеей, агенту нужно понимать, что именно он анализирует. Один и тот же абзац может быть проверенным выводом, рабочей гипотезой, старым логом, черновиком или внешним источником. Без этой разницы модель легко начинает обращаться со всем одинаково уверенно, соответственно и выдавать не всегда релевантный результат.

В NOUZ такой материал виден агенту иначе. Сырой лог остаётся сырьём. Гипотеза остаётся гипотезой. Готовый квант знания отличается от артефакта, который только помогает его собрать. Агент всё ещё может читать любые материалы, но у него появляется контекст осторожности: что можно использовать как опору, а что сначала нужно проверить, уточнить или поднять выше по структуре.

Для меня это стало главным сдвигом.

Где здесь эмбеддинги

Эмбеддинги в NOUZ работают как второй слой наблюдения за базой.

Сначала я явно задаю уровень заметки, родителя, статус, знак, связи. Это мой способ сказать агенту: «вот как я понимаю место этого материала в базе». А затем сервер может посмотреть на тот же текст через эмбеддинги и сравнить его с эталонами ядер.

Так появляется автоматический сигнал. Он может подсказать, что заметка тянется к другому ядру, что в тексте смешались две области, или что рядом есть узлы, которые стоит проверить. Но это не окончательная разметка. Это наблюдение, которое нужно сопоставить с ручной структурой.

На этом слое NOUZ начинает предлагать дополнительные связи. Например, семантические мосты по полному тексту. Они возникают, когда заметки из разных областей оказываются близки по сигналу.

Или мосты по тегам и коротким понятиям. Иногда тексты целиком разные, но в метках проявляется одна и та же скрытая тема.

Ещё сервер следит за дрейфом структуры. Если модуль по ручной разметке относится к одному ядру, а его содержимое всё сильнее уходит в другую тему, NOUZ подсветит это расхождение.

Геометрическая поправка

Всё это работает только при одном условии: сырой косинус между векторами нельзя принимать за готовый ответ.

Очень быстро вылезла геометрическая проблема: векторы текстов распределены в пространстве неравномерно, а тяготеют к общему направлению. Из‑за этого почти любые две заметки получают высокую близость, хотя для человека между ними есть важная дистанция. Это и есть анизотропия эмбеддингов.

В NOUZ для этого есть калибровка, и про неё я планирую отдельную статью с числами и экспериментом. Здесь важно одно: эмбеддинги дают сильный сигнал, но этот сигнал требует калибровки и человеческого решения.

Чем это отличается от обычного RAG

RAG обычно отвечает на вопрос: какие фрагменты текста похожи на запрос?

Мне этого было мало. В моей задаче агенту нужно понимать, какую роль играет найденный фрагмент и как влияет на него окружение. Можно найти похожий текст, но взять его из сырого лога вместо готового вывода. Можно найти хороший источник, но пропустить документ, где этот источник уже осмыслен. Поэтому я думаю о NOUZ как о структурной памяти. Память здесь — это способность помнить, как материалы связаны.

Три режима

Постепенно у сервера появились три режима.

LUCA — стартовый слой: граф, YAML и связи. Его можно использовать без эмбеддингов, чтобы сначала создать структуру.
PRIZMA — семантика: ядра, эталоны, автоматические подсказки, мосты, профиль смыслового состава и сигналы дрейфа.
SLOI — всё что есть в PRIZMA + строгая пятиуровневая иерархия.

Мне нравится, что можно начинать мягко: взять папку заметок, начать с графа, потом добавить ядра, потом включить семантические проверки.

Что остаётся за человеком

Самое важное правило у меня получилось очень простым: сервер считает, человек решает. NOUZ может предложить знак, связь, родителя, мост или предупреждение о дрифте, но он не должен молча переписывать смысл базы. Особенно если база личная, исследовательская, живая.

*YAML-разметка для пользователя, координаты для агента*

В такой базе есть вещи, которые ни одна модель не знает, если она не дообучена на данных пользователя: почему заметка появилась, с какой задачей связана и что в ней главное для автора. Отсюда ещё одно правило: знак, назначенный пользователем, неприкосновенен для автоматики. Это дисциплина совместной работы. Модель хорошо считает, сравнивает, вытаскивает похожести и замечает слабые места. Человек держит намерение, историю и критерий важности.

NOUZ стал для меня способом держать этот баланс.

Что дальше

Вся эта система — мой первый самостоятельный проект такого масштаба, и я продолжаю его растить. Нынешняя версия уже закрывает мои главные боли ^[8], а дальше хочется улучшать интерфейс для Obsidian, алгоритмы связывания и слой для междисциплинарных исследований.

Следующий текст я хочу посвятить анизотропии эмбеддингов подробнее: эксперимент на живой базе, цифры до и после калибровки, как меняются сигналы дрейфа или предложений по структуре.

А затем хочется перейти к структурным изоморфизмам. У меня есть гипотеза и первые наблюдения: успешные паттерны из физики, биологии и системного анализа можно осторожно переносить в инженерию знаний. NOUZ может стать экспериментальным стендом для проверки таких переносов.

Ссылки

GitHub: https://github.com/Semiotronika/NOUZ‑MCP ^[9]
PyPI: https://pypi.org/project/nouz‑mcp/ ^[10]

Меня зовут Мария Белкина, разрабатываю инструменты для семантической работы с базами знаний и ИИ‑агентами.

Автор: Masha_Belkina_Log

Источник ^[11]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/30080

URLs in this post:

[1] память: http://www.braintools.ru/article/4140

[2] ошибки: http://www.braintools.ru/article/4192

[3] интеллекта: http://www.braintools.ru/article/7605

[4] мозг: http://www.braintools.ru/parts-of-the-brain

[5] наукой: http://www.braintools.ru/article/7634

[6] обучение: http://www.braintools.ru/article/5125

[7] внимания: http://www.braintools.ru/article/7595

[8] боли: http://www.braintools.ru/article/9901

[9] https://github.com/Semiotronika/NOUZ‑MCP: https://github.com/Semiotronika/NOUZ-MCP

[10] https://pypi.org/project/nouz‑mcp/: https://pypi.org/project/nouz-mcp/

[11] Источник: https://habr.com/ru/articles/1033746/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1033746

Нажмите здесь для печати.