PAD+ AI v4.0: исследовательская когнитивная архитектура поверх LLM. fastapi.. fastapi. llm.. fastapi. llm. Open source.. fastapi. llm. Open source. python.. fastapi. llm. Open source. python. rag.. fastapi. llm. Open source. python. rag. react.. fastapi. llm. Open source. python. rag. react. Truth Loop.. fastapi. llm. Open source. python. rag. react. Truth Loop. X-Ray.. fastapi. llm. Open source. python. rag. react. Truth Loop. X-Ray. искусственный интеллект.. fastapi. llm. Open source. python. rag. react. Truth Loop. X-Ray. искусственный интеллект. когнитивная архитектура.. fastapi. llm. Open source. python. rag. react. Truth Loop. X-Ray. искусственный интеллект. когнитивная архитектура. наблюдаемость.. fastapi. llm. Open source. python. rag. react. Truth Loop. X-Ray. искусственный интеллект. когнитивная архитектура. наблюдаемость. память AI.. fastapi. llm. Open source. python. rag. react. Truth Loop. X-Ray. искусственный интеллект. когнитивная архитектура. наблюдаемость. память AI. Программирование.

Что происходит между запросом пользователя и ответом языковой модели?

За последние несколько лет большие языковые модели совершили настоящую революцию. Сегодня они способны писать код, анализировать документы, помогать в исследованиях, создавать тексты и решать сложные задачи.

Однако подавляющее большинство современных AI‑приложений имеют практически одинаковую архитектуру:

Запрос → Prompt → LLM → Ответ

Вся интеллектуальная работа фактически сосредоточена внутри языковой модели, а внешняя система лишь подготавливает запрос и отображает результат.

Такой подход хорошо работает для большинства задач, но оставляет открытым фундаментальный инженерный вопрос:

Что должно происходить между получением запроса пользователя и генерацией ответа?

Именно исследованию этого вопроса посвящён проект PAD+ AI.


Что такое PAD+ AI

PAD+ AI — это открытая исследовательская когнитивная архитектура, работающая поверх современных языковых моделей.

Проект не создаёт собственную LLM и не пытается конкурировать с существующими моделями. Напротив, он рассматривает языковую модель как один из компонентов более сложной системы принятия решений.

Вместо прямой передачи пользовательского запроса в LLM система проводит его через последовательность независимых когнитивных фаз. На каждом этапе анализируется определённый аспект обработки: безопасность, намерение пользователя, память, личность, эмоциональное состояние, стратегия генерации, проверка утверждений, обновление внутреннего состояния системы и многое другое.

В результате ответ формируется не одним вызовом модели, а последовательностью взаимосвязанных инженерных процессов.


Чем PAD+ AI отличается от большинства проектов вокруг LLM

Сегодня большинство проектов развивается в одном из нескольких направлений:

  • интерфейсы для общения с языковыми моделями;

  • AI‑агенты;

  • RAG‑системы;

  • автоматизация рабочих процессов;

  • интеграция нескольких моделей.

PAD+ AI исследует другое направление.

Главный объект исследования — когнитивная архитектура, внутри которой языковая модель становится лишь исполнительным механизмом генерации текста.

В центре внимания находятся вопросы:

  • какие внутренние состояния должна иметь система;

  • как должна работать долговременная память;

  • как обеспечить наблюдаемость процесса принятия решений;

  • каким образом можно проверять собственные утверждения;

  • как организовать эволюцию состояния системы между диалогами;

  • как сделать архитектуру полностью модульной и расширяемой.


Архитектура проекта

Основой PAD+ AI является когнитивный Pipeline.

Каждый запрос проходит через последовательность этапов обработки. На уровне реализации pipeline включает 24 фазы, объединённые в укрупнённые этапы:

Safety → Intent → Retrieve → Generate → Truth → Remember → Evolve → Emit

Ниже приведён реальный порядок выполнения фаз:

  1. Safety — проверка безопасности запроса.

  2. Intent — анализ намерения пользователя.

  3. RAG — извлечение информации из векторной базы знаний.

  4. Knowledge Graph — обработка графа знаний, концептов и связей.

  5. Episodic — извлечение эпизодической памяти (история взаимодействий).

  6. Semantic — извлечение семантической памяти (факты и концепты).

  7. Emotion — анализ текущего эмоционального состояния.

  8. Persona — актуализация личности.

  9. Roots — сверка с фундаментальными принципами системы.

  10. Identity — формирование идентичности ответа.

  11. Generate — генерация ответа языковой моделью.

  12. Truth Loop — проверка утверждений ответа.

  13. Save Episode — сохранение текущего эпизода в память.

  14. Emotion Update — обновление эмоционального состояния.

  15. Consolidation — консолидация краткосрочной памяти в долговременную.

  16. Procedure Success — обработка успешного выполнения процедуры.

  17. Persona Evolution — эволюция личности на основе взаимодействия.

  18. Events Broadcast — рассылка событий подписанным компонентам.

  19. Health — мониторинг состояния системы.

  20. Reflection — самоанализ завершённого цикла.

  21. Dreams — фоновая обработка и ассоциативное связывание знаний.

  22. Metrics — сбор метрик производительности.

  23. Response Guard — защита и финальная проверка ответа.

  24. Anti‑Loop Guard — предотвращение повторяющихся циклов запросов (блокирует запрос при >3 повторений подряд).

Каждая фаза представляет собой самостоятельный программный модуль со своей ответственностью, интерфейсом и возможностью независимого развития.


Многоуровневая память

В PAD+ AI память представляет собой не единое хранилище, а целую экосистему специализированных компонентов.

Архитектура включает:

  • RAG‑память на PostgreSQL с использованием pgvector — векторный поиск по документам;

  • Эпизодическую память — история взаимодействий с пользователем;

  • Семантическую память — факты, концепты и обобщённые знания (выполняет роль, которую в ранних версиях называли «памятью фактов»);

  • Память личности (Persona) — устойчивые черты и стиль общения;

  • Память личности пользователя (User Persona) — модель предпочтений пользователя;

  • Корневую память (Roots) — неизменяемые фундаментальные принципы системы;

  • Систему гигиены памяти (Memory Hygiene) — очистка и дедупликация устаревших записей.

Каждый уровень решает собственную задачу.

Эпизоды общения постепенно преобразуются в устойчивые знания, а затем могут становиться частью фундаментальных принципов системы.

Такой подход позволяет разделять краткосрочный опыт, долговременные знания и неизменяемые основания поведения.


Emotion Engine

Эмоциональная модель построена на шестимерной системе PAD+.

Используются следующие параметры:

  • Pleasure;

  • Arousal;

  • Dominance;

  • Curiosity;

  • Confidence;

  • Social Connection.

В рамках проекта эмоции не рассматриваются как попытка имитации человеческих чувств.

Они используются исключительно как инженерный механизм управления поведением системы.

Текущее эмоциональное состояние влияет на стиль ответа, уровень детализации, уверенность формулировок и стратегию взаимодействия. Система включает механизмы естественного затухания (decay) эмоций с течением времени.


Truth Loop

После получения ответа работа системы не заканчивается.

Следующий этап — Truth Loop.

Из текста автоматически выделяются отдельные утверждения (claims), которые сопоставляются с внутренними знаниями системы.

Для проверки используются:

  • семантическая память;

  • Roots;

  • другие доступные источники знаний.

Полученные результаты используются механизмом Response Guard и при необходимости позволяют добавить отметку о степени уверенности или предупредить пользователя о возможной недостоверности отдельных утверждений.

Система не гарантирует обязательное уведомление пользователя при низкой уверенности — результат проверки передаётся в Response Guard и может быть включён в метаданные ответа или отображён как дисклеймер.


X‑Ray — наблюдаемость когнитивной архитектуры

Одной из ключевых особенностей PAD+ AI является система X‑Ray.

Практически все современные AI остаются «чёрным ящиком»: пользователь видит только итоговый ответ.

X‑Ray делает процесс обработки полностью наблюдаемым.

Для каждого запроса фиксируются:

  • прохождение всех фаз Pipeline;

  • продолжительность выполнения каждой фазы;

  • выбранные стратегии;

  • изменения эмоционального состояния;

  • результаты Truth Loop;

  • диагностическая информация;

  • ошибки и деградации.

X‑Ray — это не журнал событий, а полноценная система трассировки когнитивной архитектуры, позволяющая анализировать внутреннюю работу проекта практически в реальном времени.


Persona — инженерная модель личности

Одной из особенностей PAD+ AI является наличие отдельной системы личности.

Persona включает:

  • устойчивые черты;

  • стиль общения;

  • систему ценностей;

  • параметры эволюции.

Личность обновляется на основе взаимодействий, сохраняя при этом стабильное ядро. Механизм Persona Evolution позволяет системе адаптироваться к пользователю, не теряя фундаментальных характеристик.

Это позволяет отделить долгосрочные характеристики системы от текущего состояния диалога.


Impulse Research Program — платформа когнитивных экспериментов

Отдельного внимания заслуживает исследовательская программа Impulse, которая существует в проекте как платформа для когнитивных экспериментов.

Она описывает четыре независимых направления мышления (импульса):

  • ПОНЯТЬ (Understand) — аналитический, стремление понять;

  • УЛУЧШИТЬ (Improve) — прагматический, стремление улучшить;

  • ЗАЩИТИТЬ (Protect) — оборонительный, сохранение целостности;

  • СОЗДАТЬ (Create) — генеративный, исследование нового.

Экспериментальный пайплайн Impulse построен по 4-фазной схеме: Understand → Decide → Act → Meta. Импульс подаётся через файл data/current_impulse.txt перед запуском пайплайна.

На данный момент в рамках программы проведено 4 задокументированных эксперимента:

  • I-002 — сравнение импульсов ПОНЯТЬ / УЛУЧШИТЬ / ЗАЩИТИТЬ / СОЗДАТЬ;

  • I-003 — конфликт импульсов;

  • I-004 — конфликтующие импульсы (СОЗДАТЬ + ЗАЩИТИТЬ);

  • I-005 — [проведён, документация в репозитории].

Impulse Core (4 измерения + прайминг‑механизм) — реально существующая и работающая подсистема, но в контексте экспериментов, а не production‑пайплайна. Дорожная карта включает эксперименты I-006 — I-010.


HEALER — подсистема диагностики и восстановления

HEALER является подсистемой диагностики и восстановления системы.

В версии v4.0 HEALER существует как отдельный проект, интегрированный в репозиторий PAD+ AI. Он имеет собственную кодовую базу (healer/, aethon/), собственный CI и собственные тесты. HEALER не является встроенным компонентом пайплайна, а сосуществует в том же репозитории как самостоятельный проект.

Используя информацию X‑Ray, система анализирует завершённые сеансы работы и обнаруживает потенциальные проблемы.

Контролируются:

  • медленные этапы Pipeline;

  • ошибки выполнения;

  • деградация стратегий;

  • нестабильность провайдеров;

  • нарушения последовательности фаз.

В зависимости от выбранного режима HEALER может только фиксировать проблему, рекомендовать изменение или автоматически применять корректирующие действия.


Provider Manager

PAD+ AI не привязан к одной языковой модели.

Архитектура поддерживает работу с несколькими провайдерами через единый интерфейс.

Среди поддерживаемых сервисов:

  • OpenRouter;

  • GigaChat;

Provider Manager обеспечивает централизованное управление моделями, механизмы переключения между ними при возникновении ошибок или недоступности отдельных сервисов, а также централизованное хранение и шифрование пользовательских API‑ключей.


Технологический стек

Проект реализован с использованием современных инструментов разработки.

Backend

  • Python 3.11+

  • FastAPI

  • Uvicorn

  • Pydantic

Frontend

  • React 18

  • Vite

  • Tailwind CSS

Хранилища

  • PostgreSQL (с pgvector)

  • Supabase

Инфраструктура

  • Docker

  • Render

  • GitHub Actions


Что уже реализовано

На момент публикации проект включает:

  • когнитивный Pipeline из 24 фаз;

  • систему X‑Ray с полной трассировкой;

  • HEALER (как отдельный проект в репозитории);

  • многоуровневую память (RAG, эпизодическая, семантическая, Roots, персона, гигиена);

  • Impulse Research Program (4 задокументированных эксперимента);

  • Persona с механизмом эволюции;

  • Emotion Engine (6-мерная модель PAD+);

  • Truth Loop;

  • Anti‑Loop Guard;

  • Provider Manager;

  • более 130 API‑эндпоинтов;

  • React‑интерфейс управления;

  • более 400 автоматизированных тестов.

Проект активно развивается, а архитектура продолжает расширяться новыми компонентами и исследовательскими возможностями.


Для кого создаётся PAD+ AI

Проект ориентирован прежде всего на специалистов, интересующихся инженерными архитектурами вокруг языковых моделей.

Он может быть полезен:

  • разработчикам AI‑систем;

  • исследователям когнитивных архитектур;

  • специалистам по LLM;

  • разработчикам RAG;

  • инженерам, занимающимся агентными системами;

  • специалистам по наблюдаемости и диагностике AI.


Открытое тестирование

PAD+ AI развивается как открытая исследовательская платформа.

Проект открыт для внешнего тестирования, поскольку именно независимая обратная связь позволяет проверить устойчивость архитектурных решений и найти направления для дальнейшего развития.

Особый интерес представляют:

  • тестирование когнитивного Pipeline;

  • анализ работы X‑Ray;

  • проверка многоуровневой памяти;

  • исследование Truth Loop;

  • тестирование HEALER;

  • проверка взаимодействия с различными LLM‑провайдерами;

  • эксперименты в рамках Impulse Research Program;

  • поиск архитектурных и логических ошибок;

  • предложения по развитию проекта.

Если вам интересны современные когнитивные архитектуры, наблюдаемость внутренних процессов AI, долговременная память, инженерные модели личности и эмоций или построение модульных систем поверх языковых моделей, буду рад любой обратной связи, замечаниям, Pull Request и результатам тестирования.

Демо проекта

https://pad‑plus‑ai.onrender.com

Репозиторий GitHub

https://github.com/Ovladimirovich/pad‑plus‑ai

PAD+ AI не претендует на создание искусственного сознания и не позиционируется как замена существующим языковым моделям. Это открытая инженерная платформа, исследующая, какой может быть когнитивная архитектура вокруг современных LLM, если рассматривать модель не как всю систему целиком, а как один из её компонентов.

Автор: ovladim

Источник