Если вы вдруг пропустили новость, напомню, что неделю назад Милла Йовович и крипто-предприниматель Бен Сигман выпустили open-source библиотеку MemPalace – менеджер памяти для AI-агентов, где Милла выступила как целый системный архитектор – вот умничка.
Проект моментально стал вирусным, побил все бенчмарки, набрал 40 000 звезд на Github, собрал восторженные отзывы – в общем, сделали по красоте, если б не одно но: на поверку оказалось, что вся архитектура… банальный плагиат.
Восстановим хронологию
5 апреля – создание репо на аккаунте Йовович
7 апреля – анонс на Hacker News и разгон хайпа
7 апреля же в issue на github приходит пользователь LunarFawn с деликатным вопросом – “А как так получилось, что архитектура mempalace прям в точности, прям под копирку повторяет архитектуру SaraBrain?”
Кто такая Sara Brain?
Не кто, а что. Это проект за авторством Дженнифер Перл aka LunarFawn, упомянутой выше. Причем опубликован он был еще в марте, за месяц до mempalace. SaraBrain реализует архитектуру Path-of-thought, работу над которой Дженнифер начала еще в 90-х, без малого тридцать лет назад.
Дженнифер перечислила следующие архитектурные совпадения, которые она считает ядром SaraBrain:
-
локальное хранение, без cloud-зависимостей
-
LLM как сенсорный интерфейс, а не мозг
-
граф знаний в sqlite-сторадже
-
отсутствие обобщений и “забывания” фактов
-
обход графа на стадии извлечения данных
-
минимум внешних зависимостей
Все эти принципы декларируют оба проекта. Особенно интересно получается, если поставить проекты нос-к-носу и сравнить.
|
SaraBrain |
MemPalace |
|
Нейроны 4 типов |
4-слойный стек памяти |
|
Сегменты (ребра между нейронами) |
“Крыло” (дворца) и “комнаты” |
|
Пути (цепочки сегментов) |
Коридоры между комнатами |
На что товарищ наш Сигман отшучивается и парирует – не знаем мы никакую Сару Брейн и над проектом работаем аж полгода с ноября, только он в приватном репо на деревне у бабушки. Но публиковать его нельзя – там в исходных коммитах много-много персональных данных.
Скрытый текст
Вот интересно, а зачем библиотеке для ai-агентов перс.данные в исходниках? Может банально чужие копирайты?
Дженнифер справедливо замечает, что код вы не руками писали, а сгенерировали Claude Opus, а у него есть доступ к публичным репозиториям и веб-ресурсам. Кто-то в комментах даже пошутил: представьте код сгенерирован промтом “возьми все идеи из этого paper, переименуй термины и commit-push”.
Накрутка
Однако, стоило реальным пользователям попробовать на зубок этот ваш дворец, как сразу всё стало ясно: и звёзды на github накручены и заявленные фичи не реализованы, а результаты бенчмарков подтасованы.
Например, заявленная фича “Обнаружение противоречий в фактах” просто отсутствует в коде – нашли одно-единственное место, где происходит всего лишь дедупликация через проверку на точное совпадение в триплетах (субъект, предикат, объект).
AAAK – это не lossless компрессия. Они обрезают строки до 55 символов, сортируют по частоте ключевых слов, а функция decode формирует мапу из тегов, а не деконструирует исходную строку.
LoCoMo – бенчмарк, который ничего не проверяет. Смотрите сами в их BENCHMARKS.md:
The Sonnet rerank is essentially doing reading comprehension over all sessions — the embedding retrieval step is bypassed entirely.
То есть то, ради чего создавался бенч (стадия retrieval) они полностью скипнули.
В бенчмарке LongMemEval тоже присутствуют фундаментальные ошибки верификации результатов: во-первых, все ответы давно утекли в паблик и попали в обучающие выборки llm, во-вторых проверяют только поиск, но не генерацию ответов. В-третьих, для каждой сессии вопросов создается один документ, в который попадают только ответы пользователей (ответы агентов вообще не индексируются), а бенч проверяет, что хотя бы одна из найденных сессий попадает в top5. Причем есть проверка на полное совпадение top5, но она отключена.
Крипто-скам
Как только стало ясно, что темка стрельнула, Бен как настоящий криптан недолго думая релизнул мемкоин MEMPALACE, который уже через сутки обвалился в ноль.
Забавно видеть как честнейший человек Сигман банит направо и налево за раскрытие планов по монетизации mempalace. Тоже мне секрет полишинеля.
Перелицензирование
Сама Дженнифер Перл даже не обвиняет в воровстве идеи и признаёт, что совпадения бывают, однако остается вопрос перелицензирования – исходный код проекта SaraBrain выкладывался под лицензией CC BY-NC-ND 4.0 которая осложняет коммерческое использование, а mempalace выпустили под лицензией MIT и это позволяет корпорациям творить что угодно. И теперь человек, который потратил 30 лет на исследования не будет даже упомянут как автор оригинальной идеи. И что с этим делать в эпоху ИИ пока не понятно.
Заключение
Разумеется, вы всё наговариваете и просто завидуете.
Разумеется, вышедшая в тираж актриса в паре с крипто-скамером целых полгода проводили научные изыскания и сотни экспериментов.
И конечно же они не вбивали пару промптов в ClaudeCode (один – “сделай мне AI-библиотеку”, второй – “удали все копирайты”).
Нет-нет-нет.
Верим?
Автор: 0xBAB10


