- BrainTools - https://www.braintools.ru -
Данный обзор рассматривает популярные opensource проекты в сфере AI и то почему разработчикам стоит обратить на них внимание [1]. Группа экспертов GitHub провела анализ проектов, созданных за последние 99 дней, учитывая факторы, такие как количество звезд в день, форки, всплески трафика и активность контрибьюторов. В группу экспертов вошли профессионалы такие как:
Эбигейл Кабунок Майес (Abigail Cabunoc Mayes), она же @abbycabs [2], которая работает над программами сопровождения открытого кода и занимает должность директора в фонде OpenJS.
Кара Соулс, она же @karasowles [3], которая работает с сопровождающими и сообществом разработчиков открытого кода
Кевин Кросби (Kevin Crosby), он же @kevincrosby [4], руководит программой GitHub по финансированию открытых исходников
Джефф Лущ (Jeff Luszcz), он же @jeffrey-luszcz [5], который помогает управлять программным офисом GitHub по работе с открытым исходным кодом (OSPO).
Ниже мы расскажем вам об этих проектах, а также обсудим, почему, по нашему мнению, именно к ним постоянно возвращаются разработчики. Let’s go!
Если вы нашли ошибку [6], опечатку или у вас есть замечание по переводу – используйте, пожалуйста, Ctrl+Enter. Спасибо.
Краткая справка: Что такое протокол MCP?
MCP – это открытый протокол, который стандартизирует способы предоставления приложениями контекста для LLM. Представьте MCP как порт USB-C для приложений ИИ. Так же как USB-C обеспечивает стандартизированный способ подключения устройств к различным периферийным устройствам и аксессуарам, MCP обеспечивает стандартизированный способ подключения моделей ИИ к различным источникам данных и инструментам.
Источник: https://docs.anthropic.com/en/docs/agents-and-tools/mcp [7]
Сайт: https://docs.openwebui.com/ [13]
Репозиторий: https://github.com/open-webui/mcpo [14]
ЯП: Python
Лицензия: MIT license
Это прокси-сервер, который превращает инструменты MCP в OpenAPI-совместимые HTTP-серверы. Разработчики, создающие приложения на базе искусственного интеллекта [15], используют этот сервер для простого соединения инструментов на базе MCP со всем, что использует стандартные RESTful OpenAPI-интерфейсы.
Почему это важно:
«Этот новый проект OpenWebUI (выпускник 2024 GitHub Accelerator) – отличный пример растущей тенденции в области ИИ, связанной с интеграцией, особенно с использованием MCP», – объясняет Эбигейл. «Это подчеркивает, что людям в ИИ нужно больше интеграции, и больше стандартов, таких как MCP, помогут в этом».
Сайт: https://unbody.io/ [16]
Репозиторий: https://github.com/unbody-io/unbody [17]
ЯП: TypeScript
Лицензия: Apache 2.0 license

Подумайте о Supabase, но для искусственного интеллекта – это Unbody. Это модульный бэкенд, позволяющий создавать программное обеспечение, ориентированное на ИИ, которое действительно понимает и осмысливает знания, а не просто перемешивает данные.
Проект разбивает всё на четыре уровня, которые можно смешивать и сочетать:
Восприятие [18]: Получает, анализирует, улучшает и векторизует исходные данные.
Память [19]: Хранит структурированные знания в векторных базах данных и постоянных хранилищах.
Рассуждение: Генерирует содержание, вызывает функции и планирует действия.
Действие: Предоставляет знания через API, SDK и триггеры.
Почему это важно:
«Это интересный вопрос: Как программирование агентов может стать более абстрагированным от бэкенда?» – спрашивает Кевин. «С Unbody вы можете писать на любом фреймворке и получить бэкэнд, который будет автоматически управляться. Если вы посмотрите на такие компании, как E2E, то увидите, что ведется работа по созданию гораздо более продвинутых агентов, которые показывают, как абстрагируется стек бэкенда».
Когда одного агента ИИ становится недостаточно, в дело вступает OWL. Построенный на базе фреймворка CAMEL-AI [21], который наиболее известен тем, что популяризировал ролевой подход для мультиагентных систем и выпустил множество синтетических пакетов «задача + данные», OWL позволяет нескольким специализированным агентам взаимодействовать через браузеры, терминалы, вызовы функций и инструменты MCP. Она даже возглавляет список лидеров с открытым исходным кодом в бенчмарке GAIA (58.18).
Почему это важно
«Это не просто агенты, это еще и мультимодельные и мультиагентные архитектуры, такие как OWL», – отмечает Эбигейл. «Год назад речь шла о людях, создающих модели, а теперь речь идет об агентах и о том, что они могут делать. OWL занимается мультиагентной работой, которая быстро развивается».

Поклонники CLI: перед вами интерфейс командной строки для работы с серверами MCP. Созданный звездой GitHub Фатихом Кадиром Акином [23](который также создал функцию подсказок GitHub Copilot [24]), он позволяет вам находить и вызывать инструменты, получать доступ к ресурсам и управлять подсказками с любого MCP-совместимого сервера.
MCP Tools поддерживает ввод/вывод данных через stdin/stdout или HTTP и выдает результаты в виде JSON или таблиц. Он даже позволяет создавать макеты серверов для тестирования или передавать MCP-запросы сценариям оболочки.
Почему это важно
Это превращает MCP в нечто, что можно «git clone && mcp call». Он предлагает привычный рабочий процесс CLI плюс встроенный режим охраны, позволяющий быстро создавать прототипы инструментов и блокировать их для продакшена.
Сайт: https://www.self.so/EB [25]
Репозиторий: https://github.com/Nutlope/self.so [26]
ЯП: TypeScript
Лицензия: MIT license

Если создание личного сайта – не самое приятное занятие, Nutlope/self.so поможет вам. Загрузите свое резюме или профиль LinkedIn, и инструмент создаст для вас простой сайт, используя искусственный интеллект для верстки, без головной боли [27] с CSS.
Технологический стек включает Together.ai [28] для языкового моделирования, Vercel’s AI SDK, Clerk для аутентификации, Next.js для фреймворка, Helicone для наблюдаемости, S3 для хранения, Upstash Redis для базы данных и Vercel для хостинга.
Почему это важно:
Проект представляет собой сборный «ИИ-конструктор Lego». Это потому, что он объединяет Vercel AI SDK, Clerk auth, Upstash Redis, S3 и Tailwind, причем каждый сервис выполняет одну задачу, что иллюстрирует, как современные приложения для ИИ часто собираются из небольших специализированных сервисов, а не монолитов.
Репозиторий: https://github.com/jasonppy/VoiceStar [29]
ЯП: Python
Лицензия: MIT code license, CC-BY-4.0 model license
Если в вашем проекте требуется речь, которая должна укладываться в определенный временной промежуток, вам поможет синтез VoiceStar с регулировкой длительности. Он позволяет разработчикам устанавливать целевую длительность, чтобы голосовой вывод соответствовал чувствительным ко времени сценариям использования – например, подсказкам фиксированной длины или повествованию – без дополнительного редактирования звука.
Проект включает в себя интерфейсы CLI и Gradio [30] для вывода, а также предварительно обученные модели, которые можно использовать сразу же. Поскольку голосовые интерфейсы становятся все более важными в приложениях, наличие моделей с открытым исходным кодом и таким уровнем контроля – полезный шаг вперед.
Почему это важно:
Это открытая модель TTS, позволяющая привязать речь к точной длительности, что полезно для дубляжа, рекламы и наложений, где важна каждая миллисекунда. Это ИИ, поддерживающий вещательный уровень синхронизации, от сообщества с открытым исходным кодом.
Сайт: https://www.secondme.io/ [31]
Репозиторий: https://github.com/mindverse/Second-Me [32]
ЯП: Python
Лицензия: Apache 2.0 license
Хотите поэкспериментировать с искусственным интеллектом? Second-Me позволяет вам попробовать создать базового «цифрового двойника» – агента, который будет отражать некоторые ваши знания, стиль общения и предпочтения.
Возможности могут быть самыми разными: от персональных помощников, которые действительно понимают, как вы думаете, до инновационных способов поделиться своим опытом [33] с другими. Один из примеров применения Second-Me в действии: ваш цифровой двойник управляет вашим аккаунтом на LinkedIn или Airbnb, играя роль профессионала или хозяина.
Почему это важно:
Это яркий пример того, что мы наблюдаем переход от моделей к агентам. «Если посмотреть на ситуацию год назад, то все сводилось к созданию моделей. Как сделать X или Y? Вы создавали новую модель», – объясняет Джефф. «Этот проект и другие демонстрируют сдвиг в сторону агентных движений и того, как люди используют ИИ для выполнения задач».
Репозиторий: https://github.com/SesameAILabs/csm [34]
ЯП: Python
Лицензия: Apache 2.0 code license (model has restrictions [35] on Abuse)
Conversational Speech Model(CSM) предлагает новый подход к генерации речи. Она преобразует текстовые и аудиоданные в аудиокоды с остаточной векторной квантизацией (RVQ), используя архитектуру на основе Llama. Его специальный аудиодекодер производит аудиокоды Mimi, в результате чего получается удивительно естественно звучащая речь.
Интересно то, как CSM объединяет архитектуру языковой модели и специализированный аудиодекодер, предоставляя вам открытую альтернативу проприетарным вариантам преобразования текста в речь, которые доминируют на рынке.
Почему это важно:
CSM объединяет текстовую основу на базе Llama с легким аудиодекодером, который выводит коды Mimi RVQ – это доказывает, что мультимодальные мэшапы могут работать локально на одном GPU. Это говорит о том, что мультимодальность на уровне моделей начинает приобретать API-цепочки, а разрешительное лицензирование Apache-2.0 ускоряет исследования и разработки сообщества по созданию речевых систем с миллиардом параметров.
Letta представляет открытый формат файлов (.af) для упаковки агентов ИИ с сохранением их памяти и поведения [37]. Считайте, что это переносимый контейнер для агентов. Вы можете обмениваться ими, ставить контрольные точки и контролировать версии в разных фреймворках.
Для разработчиков, жонглирующих несколькими фреймворками агентов, это может стать экономией времени. Хотите перенести агента с одной системы на другую, не перестраивая его с нуля? Именно эту проблему решает Letta.
Примечательно, что проект Letta является ответвлением от проекта cpacker/memgpt [38] – он выделил слой сериализации, который MemGPT первоначально использовал для привязки своих «виртуально-контекстных» агентов. Команда вырезала этот код в чистую, не зависящую от фреймворка спецификацию (agent-file), так что любой стек – MemGPT/Letta, LangGraph, CrewAI – может импортировать или экспортировать полностью stateful агента с помощью одного архива .af.
Почему это важно:
Подумайте о «Docker-образе для агентов ИИ». В .af-образе хранятся снимки памяти, инструменты и подсказки, позволяющие контролировать версии, обмениваться и производить горячую замену агентов между фреймворками (MemGPT, LangGraph, CrewAI и т. д.), что решает проблему «как мне переместить моего агента?».
Художники Blender, это для вас: сторонний инструмент, который соединяет популярный пакет для создания 3D с открытым исходным кодом Blender с искусственным интеллектом Claude AI через MCP. С помощью Blender-MCP разработчики могут управлять операциями Blender с помощью естественного языка или добавить помощь искусственного интеллекта в свой рабочий процесс 3D.
Blender-MCP показывает, как MCP может выступать в качестве универсального «порта инструментов» для LLM-агентов: сегодня это Blender, а завтра – Unity, Unreal или любое сложное настольное приложение. Для 3D-художников и прототипировщиков это означает более быстрое блокирование сцен, легкие эксперименты со стилями и совершенно новый способ обучения [40] новичков. Просто опишите, что вы хотите, и смотрите, как программа создает это.
Почему это важно:
Это показывает, как MCP может подключить LLM к тяжелым настольным приложениям – в данном случае, давая Claude ключи к Blender для создания сцен на естественном языке и управления ассетами. Его быстрый рост намекает на то, что следующий скачок UX в 3D (и, возможно, в CAD, Unity, Unreal) может быть в переходе на работу с AI агентами.
Эти модели не только отражают текущее состояние ИИ в open source, но намекают на проблемы и возможности, которые ждут нас впереди. Вот что говорят эксперты GitHub о быстро развивающемся пространстве:
Широкое распространение MCP во многих проектах подчеркивает растущую важность стандартизированных паттернов интеграции в разработке ИИ.
«Я увидела одну большую закономерность – это болевая точка вокруг ИИ и интеграции», – отмечает Эбигейл. «Больше стандартов, таких как MCP, помогут в этом».
Такие проекты, как OWL, указывают на будущее, в котором несколько специализированных агентов ИИ будут работать вместе для решения сложных задач.
«Вы должны думать об этом в контексте взаимодействия человека с человеком, агента с агентом, а затем иметь несколько агентов, работающих в тандеме», – объясняет Кевин, подчеркивая сложность и потенциал такого подхода.
Речевые технологии, конечно, не новы, но большие языковые модели настолько сильно меняют преобразование текста в речь (TTS) и речи в текст (STT), что открывается новая волна возможностей.
Более важная история заключается в том, что это означает в дальнейшем, и имеет последствия для СМИ, поддержки клиентов и UX продуктов.
ИИ привлек к открытому исходному коду новую волну сопровождающих и разработчиков, которые привнесли новую энергию и подходы.
Кара Делосс, старший менеджер программы по связям с разработчиками в GitHub, отмечает: «Мы видим новое поколение или новый тип сопровождающих» в сфере ИИ. Кевин добавляет, что «если у вас есть большое сообщество в первый день, это очень ценно», подчеркивая, как развивается экосистема. Это сочетание устоявшихся и новых методов разработки создает захватывающие возможности для сотрудничества в рамках сообщества.
Каждый топовый проект в нашем списке использует лицензии, одобренные эмоций [41] от сообщества, если будете называть себя открытым исходным кодом, но не будете использовать лицензию, одобренную OSI», – отмечает Джефф. «Эти лицензии важны, потому что они предоставляют четкие гарантии прав на использование, модификацию и перераспределение, что укрепляет доверие в сообществе».
Джефф также отмечает возникающую проблему: «По мере того как сервисы и инструменты на базе ИИ становятся все более мощными, мы наблюдаем тенденцию, когда некоторые проекты накладывают ограничения на использование модели или сервиса, связанные со злоупотреблениями и мошенничеством. Это может не сделать их полностью открытыми по лицензии, одобренной OSI, и проекты и сообщество будут продолжать активно обсуждать эти условия».
Джефф: «Важно понимать и документировать все существующие ограничения, прежде чем использовать модель или сервис». Это своевременное напоминание, поскольку сообщество ИИ с открытым исходным кодом ориентируется в этих меняющихся вопросах лицензирования.
Проекты, о которых мы рассказали здесь, – это лишь верхушка айсберга. Поскольку ИИ продолжает развиваться, экосистема с открытым исходным кодом – это место, где первыми появляются многие из самых интересных стандартов, инструментов и методов.
Вот как можно принять в этом участие:
Ознакомьтесь с этими проектами, чтобы понять, как они могут вписаться в ваш рабочий процесс.
Присоединяйтесь и вносите свой вклад в проекты, которые вызывают у вас интерес [42]
Следите за развитием MCP и других новых стандартов
Автор: vldmrmlkv
Источник [43]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/14966
URLs in this post:
[1] внимание: http://www.braintools.ru/article/7595
[2] @abbycabs: https://www.braintools.ru/users/abbycabs
[3] @karasowles: https://www.braintools.ru/users/karasowles
[4] @kevincrosby: https://www.braintools.ru/users/kevincrosby
[5] @jeffrey-luszcz: https://www.braintools.ru/users/jeffrey-luszcz
[6] ошибку: http://www.braintools.ru/article/4192
[7] https://docs.anthropic.com/en/docs/agents-and-tools/mcp: https://docs.anthropic.com/en/docs/agents-and-tools/mcp
[8] https://www.anthropic.com/news/model-context-protocol: https://www.anthropic.com/news/model-context-protocol
[9] https://modelcontextprotocol.io/introduction: https://modelcontextprotocol.io/introduction
[10] https://github.com/modelcontextprotocol: https://github.com/modelcontextprotocol
[11] https://habr.com/ru/articles/879970/: https://habr.com/ru/articles/879970/
[12] https://habr.com/ru/articles/862312/: https://habr.com/ru/articles/862312/
[13] https://docs.openwebui.com/: https://docs.openwebui.com/
[14] https://github.com/open-webui/mcpo: https://github.com/open-webui/mcpo
[15] интеллекта: http://www.braintools.ru/article/7605
[16] https://unbody.io/: https://unbody.io/
[17] https://github.com/unbody-io/unbody: https://github.com/unbody-io/unbody
[18] Восприятие: http://www.braintools.ru/article/7534
[19] Память: http://www.braintools.ru/article/4140
[20] https://github.com/camel-ai/owl: https://github.com/camel-ai/owl
[21] CAMEL-AI: https://www.camel-ai.org/
[22] https://github.com/f/mcptools: https://github.com/f/mcptools
[23] Фатихом Кадиром Акином : https://stars.github.com/profiles/f/
[24] функцию подсказок GitHub Copilot: https://docs.github.com/en/copilot/using-github-copilot/copilot-chat/prompt-engineering-for-copilot-chat
[25] https://www.self.so/EB: https://www.self.so/EB
[26] https://github.com/Nutlope/self.so: https://github.com/Nutlope/self.so
[27] боли: http://www.braintools.ru/article/9901
[28] Together.ai: http://Together.ai
[29] https://github.com/jasonppy/VoiceStar: https://github.com/jasonppy/VoiceStar
[30] Gradio: https://www.gradio.app/guides/quickstart
[31] https://www.secondme.io/: https://www.secondme.io/
[32] https://github.com/mindverse/Second-Me: https://github.com/mindverse/Second-Me
[33] опытом: http://www.braintools.ru/article/6952
[34] https://github.com/SesameAILabs/csm: https://github.com/SesameAILabs/csm
[35] restrictions: https://github.com/SesameAILabs/csm?tab=readme-ov-file#misuse-and-abuse-%EF%B8%8F
[36] https://github.com/letta-ai/agent-file: https://github.com/letta-ai/agent-file
[37] поведения: http://www.braintools.ru/article/9372
[38] cpacker/memgpt: https://github.com/cpacker/memgpt
[39] https://github.com/ahujasid/blender-mcp: https://github.com/ahujasid/blender-mcp
[40] обучения: http://www.braintools.ru/article/5125
[41] эмоций: http://www.braintools.ru/article/9540
[42] интерес: http://www.braintools.ru/article/4220
[43] Источник: https://habr.com/ru/articles/907380/?utm_source=habrahabr&utm_medium=rss&utm_campaign=907380
Нажмите здесь для печати.