llm.

Я реализовал паттерн памяти из OpenAI Cookbook в Python библиотеку

Я создал agent-memory-state — open-source Python библиотеку для управления персистентной памятью AI агентов. Реализует паттерн state-based memory из OpenAI Cookbook: профиль пользователя, разделение session/global памяти, LLM-консолидация и защитные механизмы.Проблема: Агенты без памяти — безликиеКаждый раз, начиная новый разговор с AI-ассистентом, он забывает всё. Ваши диетические предпочтения, привычки в путешествиях, рабочий контекст — стёрты. Приходится объяснять одно и то же снова и снова.

продолжить чтение

Оставлено в

RLM-Toolkit: Полное руководство по обработке 10M+ токенов

От теории до production — архитектура, алгоритмы, безопасностьПривет, Хабр!Это исчерпывающее руководство по RLM-Toolkit — open-source библиотеке для работы с контекстами произвольной длины.Что рассмотрю:Формальная теория RLM (State Machine, рекурсия)InfiniRetri: математика attention-based retrievalH-MEM: когнитивная архитектура памятиRAG vs KAG vs GraphRAG vs InfiniRetriSecurity: CIRCLE compliance, sandbox escape preventionРеальные примеры с логами выполненияTroubleshooting и best practicesУровень: от middle до PhD-level исследований.🚀

продолжить чтение

Оставлено в

Технологическая сингулярность. От 2 месяцев до 2 дней — Claude и n8n сократили разработку в промышленной IoT

Писать надо только тогда, когда не можешь не писать (С) Л.Н. ТолстойНа самом деле я работал над статьей о Claude Code, но тут пальцы сами открыли ноут на начали набивать буквы. Извините!ПриквелНачну издалека, с темы, максимально далекой от предмета статьи. У меня есть друг, который постоянно норовит втянуть меня в свои хобби. За десятилетие я попробовал стать фанатом ножей, огнестрельного и пневматического оружия, охоты, выживания в БП, полетах на самолетах. Ни одно хобби не зашло.

продолжить чтение

Оставлено в

Claude Code теперь можно запускать с локальными open-source моделями

Начиная с версии Ollama 0.14, платформа получила совместимость с Anthropic Messages API. Это означает, что Claude Code — агентный инструмент для программирования, который работает прямо в терминале — теперь может использовать любую модель из Ollama, а не только облачные модели Anthropic.

продолжить чтение

Оставлено в

GLM-Image выложили в открытый доступ. Хороший китайский, транслит вместо кириллицы

Китайские товарищи из Zhipu AI выложили модель для генерации картинок GLM-Image (text-to-image и image-to-image) в открытый доступ.В свой главный сайт z.ai, почему-то сразу не втащили, ещё и старую модель отключили, пока там генерируются только вызовы функции. Но там зато можно бесплатно общаться с их GLM моделью, по качеству довольно неплохая.Потыкал модель на fal.ai

продолжить чтение

Оставлено в

Log Analyzer Pro 2.0: Добавляем AI-поиск на естественном языке

В предыдущей статье я рассказывал, как сделал производительный просмотрщик логов для VS Code с Rust и mmap. Расширение открывает файлы по 10 ГБ без лагов.Но оставалась проблема: чтобы найти нужное, приходилось писать regex. А regex — это боль. Особенно когда искать нужно "все ошибки подключения к БД" или "таймауты в сервисе auth".Решение: пусть AI пишет regex за меня.Что получилосьНажимаешь "AI", пишешь на человеческом языке — получаешь фильтр:ЗапросРезультат"все ошибки"ERROR

продолжить чтение

Оставлено в

Агентные системы для продакшена

Всем привет! Сегодня разберём, как проектировать агента, который доезжает до продакшена и приносит пользу бизнесу: от вопросов на старте до стека и практик, без которых он развалится в эксплуатации.Меня зовут Владимир, на данный момент работаю ML-инженером и разрабатываю мультиагентные системы. К сожалению, пока не могу похвастаться тем, что сократил 20 процентов сотрудников, но достижения имеются...

продолжить чтение

Оставлено в

Как я делал свою языковую модель: история эксперимента

Уже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать мышление модели от токенов, перенеся его в латентное пространство. Примерно полгода назад я начал первые практические эксперименты и сейчас получил первые практические результаты. Поскольку уровень подготовки читателей очень сильно различается, в статье не будет глубоких технических разборов, а скорее история эксперимента.

продолжить чтение

Оставлено в

Как ИИ помогает упростить BPMN-диаграммы

продолжить чтение

Оставлено в

LLM нельзя внедрить сверху. Снизу тоже. А как можно?

«Когда один программист заменяет пятерых, четверо начинают искать работу, а пятый — хорошего юриста»Каждая вторая статья на Хабре сейчас — про LLM. Одни кричат о революции, другие — о пузыре. Тем временем в реальности происходит кое-что интересное.Цифры впечатляют. Инвестиции в дата-центры в 2025 году превысили $60 миллиардов. Nvidia отчитывается о квартальной выручке в $57 миллиардов — больше годовой прибыли большинства компаний из Fortune 500. Big Tech планирует потратить около $330 миллиардов на инфраструктуру только в этом году. Прогнозы обещают $3-4 триллиона совокупных инвестиций в AI к 2030 году.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Я реализовал паттерн памяти из OpenAI Cookbook в Python библиотеку

RLM-Toolkit: Полное руководство по обработке 10M+ токенов

Технологическая сингулярность. От 2 месяцев до 2 дней — Claude и n8n сократили разработку в промышленной IoT

Claude Code теперь можно запускать с локальными open-source моделями

GLM-Image выложили в открытый доступ. Хороший китайский, транслит вместо кириллицы

Log Analyzer Pro 2.0: Добавляем AI-поиск на естественном языке

Агентные системы для продакшена

Как я делал свою языковую модель: история эксперимента

Как ИИ помогает упростить BPMN-диаграммы

LLM нельзя внедрить сверху. Снизу тоже. А как можно?

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

llm.