rag.
Встраиваемая векторная БД для RAG на .NET 8: когда внешние сервисы избыточны
О чём речьЕсли вы делаете RAG (Retrieval-Augmented Generation) на .NET, то рано или поздно упираетесь в вопрос: куда складывать эмбеддинги и как быстро искать по ним.Существующие варианты делятся на два лагеря.Внешние сервисы (Pinecone, Qdrant, Weaviate) — хороши, но требуют отдельной инфраструктуры. Сеть, авторизация, сериализация, мониторинг. Каждый запрос — это миллисекунды на HTTP. Плюс вы привязываетесь к конкретному облачному провайдеру или контейнеру.Существующие .NET-решения — часто либо заброшены, либо имеют проблемы с производительностью (избыточные аллокации, медленный ANN, отсутствие гибридного поиска).
Как команда становится AI Native: методология из 4 этапов
Подписки купили, тренинг провели, через два месяца все вернулись в Excel. Знакомо? Делюсь методологией, через которую мы прошли в Alpina Digital и которую повторили у 40+ корпоративных клиентов.Жемал Хамидун, Head of AI Alpina Digital, CPO AlpinaGPT
HR-бот на базе RAG: архитектура корпоративной базы знаний для ресторанного холдинга
В ресторанном холдинге была внедрена система HR-бота на базе ИИ, которая работает поверх корпоративной базы знаний, учитывает роль сотрудника и предоставляет ответы со ссылками на актуальные документы.Основная задача проекта — заменить разрозненные FAQ, Wiki, документы и чаты единым интерфейсом доступа к корпоративным знаниям. Сотрудник может задать вопрос в свободной форме и получить ответ с учётом своей должности, прав доступа и актуальной версии документа.Исходная проблема
Как мы научили ИИ-агента отвечать за свои слова: 10 000 сообщений, Венгерский алгоритм и немного магии
Как мы научили ИИ-агента отвечать за свои слова: 10 000 сообщений, Венгерский алгоритм и немного магииНа связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru
RAG-Anything: Как собрать по-настоящему мультимодальный RAG
Существует множество достойных RAG-фреймворков, проверенных на многочисленных бенчмарках, так что точность работы системы в современных реалиях - не такая большая проблема. Однако, для любого, кто сталкивался с прикладной интеграцией RAG в рабочие пайплайны, не секрет, что рано или поздно сталкиваешься с постобработкой многочисленных форматов. Комбинируешь OCR, парсеры, ридеры…RAG-Anything устраняет ненужные телодвижения.
Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро
В корпоративном ИИ происходит тихий сдвиг. На поверхности его видно как очередную волну разговоров про агентов, RAG, knowledge graph, ontology, process intelligence, AI‑ready data, business context и agentic platforms. SAP говорит о графе знаний для агентов, Microsoft — о переходе от systems of record к systems of action, Oracle — об агентах внутри корпоративных приложений, Palantir — об Ontology, Celonis — о Process Intelligence Graph, Alibaba и Yonyou — о корпоративных агентных платформах.
Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»
Память на миллион токенов: почему контекст забивается и как его чиститьНа связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru
RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain
PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля.DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса.Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа.В продакшене могут быть сотни тысяч документов, живые пользователи и
Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит
Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам.

