rag.

Антипаттерн LLM-приложений: когда модель игнорирует контекст. Часть 2

Всем привет! В первой части мы разобрали теорию

Оставлено в

Базовый RAG-компонент для локального семантического поиска на Питоне

quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как плагин для MCP (Model Context Protocol), но стал универсальной основой для любой системы локального семантического поиска.Зачем это нужно

продолжить чтение

Оставлено в

MCP Tool Registry: автоматизированное создание систем RAG

Всем привет! Меня зовут Максим Максимов, я — NLP-инженер в AI R&D лаборатории в red_mad_robot. Мы работаем с прикладными AI-системами, проводим эксперименты и проверяем архитектурные подходы в реальных сценариях.

продолжить чтение

Оставлено в

Production-ready архитектура AI-агента. Часть 1: ReAct, Advanced RAG, Tools, Prompts

Интересный получился 2025 год: с одной стороны нахлынула волна хайпа вокруг AI‑агентов, с другой стороны не меньшая волна скептицизма и критики остудила пыл многих. Мол, это всё дорогая игрушка — поиграли, забыли, выбросили. На примере разработки AI‑консультанта для своей компании поговорим о системном подходе к проектированию архитектуры production‑ready AI‑агентов, который мы применяем при создании агентских систем для бизнеса. Да-да, именно систем, включая всё критически необходимое для того, чтобы агенты не стали игрушкой, а приносили пользу и оправдывали своё назначение.Поехали...

продолжить чтение

Оставлено в

Создаем простую систему RAG на Python

Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.

продолжить чтение

Оставлено в

RAG — это главное. Почему специализированные LLM реже галлюцинируют

Когда закрылся Skype

продолжить чтение

Оставлено в

Вся стройка держалась на инженерах, а потом пришла нейросеть

В ТЕХНОНИКОЛЬ мы активно используем нейросети: на производстве машинное зрение ищет дефекты на конвейерах, алгоритмы помогают с ценообразованием, для сотрудников разрабатываем внутренние ИИ-инструменты. Но сегодня расскажу, как мы внедрили LLM с RAG в контакт-центр, освободили головы инженеров от рутины и кратно увеличили пропускную способность поддержки.Меня зовут Андрей Цымбалюк, я руководитель этого проекта и занимаюсь digital-маркетингом в технической дирекции. Под капотом — история о том, как мы прошли путь от экспериментов с ChatGPT до системы, которая консультирует клиентов по 10 000+ строительных материалов.

продолжить чтение

Оставлено в

Как ИИ спас инженеров от выгорания в ТЕХНОНИКОЛЬ

продолжить чтение

Оставлено в

Как я создал «Тунец» — платформу для попадания в ответы нейросетей с помощью нейросетей…

…. и программиста. Нейросети меняют паттерны поведения людей при поиске информации. В частности они становятся сложнее и длиннее. Если вы спросите ChatGPT, куда дольше ехать из Москвы — в Питер, Казань или Краснодар, то классический поиск не найдет статью, которая полностью ответит на вопрос. А вот нейросеть, понимая интент, разобьет промпт на три простых поисковых запроса:«расстояние Москва-Санкт-Петербург», «расстояние Москва-Казань»,«расстояние Москва-Краснодар».

продолжить чтение