rag. - страница 7

rag.

Антипаттерн LLM-приложений: когда модель игнорирует контекст. Часть 2

Всем привет! В первой части мы разобрали теорию

продолжить чтение

Базовый RAG-компонент для локального семантического поиска на Питоне

quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как плагин для MCP (Model Context Protocol), но стал универсальной основой для любой системы локального семантического поиска.Зачем это нужно

продолжить чтение

MCP Tool Registry: автоматизированное создание систем RAG

Всем привет! Меня зовут Максим Максимов, я — NLP-инженер в AI R&D лаборатории в red_mad_robot. Мы работаем с прикладными AI-системами, проводим эксперименты и проверяем архитектурные подходы в реальных сценариях.

продолжить чтение

Production-ready архитектура AI-агента. Часть 1: ReAct, Advanced RAG, Tools, Prompts

Интересный получился 2025 год: с одной стороны нахлынула волна хайпа вокруг AI‑агентов, с другой стороны не меньшая волна скептицизма и критики остудила пыл многих. Мол, это всё дорогая игрушка — поиграли, забыли, выбросили. На примере разработки AI‑консультанта для своей компании поговорим о системном подходе к проектированию архитектуры production‑ready AI‑агентов, который мы применяем при создании агентских систем для бизнеса. Да-да, именно систем, включая всё критически необходимое для того, чтобы агенты не стали игрушкой, а приносили пользу и оправдывали своё назначение.Поехали...

продолжить чтение

Создаем простую систему RAG на Python

Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.

продолжить чтение

RAG — это главное. Почему специализированные LLM реже галлюцинируют

Когда закрылся Skype

продолжить чтение

Вся стройка держалась на инженерах, а потом пришла нейросеть

В ТЕХНОНИКОЛЬ мы активно используем нейросети: на производстве машинное зрение ищет дефекты на конвейерах, алгоритмы помогают с ценообразованием, для сотрудников разрабатываем внутренние ИИ-инструменты. Но сегодня расскажу, как мы внедрили LLM с RAG в контакт-центр, освободили головы инженеров от рутины и кратно увеличили пропускную способность поддержки.Меня зовут Андрей Цымбалюк, я руководитель этого проекта и занимаюсь digital-маркетингом в технической дирекции. Под капотом — история о том, как мы прошли путь от экспериментов с ChatGPT до системы, которая консультирует клиентов по 10 000+ строительных материалов.

продолжить чтение

Как ИИ спас инженеров от выгорания в ТЕХНОНИКОЛЬ

В ТЕХНОНИКОЛЬ мы активно используем нейросети: на производстве машинное зрение ищет дефекты на конвейерах, алгоритмы помогают с ценообразованием, для сотрудников разрабатываем внутренние ИИ-инструменты. Но сегодня расскажу, как мы внедрили LLM с RAG в контакт-центр, освободили головы инженеров от рутины и кратно увеличили пропускную способность поддержки.Меня зовут Андрей Цымбалюк, я руководитель этого проекта и занимаюсь digital-маркетингом в технической дирекции. Под капотом — история о том, как мы прошли путь от экспериментов с ChatGPT до системы, которая консультирует клиентов по 10 000+ строительных материалов.

продолжить чтение

Как я создал «Тунец» — платформу для попадания в ответы нейросетей с помощью нейросетей…

…. и программиста. Нейросети меняют паттерны поведения людей при поиске информации. В частности они становятся сложнее и длиннее. Если вы спросите ChatGPT, куда дольше ехать из Москвы — в Питер, Казань или Краснодар, то классический поиск не найдет статью, которая полностью ответит на вопрос. А вот нейросеть, понимая интент, разобьет промпт на три простых поисковых запроса:«расстояние Москва-Санкт-Петербург», «расстояние Москва-Казань»,«расстояние Москва-Краснодар». 

продолжить чтение

RAG своими руками: как мы собрали ИИ‑помощник для поддержки и что из этого вышло

Привет, Хабр! Меня зовут Илья Парамошин, я ведущий инженер в МТС Web Services. В первой части

продолжить чтение

1...5678910...20...25
Rambler's Top100