rag. - страница 2

rag.

Когда чат-бот продаёт Chevrolet за доллар: как тестировать и мониторить LLM-приложения

Генеративные модели разблокировали огромное количество новых продуктов и новых фич в уже существующих. Поиграться с ними успел, кажется, каждый. И сценарий почти всегда повторяется: команда быстро собирает прототип на внешнем API, выкатывает его в продакшен, продукт начинает приносить ценность, а вместе с ценностью приходит и тревога. Работает ли всё так, как мы ожидали? В этот момент хочется уже не угадывать, а измерять.Эта статья про то, как измерять. Точнее, про то, как тестировать и мониторить адаптивные LLM-системы в продакшене и до него, чтобы убедиться: ассистент ведёт себя так, как задумано.Что именно мы оцениваем

продолжить чтение

Как я строил трактор(RAG) для клумбы, а клумбы не оказалось

Зачем и для кого статья?Для тех, кто хочет сделать своего ИИ-помощника, удобный поисковик.Кому интересна тема RAG в целом.

продолжить чтение

Сайты под управлением ИИ: что это на самом деле и сколько стоит. Часть 1 из 3

Это первая из трёх статей про сайты под управлением ИИ. В этой части — концепции и экономика без маркетинговой пыли: что такое нейросайт на самом деле, чем он принципиально не является, и почему дешёвый VDS за пару тысяч рублей тут вообще ни при чём с точки зрения железа под нейросеть. Во второй части будет внутрянка (MCP‑брокер, пайплайн деплоя, безопасность), в третьей — прод‑механика на тысячах страниц (SSG/ISR, индексация, массовые операции). Здесь сознательно держусь на уровне архитектурных решений, не уходя в реализацию — она дальше.

продолжить чтение

Как научить языковую модель читать транзакции: превращаем историю платежей в базу знаний

Меня зовут Дмитрий Валов, я тимлид команды «Инструменты для банка (агенты)» в Sber AI Lab — Центре практического искусственного интеллекта Сбера.

продолжить чтение

Внешняя память для LLM: как RAG дает моделям доступ к новым знаниям

продолжить чтение

DCD: доменно-ориентированная архитектура для построения RAG-систем

Привет! Это Роботы. Недавно мы выпустили статью на arXiv

продолжить чтение

RAG от А до Я: шпаргалка архитектора (векторные базы, чанкинг, реранкинг и 8 граблей продакшена)

Это же так легко

продолжить чтение

Почему портал самообслуживания не работает — и при чём тут когнитивная нагрузка

Пощадите пользователей

продолжить чтение

ПростоГраф: как я сделал глубокий форк LightRAG под свои (и, возможно, ваши) нужды

С чего всё началось (можете пропустить, тут немного жизы)

продолжить чтение

Искусственный интеллект с LangChain. Разработка ИИ-агентов на Python

Представляем новый практический курс по ИИ-агентам на Python от мастера обучающей литературы Владимира Дронова

продолжить чтение