rag. - страница 3

rag.

Контекстное окно: почему нейросеть забывает части разговора

Представьте, что вы разговариваете с невероятно умным и эрудированным собеседником. Только очень странным. Несмотря на весь свой интеллект и тысячи фактов, которые он непринужденно рассказывает, он не может ничего запомнить. Ваш диалог с ним каждый раз как бы начинается заново. Вы даете ему вводные, задаете вопросы, что-то уточняете, а он, на основе всего этого, выдает ответ.

продолжить чтение

Как я мерил точность ИИ в распознавании еды: бенчмарк, LLM-as-judge и баг с варёной гречкой

Строю приложение для подсчёта калорий по фото. Пользователь снимает тарелку, модель определяет блюдо, считает КБЖУ. Идея не новая, но мне важно, чтобы это работало именно на русской еде — борщи, гречки, котлеты по-домашнему.В какой-то момент стало некомфортно: я не знал, насколько модель вообще точна. «Кажется, работает нормально» — плохой ответ, если хочешь что-то улучшать. Решил померять нормально.Расскажу, что и как мерил, что получил — и про неожиданный вывод в конце, ради которого, честно говоря, и стоило это всё делать.Три вещи, которые хотелось знать

продолжить чтение

Графы знаний в юридическом домене: эксперимент с LightRAG (продолжение)

В предыдущей части статьи мы разобрали архитектуру LightRAG и показали основные сценарии его развертывания. В качестве эксперимента (

продолжить чтение

Что такое контекстное окно и почему модели забывают

Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила раньше. Забывает имя персонажа которое ты указал в самом начале. Спрашивает то, о чём вы уже договорились.Первая реакция - что-то сломалось. Но это не баг. Это фундаментальное ограничение архитектуры, у которого есть название и объяснение.Модель не помнит - она читаетГлавное заблуждение про языковые модели - что у них есть память. Что где-то внутри хранится история ваших разговоров, и модель к ней обращается.Это не так.

продолжить чтение

Домик для ИИ: как завод пришёл к идее AI ready для бизнеса

Бизнес нацелился делать свой собственный AI. Все задают вопрос: «Какая модель мне нужна?» Но никто не задумывается, на каких мощностях модель будет работать. Мы тоже сначала не задумывались. Разработали корпоративного AI-агента, прокачали ИТ-команду, чтобы двигаться дальше — и споткнулись о «железный порог». Так родилась идея AI ready модуля. В статье рассказали, что это такое и почему AI начинается не с модели, а с инфраструктуры. 

продолжить чтение

Когда компании пора строить свой LLM-кластер, а не пользоваться внешними API

На раннем этапе внедрения LLM в компании выглядят как быстрый выигрыш: подключается внешний API (например, ChatGPT), ускоряется работа с текстами, автоматизируются ответы, появляются первые сценарии аналитики и агентных пайплайнов через Make или n8n.До определённого масштаба этого достаточно.По мере роста компании LLM перестаёт быть вспомогательным инструментом и становится частью операционных процессов. В системе появляются чувствительные данные, требования к контролю доступа, необходимость стабильной работы, интеграции во внутренние сервисы и вопросы экономики при больших объёмах запросов.

продолжить чтение

Как нейросети решают, чей бренд процитировать: разбор RAG-архитектуры поиска и что из этого следует для GEO

Когда Алиса, ChatGPT или Perplexity отвечают пользователю и называют конкретный бренд, за этим стоит конвейер из нескольких алгоритмов извлечения и ранжирования. Я разобрал, как он устроен в Google, Bing и Яндексе, и собрал из этого практические выводы для GEO. Все ключевые цифры проверял по первоисточникам - где факт доказан публикацией, а где это исследовательское направление или вторичные данные, помечено отдельно. Небольшой оффтоп - как я в это ввязалсяЯ всё ещё Макс Фомин из агентства Vverh.Digital. Прежде чем нырнём в архитектуру — небольшой оффтоп, как я вообще в это ввязался.

продолжить чтение

Как я за месяц перевела команду с SQL-промптов на мультиагентную систему и сэкономила команде 200 часов

Дарья Воронкина

продолжить чтение

От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 2)

Привет, Хабр! Меня зовут Саша, я — старший AI-инженер в Лаборатории искусственного интеллекта «Честного знака». Наша команда развивает «Честного помощника» — мультиагентную LLM-систему для обработки документов, поиска информации по Confluence, Jira, GitLab и генерации текстов. Главная цель команды — повышать эффективность и качество работы сотрудников за счёт расширения числа специализированных агентов в нашей мультиагентной системе.

продолжить чтение

Топ-советы по Claude Code от Бориса Черни и не только: гайд на 56k звёзд — что реально работает, а что мимо

Главный вывод про поиск: «Claude Code выкинул RAG» и «я внедряю Graphify» — не спор, а две половины одного гибрида. Для кода побеждает связка grep + структурный индекс (tree-sitter/AST), а не чистый grep и не чистый вектор.Вектор проиграл коду по делу, а не вообще: точность (символ есть или нет), свежесть (индекс устаревает), чанкинг (кусок ≠ логическая единица). А слабость grep — расход токенов — чинится специализированными search-моделями, не переходом на вектор.Сам создатель Claude Code выбрал agentic search «по ощущениям»

продолжить чтение