семантический поиск.

Базовый RAG-компонент для локального семантического поиска на Питоне

quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как плагин для MCP (Model Context Protocol), но стал универсальной основой для любой системы локального семантического поиска.Зачем это нужно

продолжить чтение

Создаем простую систему RAG на Python

Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.

продолжить чтение

Как RuStore читает мысли пользователей (и причём тут теги)

продолжить чтение

Сущности в SEO: как Google понимает ваш контент (и почему Keywords — это уже не всё)

Помню, как полгода назад ко мне обратился клиент с интернет-магазином спортивного питания. Контент идеальный — вхождения ключевых слов расставлены по всем правилам классического SEO, LSI-фразы присутствуют, тексты уникальные. Но позиции стояли мертво. Конкуренты с более слабыми текстами занимали топ-3.В чём дело?Открываю анализатор сущностей — и вижу картину. Google просто не понимал, о чём

продолжить чтение

Как мы внедряли семантический поиск по сообществам ВКонтакте: про раков, астрологию и затянувшийся таймлайн проекта

продолжить чтение

Mistral представила свой ответ GitHub Copilot: полноценную экосистему для разработки в энтерпрайзе

В основе технологического стека — семейство моделей Codestral с обновленной моделью Codestral 25.08.

продолжить чтение

Семантический поиск по статьям Хабра в PostgreSQL + индексация текстов LLM в Ollama

Покажу вам практическую реализацию семантического поиска на основе векторных представлений - эмбеддингов из текста. Здесь я создам систему, которая анализирует статьи с Хабра, извлекает из них темы и ключевые слова с помощью локально работающих больших языковых моделей LLM, и на основе этих данных создает векторные представления для эффективного поиска по смыслу, а не по запросу на вхождение определенного текста.

продолжить чтение

Как мы учили нейросеть разбираться в сложных документах: задача семантического поиска

Привет! Меня зовут Павел Яковлев, я инженер по разработке ПО искусственного интеллекта в YADRO

продолжить чтение

Rambler's Top100