семантический поиск.

Векторы по косинусу считают. Косинусное сходство, альтернативы, плюс — фановые проекты с эмбеддингами

Недавно мы в Beeline Cloud делали подборку руководств и обучающих материалов по теме эмбеддингов. Сегодня решили поговорить о распространенном подходе к семантическому поиску на основе косинусного расстояния, а также альтернативных методах. Заодно посмотрим на несколько любопытных проектов, использующих векторные представления на практике — среди них, например, сервис, позволяющий сравнить свои технологические предпочтения с интересами известных разработчиков вроде Линуса Торвальдса.

продолжить чтение

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Предуведомление.

продолжить чтение

Эволюция ‘More Like This’

Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата.

продолжить чтение

Раннее завершение KNN-поиска в Manticore Search

продолжить чтение

Защита от дублирования кода агентами: семантические концепции

Клонировал разум — дай разуму память. Как я строил слой памяти для команды из ИИ‑агентов, чтобы они перестали переписывать то, что уже естьЭто третья статья из серии о том, как я строю свой стартап руками ИИ‑агентов, и если первые две были про то, с чего всё началось и как я добрался до сути, то эта — про проблему, к которой меня привела сама логика предыдущих шагов.В первой я рассказывал, как вообще в это ввязался: один человек, Telegram‑first SaaS для авторов курсов и владельцев сообществ, и вся разработка идёт через агентов Claude Code, без наёмной команды.Во 

продолжить чтение

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям в браузере (llama.cpp в WebAssembly)

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому.Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме.

продолжить чтение

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в Beeline Cloud собрали для вас подборку открытых руководств и обучающих материалов по теме эмбеддингов: что собой представляют подходы TF-IDF и Word2vec, какие нюансы стоит учитывать, используя косинусное сходство для семантического поиска, а также чем различаются алгоритмы векторизации — показательно на схемах.

продолжить чтение

Как мы перешли на Opus и стали платить меньше

На прошлой неделе мы писали о том, как скармливали терабайты CI-логов LLM. Большинство вопросов на Hacker News касались не самих логов — спрашивали про агента: какие модели, как они взаимодействуют и во сколько всё это обходится.Сейчас мы работаем на Opus 4.6 и платим меньше, чем когда всё крутилось на Sonnet 4.0.Причина в основном в том, чего Opus не делает: 80% сбоев до него не доходят, а когда доходят — он не читает ни одной строки лога.Архитектура выглядит так:

продолжить чтение

Создание системы по управлению цифровыми активами для базы данных PostGIS. Часть 3. Семантические связи между таблицами

Здравствуйте, уважаемые читатели Хабра! Это заключительная третья часть (первая и вторая) о создании основного функционала MVP (Minimum Value Product) системы по управлению цифровыми активами для базы данных PostGIS. Полный перечень возможностей разрабатываемого проекта представлен на картинке ниже.

продолжить чтение

Базовый минимум. Часть 3:  RAG-системы

Дисклеймер: данная лекция подготовлена в первую очередь для непрофильных студентов магистратуры и аспирантуры, которые используют ИИ в учебной, исследовательской и профессиональной деятельности. Материал носит вводный характер и содержит намеренные упрощения. В то же время лекция может быть полезна и более широкой аудитории пользователей ИИ. Буду признателен за замечания и предложения по улучшению.Серия «Базовый минимум» (4 части): Базовый минимум. Часть 1:  большие языковые модели;Базовый минимум. Часть 2:  промпт-инжиниринг

продолжить чтение

12