векторный поиск.

Как я пытался сжимать смыслы вместо байтов

Два часа ночи. Я пытаюсь впихнуть документацию проекта в контекст Claude. 847 страниц. Где-то 1.2 миллиона токенов. Контекстное окно — 200 тысяч.Делаю то, что делают все: режу, суммаризирую, выбрасываю «неважное». Каждый раз теряю что-то критичное. Это уже третий час, кофе кончился, и в голову приходит идея, которая кажется гениальной.Спойлер: она такой не была.

продолжить чтение

Оставлено в

Полезные агенты на платформе MWS GPT

Как выглядят полезные агенты по версии Nano BananaПривет, Хабр! В прошлом материале

продолжить чтение

Оставлено в

Создаем простую систему RAG на Python

Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.

продолжить чтение

Оставлено в

Как и зачем мы разработали систему анализа аномальных логов. Кейс MWS

продолжить чтение

Оставлено в

Как мы сделали альтернативную систему метчинга товаров в X5 Digital: опыт, грабли и результат

Привет, Хабр! Меня всё ещё зовут Данила Федюкин, и я продолжаю быть тимлидом в X5 Digital. Руковожу командой, которая занимается метчингом. В прошлый раз я рассказывал, как мы перешли на собственную систему рекомендаций, а в этот раз о том, как делаем то же самое, но с метчингом товаров.X5 Digital – один из цифровых бизнесов Х5. Мы работаем в режиме Highload с RPS в 7500 и отвечаем за всю онлайн-доставку в более чем 1000 городах и населённых пунктах России.Этот канал постоянно растёт. В 2024 году покупатели Х5 совершили свыше 119,5 млн заказов продуктов на дом.

продолжить чтение

Оставлено в

Как мы учили поиск понимать контекст: практическое руководство Купера для маркетплейсов

Когда слов недостаточно, поможет семантический поиск на ElasticsearchВ IT-сообществе только и разговоров об эмбеддингах, metric learning, косинусных расстояниях и семантическом поиске. На конференциях все рассказывают про нейросети и векторные пространства. Но если заглянуть под капот и посмотреть, что реально работает в поиске крупных маркетплейсов и e-commerce платформ, то там, как правило, он — добрый, старый полнотекстовый индекс.

продолжить чтение

Оставлено в

CLIP + LLM в проде: мультимодальный «Поиск по фото» для маркетплейса

Привет! Меня зовут Никита Романов, и я техлид продуктов «Поиск по фото» и «Похожие по фото» в Wildberries. За спиной — более семи лет опыта в сфере CV.В этой статье мы обсудим онлайн сервис «Поиск по фото» - архитектуру и основные компоненты — Image Retrieval, подбор текстовых тегов и уточнение текстом. Также обязательно поговорим о векторном индексе Qdrant, т.к. метрики и эксперименты мы тестируем в нём. Расскажем про результаты A/B-тестов и что уже в проде.Как работает «Поиск по фото»

продолжить чтение

Оставлено в

С помощью ИИ этот парень запустил конкурента Google прямо у себя в кладовке

Почти тридцать лет назад, когда Google только выходил на свою победную тропу, у её основателей почти не было железа.

продолжить чтение

Оставлено в

Запустили векторный поиск в YDB: рассказываем, как он работает

В новой версии YDB

продолжить чтение

Оставлено в

Не окей, гугл: как сделать поисковик для работы с служебными презентациями

Привет, Хабр! Это снова команда «МосТрансПроекта». Мы постоянно работаем с информацией и знаниями, которые храним в служебных презентациях. Чтобы ими было удобней пользоваться и извлекать данные, мы решили создать удобный сервис хранения документов с поиском. Задача оказалась непростой, и в этой статье мы расскажем, как её решили. Текст будет интересен всем, кто занимается структурированием данных, поисковыми машинами и ИИ.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

векторный поиск.

Как я пытался сжимать смыслы вместо байтов

Полезные агенты на платформе MWS GPT

Создаем простую систему RAG на Python

Как и зачем мы разработали систему анализа аномальных логов. Кейс MWS

Как мы сделали альтернативную систему метчинга товаров в X5 Digital: опыт, грабли и результат

Как мы учили поиск понимать контекст: практическое руководство Купера для маркетплейсов

CLIP + LLM в проде: мультимодальный «Поиск по фото» для маркетплейса

С помощью ИИ этот парень запустил конкурента Google прямо у себя в кладовке

Запустили векторный поиск в YDB: рассказываем, как он работает

Не окей, гугл: как сделать поисковик для работы с служебными презентациями

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

векторный поиск.