Что происходит, когда AI выходит за пределы прототипа и попадает в прод? На митапе обсудим реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов. Среди спикеров эксперты Wildberries & Russ, MWS, МФТИ, Avito, VK, M2, Сбера, Альфа-Банка, red_mad_robot.
Когда: 20 мая, старт в 15:00
Где: Москва + онлайн-трансляция
Регистрация открыта —> здесь
Inside AI: Main Track. Доклады на 30 минут от Wildberries & Russ, MWS, МФТИ
-
«Векторный поиск в модерации контента: как поместить более 200 моделей в 1 ансамбль»
Лев Нечаев, Руководитель команды «Автоматическая модерация методами ИИ» Wildberries & RussВекторный поиск — элемент 2-stage модерационных моделей, позволяющий снизить Time to market модерации без дополнительного обучения моделей. Расскажем весь пайплайн: от первых моделей до появления универсальных детекторов на основе векторного поиска, о технических сложностях сбора данных, реализации высоконагруженных детекторов. На практических примерах покажем преимущества векторных детекторов по сравнению с обычными one-stage детекторами.
-
«Внедрение AIOps-практик для контроля и повышения общей утилизации ресурсов для тысяч продуктовых сервисов»
Даниил Понизов, Team Lead MLOps, Wildberries & Russ
Роман Лазовский, MLOps Engineer, Wildberries & RussРасскажем кто такой ваш этот AIOps и как он помогает решать проблемы, возникающие при промышленной эксплуатации ML и GenAI сервисов требующих большого количества дорогостоящих ресурсов.
В докладе будет наш опыт внедрения AIOps платформы KeepHQ, как она помогла нам повысить утилизацию ресурсов нашего ресерч кластера и сотни продовых ML сервисов в 1.5 раза, а также автоматизировать процесс реагирования и контроля разрешения поступающих алертов. -
«RAG, который не галлюцинирует (почти)»
Артем Каледин, Tech Lead CVM B2B, MWS
Александр Швайко, Junior MLE CVM B2, MWSНо может полностью сломаться из-за одного ранжировщика.
Мы разработали RAG-ассистента — чат-бота на базе LLM, который помогает клиентским менеджерам корпоративного сегмента мгновенно находить точную информацию о 100+ продуктах компании (в рамках mvp = 3) с учётом региональной специфики, цен и нюансов подключения. Сегодня более 1 000 менеджеров готовятся к сотням звонков и встреч вручную, без единого инструмента, что приводит к неточным ответам клиентам и потерям в десятках и сотнях миллионов рублей. Решение построено на архитектуре RAG с использованием модели QWEN3-8B, эмбеддингов BGE-M3 и гибридного поиска (Vector + BM25 через RRF), а ключевым элементом качества стал реранкер — в докладе мы подробно сравним две его версии (на основе FlagEmbedding и metadata-эвристик), покажем метрики, разберём ошибки на конкретных примерах и продемонстрируем живое демо системы. -
«Что на самом деле представляет запуск продуктов на базе LLM»
Юрий Софронов, руководитель направления «Модели и сервисы для ИИ-Ассистентов», Wildberries & RussРасскажу про то, что разработка и интеграция в продукт ИИ решений на самом деле из себя представляет.
Часто все представляют это так (и сильно ошибаются): скачал пару open-source библиотек, настроил промпты, прокинул API до LLM. Расскажу, что в реальности кроется за тем, чтобы вывести в прод LLM-based сервисы, какие этапы предстоит пройти, что точно делать не стоит, про что точно стоит не забыть. -
«Автоматические гардрейлы»
Владимир Солодкин, ведущий исследователь Института ИИ МФТИМодели защиты (guardrails) являются важным дополнением к основной большой языковой модели (LLM), решающей бизнес задачи. Guardrails защищают от попыток вытащить из LLM запрещенную, конфеденциальная, некорреткную, компрометирующая информацию. Спектр угроз и их изощренность растет с каждым днем. В докладе рассмотрим мультиагентное решение, которое в режиме реального времени анализирует текущие способы атак, например, возникающие в Интернете (в научной литературе, блогпостах и тд), и автоматически дообучает модели защиты. Обсудим и возможность эволюционной модификации не только модели защиты, но и создание новых концепций атак также в автоматическом режиме с помощью мультиагентной системы.
Inside AI: Fast Track. Доклады на 15 минут от Wildberries & Russ, Avito, VK, M2
-
«Text is All You Need. Отекстовка потока видеоклипов в платформе Wibes» Антон Костин, ML Lead, Wildberries & Russ
Виталий Подобедов, ML-разработчик, Wildberries & RussВ Wibes авторские описания видео часто субъективны. Расскажем про сервис, который генерирует тексты и теги напрямую из аудио-визуального контента: как это устроено и как используется для поиска, модерации и определения тематик каналов.
-
«Эволюция поиска вакансий на Avito: ML-оптимизации в Avito Работе» Вадим Вахрушев, старший DS-инженер, Avito
В докладе я расскажу о поиске в Авито Работе: от отбора кандидатов до переранжирования выдачи для баерского ассистента; какие модели у нас используются; кратко расскажу про наиболее удачные эксперименты в поиске.
-
«Как мы за перевели более 10 продуктов на единую Discovery-платформу»
Денис Самохвалов, Руководитель отдела рекомендаций социальных сервисов AI VKDiscovery-платформа — единая инфраструктура для рекомендаций, поиска и рекламы. Её ядро: шардированный рантайм, стриминговая платформа Profile Stream и Feature Flow. Расскажу про путь эволюции платформы от катбустов к нейроранку, как мы перевели 10+ продуктов и сократили внедрение новых рекомендаций в продуктах до 3 месяцев. Покажу на примерах преимущества платформизации рекомендаций: снижение time-to-market, codless-подход и переиспользование готовых пайплайнов.
-
«Vibe Driven Development»
Петр Маслак, Product Manager (ML & Data Science), Wildberries & RussРазберем, как мы пришли от машинного кода к разработке «разговором» с моделью, и почему в этой новой реальности старый data-driven подход часто ломается: кода больше, ясности меньше. Покажу практику Vibe-Driven Development: как превращать интуицию и живой опыт использования продукта в проверяемые решения через цикл «вайб → гипотеза → доказательство».
-
«ИИ для среднего размера компании»
Дмитрий Лахвич, Руководитель Управления по развитию платформы данных, M2Расскажу про ИИ-платформу внутри М2: как выбирали, как разворачивали и от чего пришлось отказаться. Поделюсь опытом того, как не потратить миллиарды на это и как пилотировали продукты, искали точки роста и где уже приносит пользу.
Inside AI: Panel Discussion
Поговорим о том, где проходят границы между LLM, ML и классической автоматизацией, и какие решения действительно работают. Разберём инженерные аспекты AI-продуктов — от агентов и пайплайнов до оценки качества и эксплуатации.
Обсудим реальные кейсы, экономику и масштабирование, а также трансформацию ролей ML/AI-команд: от обучения моделей к платформам, интеграции и управлению качеством. Не пропустите!
Спикеры:
-
Михаил Дьячков, руководитель направления Supply and Demand Balance (DS & ML), Wildberries & Russ
-
Алексей Медошин, директор департамента защиты от DDoS-атак Wildberries & Russ
-
Александр Гирев, Android Team Lead WB Partners, Wildberries &Russ
-
Алексей Жданов, Co-founder & CPO NDT by r_m_r
-
Ксения Михайлова, Руководитель команды ГенИИ пилотов в Альфа-Банке
-
Артем Айупов, Product lead платформы моделей омнимодальности в блоке развития генеративного ИИ Сбера
Кому будет полезно: senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене.
Автор: MariMokieva


