Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A-B-тестирования
Всем привет! На связи Ваня Ващенко, и я лид по развитию нейросетевых моделей в команде персональных рекомендаций Wildberries. Раньше я развивал B2C-рекомендации и нейросети кредитного скоринга в крупнейшем банке, а теперь вы видите результаты работы нашей команды каждый раз, когда заходите на главную страницу любимого маркетплейса. Сегодняшний рассказ — о том, как мы развиваем WildBERT.WildBERT основан на классической архитектуре Bidirectional Encoder Representations from Transformers (BERT), улучшенной под задачи и проблемы, с которыми сталкивается маркетплейс. Скорее, это не одна конкретная модель, а концепция, которую мы применяем в разных процессах:
Как аналитики Авито с помощью ML помогают людям выбирать хорошие авто с пробегом
Привет! Меня зовут Илья Комутков, я старший аналитик в Автотеке — сервисе по проверке истории автомобилей с пробегом. В статье расскажу, как мы улучшаем проверку машин и создаём алгоритм рекомендаций по дальнейшим действиям для покупателей. Текст будет интересен начинающим или middle-аналитикам, которые уже умеют работать с SQL, python, ML, но ещё не решали многоэтапные задачи, влияющие на бизнес, и ищут способы применить свои навыки в работе.
Несогласованность эффектов или «Где деньги, Лебовски?»
Приветствуем всех читателей! Сегодня мы, Никита и Маша из команды Ad-Hoc аналитики X5 Tech, расскажем о проблеме несогласованности оценок эффектов в A/B-тестировании и Causal Inference и предложим эффективный способ ее решения.1. Предыстория
Линеаризация в офлайн-тестах: как не стереть сигнал вместе с шумом
Если хочешь навести порядок в шуме — сначала разберись, не затёр ли ты в нём сам сигнал.
GlowByte и комьюнити «Сарафан» провели дискуссию о CVM-трендах
27 мая в Москве GlowByte и комьюнити “Сарафан” провели мероприятие “Лето в белом”
Офлайн А-Б тесты в ресторанах фастфуда. Часть 2: Анализ и интерпретация результатов A-B-тестов
Методология — это не шаблон, это компас. А его стрелка — всегда на стороне ваших данных. В первой части «
Офлайн А-Б тесты в ресторанах фастфуда. Часть 1: Планирование и верификация офлайн A-B-тестов
"Основа надёжного A/B — не магия формул, а понимание, с чего вы стартуете и с чем работаете."
Propensity Score Matching (PSM): как обойтись без A-B-теста и всё равно узнать правду
На практике часто возникает необходимость объективно оценить, как то или иное событие влияет на ключевые метрики бизнеса. Это большая и широкая задача, которая часто решается с помощью проведения A/B-тестов. Но что делать, если провести честный рандомизированный эксперимент невозможно?В таких ситуациях полезен метод Propensity Score Matching (PSM), который компенсирует отсутствие случайного распределения за счёт подбора сопоставимых групп для сравнения, снижает влияние скрытых факторов и обеспечивает более точную оценку причинно-следственного эффекта.

