Меня зовут Катя, я продакт-менеджер в Lenta Tech («Группа Лента»). Сегодня хочу рассказать о том, как цифровой клон покупателя помогает сделать персональные офферы с конверсией в лиды.
В крупном ретейле персонализация давно стала обязательным минимумом, но на практике она часто упирается в грубые сегменты и массовые акции «для всех». Покупатель чувствует, что рассылка сделана не под него, и просто перестает реагировать.
В статье расскажу о новом витке развития персонализации с использованием больших языковых моделей, а именно — как можно построить «цифровой клон» клиента на основе его чеков и поведенческих данных и использовать его для создания узконаправленных офферов. Разберем архитектуру решения, проблемы, с которыми мы столкнулись, и результаты, которые принесли рост продаж и охватов среди нашей аудитории.
Подходы к формированию офферов в ретейле
Сегодня в ретейле можно выделить два основных подхода к формированию офферов: от полностью ручных до основанных на больших данных.
1. Ручные правила и сегментация людьми
Маркетинг и аналитики задают сегменты по возрасту, региону, частоте покупок, категориям, например, «частый покупатель кофе» или «семья с детьми». Для каждого сегмента разрабатываются шаблонные предложения: скидка на любимую категорию, акция на сопутствующие товары и так далее.
Плюсы такого подхода — понятность, прозрачность и быстрый старт. Минусы — грубая персонализация, высокая ручная нагрузка и медленная адаптация к изменениям поведения.
2. Классические модели машинного обучения
Они позволяют строить прогнозы вероятности отклика, вероятности покупки категории, модели следующего лучшего предложения, а также товарные рекомендации на основе истории транзакций. Модели обучаются на исторических данных и автоматически подбирают, кому и что предложить, исходя из целевых метрик: оборот, маржа, частота визитов.
Плюсы здесь — лучшее качество персонализации по сравнению с ручными правилами и масштабируемость. Минусы — требуется значимая инфраструктура и команда специалистов по ML, ограничены интерпретируемость и гибкость, а также сложнее отвечать на нестандартные вопросы.
Наша Служба Продвинутой Аналитики (СПА) совместно с отделом CRM торговой сети «Гипер Лента» успешно апробировала новый третий подход персонализации, который базируется на больших языковых моделях.
Большая языковая модель получает на вход ограниченную историю чеков и дополнительные атрибуты клиента, а затем формирует структурированный «портрет»: кто он, как живет, какие у него привычки и потребности.
На выходе получается цифровой клон — текстовое и структурное представление клиента, которое можно расспрашивать и использовать для генерации идей акций и рекомендаций.
В этой статье разберем кейс использования именно третьего подхода — цифрового клона клиента на базе большой языковой модели, развернутой локально в инфраструктуре ретейлера.
Что такое цифровой клон клиента
Под «цифровым клоном» мы понимаем искусственный интеллект, который по данным о покупках и другим внутренним данным строит расширенный и скорректированный профиль клиента: привычки, домохозяйство, ценовой уровень, возможные скрытые потребности.
Задача ИИ — превратить сырые транзакции в осмысленные выводы, которыми можно управлять из прикладных систем: CRM, платформы лояльности, системы триггерных коммуникаций.
На практике это выглядит так:
-
Берется история чеков клиента за определенный период и общие данные о нем, затем они передаются языковой модели с продуманной текстовой инструкцией (промптом).
-
Модель формирует детальный профиль клиента и «объяснения», на основании каких паттернов покупок сделаны выводы.
-
Далее эти профили используются для настройки персональных акций и сценариев общения.
Из чего состоят данные о клиенте
В исходных транзакционных данных ретейла по одному клиенту обычно содержится история чеков и частота визитов.
Для каждого чека фиксируются:
-
дата и время покупки;
-
канал покупки (офлайн, доставка, самовывоз и так далее);
-
город и адрес магазина.
Для каждой позиции в чеке хранятся:
-
название товара;
-
категория и ее идентификатор;
-
ценовой сегмент (условная шкала от эконом до премиум);
-
скидка на товар;
-
количество (штучно или в килограммах для весового товара).
Для построения профиля мы остановились на интервале в 90 дней с момента последней покупки, чтобы учесть актуальные привычки.
Клонирование: от чеков к профилю клиента
После подготовки чеков начинается процесс «клонирования» — превращения данных в цифровой профиль.
Сбор промежуточных профилей по временным окнам
Для каждого клиента и каждого временного окна в 90 дней формируются «локальные» профили по набору ключевых атрибутов:
-
Социодемографические характеристики: возрастная группа, пол, семейный статус, количество взрослых и детей в семье, возраст и пол детей, наличие и количество питомцев, виды питомцев и т.д.
-
Предпочтения: какие товары и категории наиболее значимы для клиента, какие блюда клиент готовит из данных товаров и т.д.
-
Одновременно фиксируются обоснования: какие категории товаров и паттерны поведения привели модель к тем или иным гипотезам. Полученные ответы по товарам и категориям проходят через обязательный мэтчинг с продуктовым каталогом компании.
Нормализация и разрешение конфликтов
Анализируются конфликтные значения, полученные в разных вопросах (промптах) к клиенту, и применяются правила их разрешения — выбираются наиболее частотные и логически обоснованные версии атрибутов.
Если нет преобладающей версии, атрибут помечается как «неизвестно», чтобы не вводить систему в заблуждение.
Формирование итоговой таблицы профиля
Для каждого клиента строятся две таблицы:
-
о выявленных атрибутах клиента;
-
о выявленных предпочтениях клиента к товарам и категориям.
Итоговые данные экспортируются для дальнейшей аналитики и использования в бизнес-процессах, а именно — для запуска рекламных кампаний.
Проблемы исходных данных и зачем тут вообще ИИ
Реальные клиентские профили в ретейле далеки от идеала:
-
Анкетные данные могут быть неполными или неверными (ошибки при заполнении, намеренные искажения).
-
Покупки по одной карте могут совершать несколько человек, например, члены семьи или друзья.
-
Исторические данные могут содержать шум и редкие нестандартные покупки, которые не отражают реальное поведение.
Классические подходы к сегментации и даже машинное обучение не всегда хорошо справляются с такими «грязными» профилями.
Большая языковая модель, обученная понимать контекст и причинно-следственные связи, позволяет извлечь из тех же чеков больше смысла: понять, кто с какой вероятностью стоит за этими покупками, как устроено домохозяйство и где находятся скрытые точки роста выручки.
Результаты пилота
В рамках пилотных запусков CVM-кампаний с использованием цифрового клона в «Гипер Ленте», охвативших более 1 миллиона активных клиентов, были достигнуты следующие результаты:
-
Рост товарооборота порядка 15%;
-
Рост маржинальности порядка 11%;
-
До +30% отклика на клиентские коммуникации по сравнению с базовыми сценариями.
Полученные результаты показывают, что использование языковых моделей дополняет классические ML- и uplift-модели, усиливая их за счет повышения релевантности взаимодействия с клиентом.
Почему это важно для ретейла сейчас
Рынок ретейла становится всё более конкурентным, а покупатель — всё чувствительнее к нерелевантному шуму. Использование больших языковых моделей для построения цифровых клонов клиентов позволяет не просто улучшить метрики отклика, но и глубже понять структуру спроса и реальное поведение домохозяйств.
Дальнейшее развитие подхода — масштабирование на большую клиентскую базу и расширение круга задач, которые можно решать через «расспрос» цифрового клона.
А вы пробовали использовать LLM для персонализации в своих продуктах? С какими неожиданными проблемами столкнулись?
Автор: kate_nako


