Как я строю рекомендательную модель фильмов: cold start, вектор вкуса и GPT

Выбрать фильм на вечер сложно даже для одного человека.
А если фильм нужно выбрать для пары, где вкусы просто разные, задача становится ещё менее предсказуемой.

Обычные подборки, жанровые фильтры и списки “что посмотреть вечером” помогают только до определённого момента.
Они работают как витрина, но плохо работают как персональная рекомендация, потому что почти не учитывают зрительский опыт ^[1], индивидуальные предпочтения и то, какие фильмы человек вообще уже видел.

Именно с этой задачи я и подошёл к своему проекту NextFilm: не как к каталогу фильмов, а как к рекомендательной системе.
Основной вопрос звучал так: как выдать полезную рекомендацию новому пользователю, если на старте о нём почти ничего не известно.

По сути, в моём контексте это и есть cold start.
Не абстрактная проблема “мало данных”, а вполне прикладная ситуация: пользователь уже хочет получить рекомендацию, а система пока не знает, что он смотрел, насколько у него большая зрительская база и какие паттерны вкуса ^[2] у него вообще есть.

Почему жанров недостаточно

Наивный способ рекомендовать фильмы — опираться на жанры, популярность и общие рейтинги.
Но жанр — слишком грубый признак.

Два пользователя могут одинаково любить фантастику, но один предпочитает медленные, атмосферные и философские фильмы, а другой — динамичные, зрелищные и сюжетно плотные.
Формально жанр один и тот же, но реальные ожидания от фильма — совершенно разные.

То же самое происходит с универсальными подборками.
Они могут давать неплохой средний результат, но почти не решают задачу персонализации, особенно если пользователь уже много смотрел и плохо реагирует на слишком очевидные рекомендации.

Из этого для меня следовал простой вывод:
если рекомендательная система хочет быть полезной, она должна сначала понять не только “что нравится”, но и какой у пользователя зрительский опыт.

Этап 1. Сбор стартовых сигналов

Первый этап в моём пайплайне — не выдача рекомендаций, а сбор стартового профиля.
На этом шаге для меня важнее всего понять, какие фильмы пользователь уже видел и как он к ним относится.

Это критично по двум причинам.

Во-первых, нужно отделить “фильм не нравится” от “пользователь его просто не смотрел”.
Если этого не сделать, модель начинает делать ложные выводы на пустом месте.

Во-вторых, у пользователей очень разная база просмотра.
Один человек знает в основном самые популярные фильмы последних лет, другой — классику и авторское кино, третий вообще редкий зритель и узнаёт только самые громкие названия.

Если все эти сценарии одинаково обработать на старте, модель быстро начинает шуметь.
Поэтому первый полезный шаг — собрать набор уже просмотренных фильмов и получить по ним первичные оценки.

С технической точки зрения ^[3] именно эти оценки становятся первым надёжным сигналом для модели.
Они ещё не дают полноценный профиль, но уже позволяют понять, где у пользователя сильные предпочтения, а где пока слишком мало информации.

Этап 2. Построение вектора вкуса

Когда стартовых оценок становится достаточно, можно переходить от “карты просмотренного” к более содержательной модели предпочтений.

В моём случае вкус — это не просто список любимых жанров.
Я стараюсь разложить его на несколько более тонких параметров: темп, эмоциональный тон, глубина, зрелищность, привычность формы, сюжетная плотность и другие подобные признаки.

Именно здесь оценки начинают превращаться во внутренний вектор предпочтений.
Идея не в том, чтобы сказать “пользователь любит драму”, а в том, чтобы описать, какой тип фильма для него обычно оказывается релевантным.

Такой подход лучше работает на практике, чем грубая жанровая сегментация.
Он позволяет объяснить, почему два фильма из одного жанра могут оказаться очень далеко друг от друга с точки зрения конкретного зрителя.

На этом этапе рекомендательная модель уже может делать первые осмысленные выводы.
Но опираться только на локальные оценки одного пользователя всё ещё рискованно: данных мало, а случайные совпадения могут слишком сильно влиять на выдачу.

Этап 3. Коллективный сигнал

Чтобы не замыкаться только на локальном профиле, я добавляю внешний слой коллективных оценок.
Для этого я использую MovieLens 25M от GroupLens — открытый датасет, в котором собрано 25 млн оценок по более чем 62 тысячам фильмов.

Здесь для меня важна не абстрактная “математика поверх математики”, а вполне прикладная логика ^[4].
Если пользователю понравился определённый набор фильмов, можно посмотреть, какие ещё фильмы систематически нравятся людям с похожими паттернами.

То есть внешний датасет используется не вместо пользовательского профиля, а как дополнительный слой сигнала.
С одной стороны, у меня есть локальные предпочтения конкретного человека; с другой — коллективные зависимости между фильмами, подтверждённые большим числом реальных оценок.

На практике это уже похоже на гибридную схему:
часть сигнала идёт от внутреннего профиля пользователя, часть — от collaborative filtering по похожим оценочным паттернам.

Этап 4. Дообучение на новых сигналах

Важный момент: такая модель не должна оставаться статичной.
Если после первого онбординга зафиксировать профиль навсегда, качество рекомендаций быстро упрётся в потолок.

Поэтому по мере накопления новых оценок модель должна пересматривать значимость признаков, обновлять веса и уточнять, какие факторы действительно сильнее всего влияют на релевантность для конкретного пользователя.
Такой подход обычно описывают как online updates или дообучение на новых пользовательских сигналах.

Это особенно важно в кино.
Вкусы не только различаются между людьми, но и меняются со временем: пользователь может уставать от одних типов фильмов и начинать лучше реагировать ^[5] на другие.

Поэтому для меня рекомендательная система — это не “один раз посчитанная формула”, а постоянно уточняемая модель.
Каждая новая оценка должна не просто сохраняться, а менять дальнейшую траекторию выдачи.

Этап 5. Зачем здесь GPT

Даже если предыдущие этапы уже дают неплохой пул кандидатов, остаётся ещё одна проблема: как превратить технически релевантную выдачу в результат, который человеку удобно воспринимать.

Базовая модель может подобрать формально хорошие варианты, но список всё равно может выглядеть странно.
Например, быть плохо упорядоченным, недостаточно объяснимым или слишком “машинным” по подаче.

Поэтому GPT в моём пайплайне не заменяет рекомендательную модель.
Он стоит поверх неё как финальный слой интерпретации и re-ranking.

Сначала система собирает кандидатов на основе пользовательских оценок, вектора вкуса и коллективных сигналов.
Затем LLM помогает более осмысленно отсортировать кандидатов, сгруппировать выдачу и сделать результат понятнее для пользователя.

Для меня здесь принципиально важно не подменять модель LLM-магией.
GPT хорош в интерпретации, объяснении и финальной подаче, но базовая релевантность всё равно должна рождаться раньше — на уровне данных, сигналов и ранжирования.

Что получается в итоге

Если упростить пайплайн, он выглядит так:

Собрать стартовые оценки и понять, что пользователь уже видел.
Построить начальный профиль предпочтений.
Превратить набор оценок в более устойчивый вектор вкуса.
Сопоставить сильные сигналы с коллективными паттернами из MovieLens 25M.
Отранжировать кандидатов.
Поверх этого применить GPT как слой интерпретации и финальной сборки выдачи.

С инженерной точки зрения для меня это попытка уменьшить долю случайных рекомендаций.
Не советовать “что-то популярное”, а пройти от слабых сигналов к более устойчивой модели пользователя.

Где у подхода ограничения

Понятно, что такая схема не решает всё автоматически.

Во‑первых, cold start остаётся самым чувствительным этапом: чтобы получить приличное качество рекомендаций, системе приходится просить пользователя сделать достаточно заметный первый шаг — поставить оценки ряду фильмов. И если пользователь не готов тратить на это время, система получает слишком мало сигнала и начинает работать хуже.

Во-вторых, в рекомендательных системах всегда есть риск переобучиться на популярных фильмах.
Чем сильнее в данных выражены массовые паттерны, тем выше шанс, что модель будет чаще возвращаться к очевидным вариантам.

В-третьих, LLM-слой тоже нельзя переоценивать.
Он помогает сделать выдачу понятнее, но не исправляет фундаментальные ошибки ^[6], если базовый ранжирующий слой собран слабо.

То есть главный интерес ^[7] для меня сейчас не в “идеальной модели”, а в качестве пайплайна целиком: какие сигналы собирать на старте, как уменьшать шум, как дообучать систему и где правильно ставить границу между классическим рекомендателем и LLM.

Почему мне это интересно

На поверхности задача выбора фильма выглядит простой.
Но если пытаться реально решать её для одного человека или для пары с разными вкусами, очень быстро становится понятно, что жанров, популярных списков и красивой витрины недостаточно.

Поэтому мне и интересно строить систему именно как рекомендательный пайплайн:
с cold start, пользовательским профилем, коллективным сигналом, дообучением и финальным слоем интерпретации.

Для меня это и есть самая интересная часть проекта: не просто подобрать фильм, а понять, как сделать рекомендацию релевантной при недостатке данных на старте, а затем постепенно повышать её качество по мере накопления реальных пользовательских сигналов.

Если у вас есть опыт построения рекомендательных систем — особенно в части cold start, гибридных моделей или интеграции LLM в пайплайн, — буду рад любым замечаниям и альтернативным подходам в комментариях.

Сервис, о котором шла речь в статье: https://nextfilm.pro ^[8]

Автор: Pegiy

Источник ^[9]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29562

URLs in this post:

[1] опыт: http://www.braintools.ru/article/6952

[2] вкуса: http://www.braintools.ru/article/6291

[3] зрения: http://www.braintools.ru/article/6238

[4] логика: http://www.braintools.ru/article/7640

[5] реагировать: http://www.braintools.ru/article/1549

[6] ошибки: http://www.braintools.ru/article/4192

[7] интерес: http://www.braintools.ru/article/4220

[8] https://nextfilm.pro: https://nextfilm.pro

[9] Источник: https://habr.com/ru/articles/1029318/?utm_campaign=1029318&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.