1 of 19

ПЕРСОНАЛЬНЫЕ РЕКОМЕНДАЦИИ

2 of 19

Ранжирование в онлайн-кинотеатрах�

1

2

3

4

5

6

7

3 of 19

Персонализация в онлайн-кинотеатрах�

Выбор основного контента в шапке страницы

Поиск контента

Персонализированные коммуникации с клиентом

Структура страницы

Персональные рекомендации в любых полках

Рекомендации похожих фильмов (item2item)

Выбор персонализированного баннера контента

Персональное превью

Кросс-рекомендации

1

2

3

4

5

6

7

8

9

4 of 19

Кросс-рекомендации в МТС

5 of 19

Старт 20 апреля 2021

  • 3,5 миллиона пользователей (3Q 2021)
  • 22 оригинальных проекта
  • Онлайн-кинотеатр KION получил премию «Большая Цифра» 2021 в номинации «Открытие года»
  • Оригинальный сериал KION «Секреты семейной жизни» награжден на Берлинском фестивале веб-сериалов WEBFEST BERLIN призом за «лучший комедийный сери
  • Ориджиналс-сериал KION «Коса» стал победителем Нью-Йоркского международного кинофестиваля (INYFF) в категории «Лучший ТВ/Веб сериал»
  • Проект KION «Вертинский» стал лауреатом ХХ национальной кинопремии «Золотой Орел» и одержал победу в номинации «Лучший сериал онлайн-платформ»
  • Сериал KION «Пингвины моей мамы» признан победителем в номинации «Лучший сериал" национальной премии киноведов и кинокритиков «Белый слон»

6 of 19

7 of 19

Рекомендации похожих фильмов

8 of 19

Персонализация главной страницы

9 of 19

Полка «Рекомендуем»

МЕТРИКИ:

  • глубокие просмотры из полки
  • рост суммарных �просмотров в приложении

10 of 19

Почему персоналки

11 of 19

Развитие полки «Рекомендуем»

Нет полки

Популярные

Популярные в пользовательских сегментах

i2i модель + переранжирующая формула

Модель двухуровневая

ансамбль моделей первого уровня +

переранжирующая модель

AutoEncoder

DSSM

LightFM

ALS

Boosting

СЛОЖНОСТЬ

РОСТ МЕТРИК

12 of 19

Текущая модель

ПЕРЕРАНЖИРУЮЩАЯ ФОРМУЛА

Похожее на просмотренное

ОТБОР КАНДИДАТОВ

РАНЖИРОВАНИЕ

БИЗНЕС-ФИЛЬТРЫ

13 of 19

In progress

ПЕРЕРАНЖИРУЮЩАЯ МОДЕЛЬ 2-ГО УРОВНЯ

Кандидаты из разных �моделей

ОТБОР КАНДИДАТОВ

РАНЖИРОВАНИЕ

БИЗНЕС-ФИЛЬТРЫ

14 of 19

Продакшн vs соревнование

ОТЛИЧИЯ:

  • данные не статичны
  • влияние на конечного пользователя

ТРЕБОВАНИЯ К ПРОДАКШН РЕШЕНИЮ:

  • обновление данных
  • интеграция с бэкендом приложения
  • мониторинг качества данных и модели
  • учет бизнес-требований

15 of 19

API

Backend DB

Online model service

ETL

Datamarts

HDFS

client

Batch model service

model + reco

DQ + Version

Ok?

yes

HDFS

16 of 19

Учет бизнес-требований

  • Фильтр просмотренного контента
  • Фильтр заблокированного контента на платформе
  • Фильтр по возрастному ограничению
  • Контроль доли контента не из подписки

17 of 19

Мониторинг качества модели

  • Бизнес-метрики
  • Оффлайн-метрики
  • Аватары
  • Собственные персональные �рекомендации в приложении
  • Перед АБ-тестом whitelist

18 of 19

Мониторинг инфраструктуры

КАЧЕСТВО ДАННЫХ:

  • доля пропусков в полях, наличие дублей
  • дрифт статистик (объем данных, распределение фич, …)

HEALTH CHECK СЕРВИСОВ:

  • утилизация CPU, RAM, Hard Disk
  • нагрузка (RPS, время отклика)

19 of 19

Выводы

1

Задачи ранжирования и рекомендаций разнообразны не �только между доменами, но и внутри конкретного домена

2

Реализация рекомов в проде гораздо сложнее участия в соревновании

3

Модели машинного обучения в продукте обычно �развиваются от простого к сложному вместе с инфраструктурой