1 of 103

Аналитика, модели и BI инструменты

К росту прибыли на доступных данных

Помогаем бизнесу

собирать и использовать

онлайн / офлайн данные

2 of 103

О Coffee Analytics

Занимаемся исключительно комплексной аналитикой, основана в 2019 году, в команде 20+ человек в 3-х офисах (Санкт-Петербург, Владимир, Алматы).

25 активных клиентов и более 80 реализованных проектов. Проводим крупные индустриальные исследования, выступаем на конференциях.

3 of 103

Руководители технической команды

Управляющий партнер, tech team lead

CTO, Data Scientist, PhD

Эксперт в Data Science. Интересы: распознавание образов, системы поддержки принятия решений на данных. Разработка моделей линейной и нелинейной регрессии, ансамблевых моделей на основе деревьев решений и моделей кластеризации. Ктн.

Эксперт в маркетинговой аналитике. Интересы: BI системы, модели предиктивной клиентской аналитики, аналитика программ лояльности. Автор курса “CRM аналитика”, Управленческих воркшопов, индустриальных исследований. Эксперт Я.Практикум. Автор книги “Все что вы хотели знать про LTV, но боялись спросить”. MBA.

eTarget 2021

Исследование “Развитие и применение методологии LTV в СНГ

Олег Моногаров

Андрей Муратов

4 of 103

Работаем на всех уровнях аналитики,

создавая условия для поиска инсайтов роста из дашбордов, и автоматизируя решения с предсказательными моделями

BI Описательная

Дашборды

Отчеты

ML

Диагностическая и предиктивная

Модели

Прогнозы

Консалтинг

Предписывающая

ценность

5 of 103

Решая широкий спектр аналитических задач

Интеграция данных

Стандартные отчеты в BI

Дашборд директора

Специальные отчеты

Статистический анализ

Прогнозное моделирование

Оптимизация

Эксперименты

ММО, ROPO, Скоринг клиентов, АБС тесты, Атрибуция медиа эффекта

прогноз LTV до клиента, churn rate, ML атрибуция, кластеры,

Прогноз продаж, Факторы

Анализ ПЛ, RFM, CJM, когорты, аналитика продаж, корреляция

Рекламные отчеты, товарная аналитика

ценность

сложность

+

Описательная

Предиктивная

Предписывающая

Диагностическая

6 of 103

На стеке технологий любой сложности

6

Облачные Базы данных

Средства визуализации

Языки и библиотеки для обработки данных

Аналитические системы

Маркетинговые платформы

Дополнительные источники данных

Данные камер, синдикативные исследования, открытые базы,

парсинг, коллтрекинг, любые API

7 of 103

Структура кейс базы

  1. Эффективность программ лояльности
  2. Сквозная аналитика
  3. Сложная сквозная аналитика
  4. Воспроизводимые исследования
  5. Сегментация и перетоки
  6. Эффективность CRM маркетинга
  7. Управленческая отчетность
  8. Все про LTV
  9. Глубокая клиентская аналитика
  10. Товарная аналитика

8 of 103

#1 Эффективность лояльности

Аналитика программы лояльности

(United Colors of Benetton)

9 of 103

Архитектура данных в типовом BI проекте

Мобильное приложение продавца в магазине

Кассовое ПО кассира 1С-Рарус

Рекламные кабинеты

анонимные чеки + маржа

данные по лояльным

web/app

счетчики

Доставка, примерка

Рассылки / Push

Цели по магазинам помесячно

Оценка вовлечения

Оборот vs баланс баллов

Эффективность и динамика

Топ товаров и оценка по категориям

отчеты в BI

Сводный отчет

Остатки на складе

google sheets

маркетплейсы,

social, парсинг

телефония, чаты

CDP|CRMs

DWH

10 of 103

Аналитика программы лояльности

Специальный отчет под потребности компании

ссылка на отчет в power BI, видео кейс, инструкция создания

11 of 103

Оценка вовлечения

Структура отчета

11

Задача 1

Проанализировать динамику притока новой членов клуба лояльности и их постоянство

Решение

Оценка % пропорции СС с разбивкой по магазинам и оценка их покупательского потенциала

Метрики

  • Доля вступивших от новых чеков, %
  • Все чеки vs повторные чеки

12 of 103

Оборот vs баланс баллов

Структура отчета

12

Задача 2

Оценить, как баланс баллов и динамика скидки влияет на вовлеченность и оборот

Решение

Оценка динамики накопленных баллов vs прирост базы CC; влияние динамики % скидки от оборота на оборот

Метрики

  • средняя скидка
  • начислено/списано баллов -% оборота
  • накопленный итог по кол-ву участников CC

13 of 103

Топ товаров и оценка по категориям

Структура отчета

13

Задача 4

Вывести самые покупаемые товары в разные периоды и оценить влияние товарных категорий на продажи

Решение

Топ товаров по кол-ву шт. и обороту, дерево декомпозиции для категорий товаров

Метрики

  • Соц.дем принадлежность тов. группы
  • Категория типа одежды
  • Подкатегория - название одежды

14 of 103

Эффективность и динамика

Структура отчета

14

Задача 3

Оценка эффективности продаж членам клуба CC и динамику их развития

Решение

Оценка динамики показателей в чеках в расчете на 1 участника CC

Метрики

  • средний чек
  • средний доход с 1 шт товара в чеке
  • среднее количество шт товара в чеке

15 of 103

Метрики сводного отчета

15

Задача

Оценить перспективу доходов

Оценка динамики роста базы

Оценка динамики продаж

Решение

Оценка данных по продажам для всей базы лояльных клиентов

Вывод данных по всей базе и приросту новых пользователей

Вывод данных по чекам и их основным характеристикам

Метрики

  • оборот на 1 лояльного
  • кол-во чеков на 1 лояльного
  • кол-во чеков на Активного члена программы

  • общее кол-во членов программы лояльности на дату
  • кол-во вступивших в программу лояльности за период

  • оборот
  • кол-во чеков
  • средний чек
  • среднее кол-во штук товара в чеке
  • средняя стоимость одной позиции в чеке

16 of 103

Сравнение лояльных vs нелояльные

16

17 of 103

#2 Сквозная аналитика

Performance отчеты с LTV/CAC,

АБ эксперименты

18 of 103

Performance: отчет по рекламе до CPO/CPS

Использование: Базовая оптимизация рекламы в динамике и контроль ДРР.

19 of 103

Performance: отчет по заказам

атрибуция 40-20-40

Использование: оценка источников в разной роли (привлечение / реактивация) и в динамике

20 of 103

Отчет по источникам трафика

Использование: Классические отчеты по источникам трафика и РК для отбора неэффективных связок.

21 of 103

Performance: CAC vs LTV

новые клиенты, июнь

новые клиенты,июль

Использование: контролировать РК на Новых клиентов (оптимизация CAC по LaL-1%, ремаркетинг и новой коллекции уменьшила охват качественной ЦА, снизила их LTV и ср. выручку)

презентация воркшопа

полезный

маркетинг

22 of 103

Отчет по воронке продаж

Инсайт: Анализ всей воронки по гео, брендам и каналам поднял важную конверсию “добавление в корзину” на 0.87%

23 of 103

Экономическая эффективность

Инсайт: Прозрачность динамики CPO по разным каналам, брендам и параметрам РК позволила сократить расходы на неэффективные канала на 9.4%

24 of 103

Задача “История владения (ТО)”

Оценить качество удержания аудитории по кол-ву ТО, какими сервисами пользуется.

Решение:

Когортный анализ с месячными/недельными когортами с переменной кол-ва ТО 1..N :

  1. Каналы / Кампании
  2. Сервисы
  3. Гео, место покупки
  4. Купоны / промо
  5. С Тест.Драйв/Без
  6. Трейд ин/без

Прохождение ТО

№ТО

Номер ТО

Сервисы, Город, место покупки итд

25 of 103

Yandex Datalens. Дашборд по заказам, мультиканальная атрибуция к источникам

Инсайт: Прозрачность динамики CPO по разным каналам, брендам и параметрам РК позволила сократить расходы на неэффективные канала на 9.4%

26 of 103

#2 Сложная сквозная аналитика

ROPO со связью ID клиента и без связи

27 of 103

Стандартные ROPO Отчеты с ID клиента

Использование: оценивать ROPO эффект и общее качество онлайн каналов по брендам, РК, регионам/городам и другим срезам.

28 of 103

ROPO c ID связью вглубь каналов

для лучшей атрибуции офлайн продаж к конкретным каналам считаем 7, 14, 30 дневное окно под категорию.

к "офлайну" могут относиться также звонки. это все по ID

таким образом появляется инструментарий тактически оптимизировать каналы (crm|перформ) до любых настроек.

29 of 103

ROPO без ID связи

расчета эконометрического эффекта (Ropo-2) сначала готовится воспроизводимое исследование, модель. и строятся даши на уровне каналов. через min-max интервал достоверности. или выводом ошибки.

30 of 103

Объединяем ROPO с ID клиента и без ID

финальный этап -

совмещение Ropo 1 + Ropo 2 в единый отчет. так как часть Ropo 1 попадает в Ropo 2, нужно будет его отчищать для этого. решаемо.

в дашах клиент будет видеть до уровня не глубже месяца и каналов 2 этих эффекта.

мастер класс по обоим подходам здесь

31 of 103

#2.1 Исследования

Формирование гипотез и их проверка

32 of 103

АБ эксперименты для макс ROI

Задача: Макс ROMI через определение оптимальной конфигурацию комбинаций

Рекламный КАНАЛ -> РК (desktop/mobile) -> Лендинг (страховой продукт) -> Дефолт конфигурация

Стек: GA + Optimizely

Сложность перебора:

  • 5+ продуктов
  • 100+ дефолт конфигураций
  • 10+ РК
  • 15+ Каналов

Итог: +160% ROMI (CAC vs av.price)

конверсия (покупка) с 1% до 6%.

33 of 103

Аналитика продаж и поиск узких мест

Сравнив уровень продаж с аналогичным периодом прошлого года, можно увидеть нехарактерное падение в мае.

Ответ на диаграмме ниже: да, в праздники характерно уменьшение количества заказов, в то время, как в выходные уровень продаж повышается.

Вопрос: это плохой тренд или длинные праздники, ошибки в данных?

34 of 103

Когортный анализ (исследование)

Ответ: нет, в прошлом году новых покупателей было больше.

Вопрос: количество заказов выросло, потому что пришли новые покупатели?

Дополнительное исследование показало, что основные продажи приносят клиенты прошлых лет

новые

старые

35 of 103

#3 Сегментация и перетоки

Сегментация и перетекание сегментов для Ешь Деревенское

36 of 103

Показатели базы клиентов

Расчет ключевых показателей:

  • LTV базы + прирост
  • Естественный прирост
  • и его декомпозиция
  • Средний LTV
  • Оценка доли активных клиентов

Позволяет верхнеуровнево оценить здоровье базы клиентов

запись кейса

1

2

3

4

5

37 of 103

Ключевые этапы воронки

Расчет ключевых конверсий в динамике (день, неделя, месяц):

  • Все визиты - новые %
  • Новые визиты - клиенты %
  • Общая картинка по конверсиям

Позволяет верхнеуровнево оценить соотношение и динамику ключевых конверсий в воронке.

1

2

3

38 of 103

Когортный анализ

Расчет ключевых конверсий в динамике (день, неделя, месяц):

  • Оценка удержания по промокодам
  • Источникам трафика
  • Визуально
  • И в детализации (с учетом канала)
  • И нужных фильтрах
  • и показателях

Позволяет оценить качество различных сегментов аудитории на дистанции.

1

2

5

3

4

6

39 of 103

40 of 103

Когортный анализ + LTV

Сравнение по годам с учетом LTV когорт:

  • Год к году
  • По кварталам
  • В детализации

Позволяет оценить долгосрочную ценность клиентов и их удержание

1

2

3

41 of 103

Кластеризация базы (с ML + LTV)

Оценка характеристик и изменений сегментов.

Выявлено 7 с однородными покупательскими характеристиками.

Позволяет оценить структуру базы и ценность сегментов.

и далее персонализировать коммуникацию

42 of 103

Аналитика лояльности при смене сегментов

43 of 103

44 of 103

#4 Эффективность CRM маркетинга

CRM аналитика и отчеты по воронке

45 of 103

Стратегический/тактический

отчет по рассылкам

46 of 103

Дашборд по отзывам из рассылок

Атрибуция отзывов о товарах к рассылкам last click. Все данные из Mindbox.

Ранее отчет собирался вручную и не имел детализации по каналам и рассылкам. Благодаря выгрузке сырых данных, удалось рассчитать атрибуцию в BigQuery.

Основные метрики:

- Доля отзывов из рассылок от общего числа отзывов

- Конверсия в отзыв в разрезе каналов и рассылок

47 of 103

Анализ отписок от email

Как количество писем на клиента (за неделю) влияет на отписки?

Какие комбинации цепочек были в топе и к какому unsubscribe rate они привели?

Основные метрики:

- Доля отзывов из рассылок от общего числа отзывов

- Конверсия в отзыв в разрезе каналов и рассылок

48 of 103

Влияние CRM на сегменты

Для оценки эффективных коммуникаций следим на что реагировали клиенты в каждом сегменте. Конструктор позволяет углубляться до уровня отдельной рассылки.

под НДА

49 of 103

Влияние типа рассылок на сегменты

Отдельно смотрим на динамику эффективности типов коммуникаций в каждом сегменте и в целом. Выявляем хиты, точки роста, менее удачные.

под НДА

50 of 103

Влияние CRM на перетоки

Для оценки эффективных коммуникаций следим на что реагировали клиенты, поменявшие сегмент на более ценный.

под НДА

51 of 103

CRM каналы в мультиканальной

атрибуции

Как количество писем на клиента (за неделю) влияет на отписки?

Какие комбинации цепочек были в топе и к какому unsubscribe rate они привели?

Основные метрики:

- Доля отзывов из рассылок от общего числа отзывов

- Конверсия в отзыв в разрезе каналов и рассылок

52 of 103

Оценить влияние игры на LTV “игроков”

и отобрать сегменты кому рассылать инвайт

Кейс: в течение 2х месяцев Benetton предлагал клиентам получить баллы лояльности через игру Джузеппе. Эффект от участия на покупки был непрозрачен. Для каких сегментов актуальна механика?

Собрали транзакционные и поведенческие данные по ID клиента. Анализ показал значимый прирост в покупках у определенных сегментов после участия в игре, предсказанный LTV игроков вырос на 10%.

53 of 103

#5 Управленческая отчетность

варианты “дашборд директора”

54 of 103

Стратегический/тактический

55 of 103

Стратегический/тактический

56 of 103

Дашборд директора

цели:

быстрое отслеживание оперативной ситуации в бизнесе

зачем:

держать “руку на пульсе” по основным характеристикам бизнеса

57 of 103

#6 Все про LTV (+ книга)

Прогноз LTV и внедрение в маркетинг

(United Colors of Benetton)

58 of 103

Архитектура данных в типовом ML проекте

Мобильное приложение продавца в магазине

Кассовое ПО кассира 1С-Рарус

Рекламные кабинеты (онлайн)

проход на мероприятие

анонимные чеки + маржа

данные по

лояльным

Счетчики (GA, YM)

(сайты, apps, итд)

Доставка, примерка,

др. сервисы

Декомпозиция факторов

отчеты в BI по LTV

LTV год к году для активных покупателей

direct: email, sms, push

churn

classification

LTV

model

+

Оценка вовлечения

Оборот vs баланс баллов

отчеты в BI по ПЛ

personal recommendations

CMS

ERPs

доп сервисы

сегменты аудиторий

телефония, чаты, боты, ивенты

CDP

59 of 103

Точная персонализация на подписке

Рекламные кабинеты

Офлайн реклама и интеграции

Поведение клиента

(сайты, apps, итд)

UPlift кампаний

LTV год к году для активных покупателей

direct (CRM): email, sms, push

next best channel

next best time

+

Структура базы, кластеры, сегменты

CAC|LTV, ROAS

сегменты аудиторий + корректировка ставок

События (звонки, чаты, боты)

CDP

NBO метрики

real-time

погода, экономика,

3rd party data

кастомные отчеты

стандартные отчеты

NBO триггеры

транзакционные,

товарные, клиентские фиды

next best offer +

propensity to buy

60 of 103

LTV|churn prediction (product #1)

ad online platforms

offline channels

website / app trackers

Factor decomposition

+ LTV / churn data

Cohort analysis, clustering, flows

direct: email, sms, push

churn

Buy.prob

LTV

model

+

Performance analytics

full CJMs

personal recommendations

clusters

audience segments

phone calls, chat bots, support

CDPs

predictors, clusters

weather, geo, economic data

Deep customer analytics module

MoM dynamic, specific ratios

customized BI reports

transactional / customer data

61 of 103

Архитектура данных в типовом ML проекте

Мобильное приложение продавца в магазине

Кассовое ПО кассира 1С-Рарус

Рекламные кабинеты

офлайн реклама

анонимные чеки + маржа

данные по

лояльным

Счетчики

(сайты, apps)

Доставка, примерка,

др. сервисы

Декомпозиция факторов

отчеты в BI по LTV

LTV год к году для активных покупателей

direct: email, sms, push

churn

classification

LTV

model

+

Оценка вовлечения

Оборот vs баланс баллов

отчеты в BI по ПЛ

personal recommendations

CMS

ERP/CRM

доп сервисы

сегменты аудиторий

телефония, чаты, боты

CDP

иные данные, погода

Собираемые данные до ID клиента

62 of 103

Прогноз LTV клиентов (ML)

Омниканальный ритейл

Повышение ROI инвестиций в рекламу через анализ LTV

ЦЕЛЬ: повысить эффективность затрат на рекламу и увеличить объем продаж за счет фокуса на перспективных клиентах

СМОТРЕТЬ КЕЙС ПОДРОБНЕЕ

Монобрендовый ритейлер

63 of 103

Пример отчета LTV

- Сравнение LTV (доход с человека в течении года) для разных периодов времени

- Сравнение LTV и привычной метрики «Оборот на человека»

LY = Last year (Прошлый год)

*цифры изменены

ссылка на BI отчет

64 of 103

Дерево декомпозиции факторов (LTV / Churn)

Что показывает:

  • Влияние факторов каждого уровня на конечный показатель (LTV)
  • Для всей базы клиентов или определенного месяца (когорты) и сегмента (в поведении)
  • Позволяет проводить брейншторм сессии для генерирования гипотез роста

65 of 103

Качество разрабатываемых моделей

На примере вероятности будущей покупки или контракта

Churn Rate * = (Кол-во ушедших пользователей / Общее количество пользователей) * 100%

Формула для всей базы клиентов

Как предсказать для клиента / сегмента / когорты?

Требуется тренировать ML модель

БЕЗ понимания факторов влияния

известны факторы влияния

30-40%

90-99%

Точность предсказания

66 of 103

Примеры факторов влияния (LTV / Churn)

R - кол-во мес. с последней покупки (месяц жизни).

quantity - кол-во купленных вещей.

noTran_day - кол-во нерабочих дней для магазина, где клиент больше всего потратил денег

lag_days - среднее кол-во дней между покупками

lag_diff - кол-во дней с последней покупки за пред. месяц / кол-во дней с последней покупки за сегодняшний месяц

При этом, компания также получает доступ к декомпозиции факторов влияния на конечную метрику

67 of 103

Step 2: LTV Prediction Using Embeddings

from content websites

To improve forecasting results, a principle from natural language processing is used: embedding, which consists of in the grouping of words occurring in a similar context.

The grouping of buyers occurs in a similar way (Figure 2):

  • Each row represents a product sold on ASOS, a sequence of customer views of that product and other content from the site. The exact time the product was viewed is ignored.
  • Clients that appear frequently in the same context window will be close to each other.

Fig 2 - Content Embeddings

68 of 103

Step 2: LTV Prediction Using Embeddings �from content websites

  • Add the ability to take into account the seasonality of the data.
  • Model training takes place in two stages: data preprocessing and training of Random Forest to predict churn and LTV, data calibration (comparison of percentiles with real values)
  • free shipping and returns → easy to get negative customer LTV

Pic 1 - Architecture

Using additional 1P data from Content websites sessions (Makeup.ru, Skin.ru, SalonSecret.ru) we’ll be able to improve LTV model.

69 of 103

LTV|churn “из коробки” на подписке

Рекламные кабинеты (онлайн)

офлайн реклама

Счетчики

(сайты, apps, итд)

UPlift кампаний

отчеты в BI по LTV

LTV год к году для активных покупателей

direct (CRM): email, sms, push

churn

Buy.prob

LTV

model

+

Структура базы, кластеры, сегменты

CAC|LTV, ROAS

отчеты в BI по КА

personal recommendations

clusters

сегменты аудиторий + корректировка ставок

телефония, чаты, боты, ивенты

CDP

клиентские метрики, новый поля

погода, экономика

СА модуль прогнозной

клиентской аналитики

кастомные отчеты

модуль работает с популярными CDP и

предлагает набор рекламных стратегий и отчетов

стандартные

отчеты

сегменты аудиторий

транзакционные,

товарные, клиентские фиды

70 of 103

#7 Глубокая клиентская аналитика

модели и исследования

71 of 103

Конструктор мини кластеров (RFM-based)

Аналитическая задача. Подготовить инструмент для глубокого изучения клиентов с визуальным анализом.

Решение. Подготовлены 10+ мини кластеров в 2х мерном пространстве, выделены приграничные зоны (25%). Принадлежность клиента загружается в CDP. Анализ проводится в сводной и Power bi.

NDA

72 of 103

Кластеризация K-MEANS

Однородность в поведении

Аналитическая задача:

Выявить скрытые сегменты клиентов и свойственных им закономерностей поведения.

Решение. Было проведено:

  • Определение пространства признаков кластеризации.
  • Кластерный анализ в Python по однородности выделенных признаков.
  • Интерпретация полученных результатов (отчет).

Результаты:

удалось выделить 8 характерных паттернов поведения клиентов, аккумулирующих в себе широкий спектр признаков.

NDA

отчет документ

исходная

низкое качество разбиения

новая схема (высокое качество разбиения)

73 of 103

Кластеризация K-MEANS

Однородность в поведении

Выявить скрытые сегменты клиентов и свойственных им закономерностей поведения.

  • Определение пространства признаков кластеризации.

NDA

74 of 103

Кластеризация AUTOENCODER + K-MEANS

Однородность в поведении

задача:

Кластеризация с помощью нейронной сети заключается в том, что нейронная сеть сжимает исходные 11 параметров до 3-х более абстрактных признаков, выявляя общие черты у разных клиентов. Затем по полученным 3 признакам проводится кластеризация методом k-means.

Результаты:

Отображение в трехмерном пространстве выявленных признаков, разделенных на кластеры.

NDA

75 of 103

Модели “Вероятность покупки”

Вероятность будущей покупки или контракта

Аналитическая задача:

Создать надежную модель сегментации клиентов по “готовности к покупке”

Бизнес применение:

  • Определение оптимальных каналов коммуникации для разных сегментов клиентов (ОЛВ, СМ, Баннерка, Контекст);
  • Определение триггерных точек для адресной коммуникации с разными сегментами;
  • Определение барьеров на сайте - этапов с которых уходит аудитория и рекомендаций по их исправлению.

Решение:

Модель “Дерево решений”

Результат:

+ 2.7% к валовой прибыли на клиента

Quantity_reserves

Наличие резерва в истории клиента

Lead_days

Число дней с момента заведения интереса

LivingComplex_min_score

Интерес к ЖК с конверсией по нижней границе

report in doc

NDA

76 of 103

Модели “Вероятность фрода”

Вероятность негативного поведения

Аналитическая задача:

Создать модель идентификации клиентов с отрицательными флагами (“фрод”), которая будет включать:

  • определение и программирование различных предикторов на основе данных компании (данные клиента, изменение персональных данных, оповещения СБ, атрибуты принятых и непринятых заказов, транзакции, информация о POS)
  • спецификация отсечки, для определения, кто получает отрицательный флаг
  • оценка как обучающей, так и тестовой выборки, флаги устанавливаются отсечками

Решение:

xgboost ML алгоритм для обучения модели (AUC > 0.97)

Результат:

+ 1.2% к валовой прибыли на сессию

NDA

77 of 103

ROPO % (с ID)

Эффект онлайн

продвижения на офлайн продажи

Создать отчетность для отслеживания % офлайн транзакций по итогу онлайн активности. Агрегация по брендам, каналам, регионам/городам.

NDA

Инсайт: Для некоторых брендов мультипликатор Ropo (увеличение/уменьшение среднего чека для оффлайн) меняется очень динамично в зависимости от сезона

Инсайт: Разбив Ропо по городам видно, где клиентов легче забрать онлайн, а где оффлайн. В городах с большей долей оффлайн чаще была выше представленность бренда в городе. Там, где проседает онлайн сильны конкуренты. Есть города где покупают только офлайн.

78 of 103

ML атрибуция на поведенческих данных

«Вероятность покупки» считается на каждой сессии для поиска точек роста.

Модель анализирует поведенческие данные, ценные действия и прошлые конверсии, чтобы прогнозировать покупки.

А также вклад каждого источника трафика в итоговый LTV клиента.

также позволяет проводить хорошо спланированные A/B-тесты с высокой статистической значимостью.

Все визиты на сайт/приложение (GA)

Ценные действия (GTM)

Покупки (CRM)

79 of 103

Step 2: Funnel based ML attribution (direct)

In search of profitable channels and their optimal combination:

  • We build attribution model based on coverage

and related micro conversions attributed to each channel.

  • Model estimations will be made based on the difference in the values of predicted probability of purchase (before/after each session).

Let's look at example:

transaction revenue = 0.3*Customer features + 0.2* 1st Customer interaction(Google Adwords) + 0.4 * 2nd Customer interaction (Yandex Direct) + 0.1 * ROPO (TV)

0.2 + 0.4 + 0.1 = 0.7 or 100% of effect that we can attribute to advertising

0.2 * 1st Customer interaction(Google Adwords) 0.2/0.7 = 0.29 * transaction revenue - attributed revenue for Google Adwords

0.4 * 2nd Customer interaction (Yandex Direct) 0.4/0.7 = 0.57 * transaction revenue - attributed revenue for Yandex Direct

0.1 * ROPO (TV) = 0.1/0.7 = 0.14* transaction revenue - attributed revenue for TV

Based on key CJMs:

А

80 of 103

Real time скоринг пользователей онлайн

Зачем нужен скоринг?

1. Персонализация на сайте (стимулирование конверсии)

  • Рекомендации товаров
  • Определение оптимальной скидки, цены
  • Реакция на попап, баннер, скач. приложения
  • Формат промо-оффера
  • Заказ по телефону

2. Эффективный таргетинг в рекламе (retention)

  • Ремаркетинг
  • E-mail
  • Push

«Скорить» можно все что угодно:

1. Вероятность покупки

2. Покупку в заданной категории

3. Телефонный звонок

4. Размер чека

5. Число товаров в корзине

6. Склонность к скидке

Покупатель категории Х, 85%

Я - Нуждаюсь в скидке Y, 78%

Отреагирую на попап, 98%

70%

95%

80%

91%

готов потратить 5000 р

89%

81 of 103

Подходы к real-time скорингу пользователей

Для раскрытия потенциала взаимодействия с каждым посетителем

Несколько основных подходов к построению модели:

Content-

based

Visit-

based

CRM/CDP-

based *

*Обогащение данных из CRM/CDP/DMP

“Тяжелые” модели

(1+ часов на обсчет)

Real-time модели (<10сек)

Просмотр контента

on-page аналитика во время визита

Обогащение известными данными

82 of 103

Воспроизводимые исследования

82

В рамках постоянного сопровождения компания получает доступ ко всей аналитической команде:

  • BI / web / app аналитики
  • дата инженеры и data scientists
  • эконометристы

которая в том числе помогает запускать и проводит самостоятельно:

в дополнение к реализации BI / ML задач.

83 of 103

#8 Товарная аналитика

Аналитические работы и дашборды

84 of 103

Товарная аналитика

85 of 103

KPI ассортимента

86 of 103

Товарная аналитика (себестоимость, остатки)

87 of 103

Товарная аналитика (ДРР, динамика)

88 of 103

Товарные отчеты (BCG)

89 of 103

90 of 103

#9 Товарная атрибуция

91 of 103

Оценка доп эффекта “Amazon Attribution”

Товары могут иметь как трафикогенерирующие (поиск на сайте), так и “паровозами” при формировании корзины. Первый эффект вычисляется через атрибуцию Amazon, второй - через Матрицу BCG (см в табличном виде).

Продажи “Same SKU vs Other SKU”

total

92 of 103

Кросс эффект: выделить типы влияния

93 of 103

Кросс эффект: посчитать пересечение и uplift

Все категории оцениваются как в собственной выручке, так и в их участии при продаже других. Анализ проводится с учетом размеченного поведения клиентов и пользователей на сайте/в приложении.

94 of 103

Кросс эффект: углубиться в Уровень 3

95 of 103

Как мы работаем

Подписка / КП “под ключ”

96 of 103

Реализация проекта

  1. бриф на BI / +НДА -> 2. КП (+доки) -> 3. роадмап

97 of 103

Пример таймлайна проекта

98 of 103

Сроки работ и варианты “подписки на команду”

с 1С - от 25 ч

с Mindbox - от 15 ч

с RetailCRM/OWOX - от 10ч

Сверка данных - от 7 ч

все цены / услуги

Простой: 25-30 ч. Товарная аналитика, базовые клиентские, CRM аналитика, воронка.

Средняя сложность: 30-40 ч. Сквозная аналитика, с ДРР и ROI РК, когортный анализ.

Высокая сложность - 40-50+ ч. LTV, CJM, клиентская аналитика, эффективность программы лояльности.

Интеграции:

Отчеты (2-4 дашборда/вкладок):

99 of 103

Подстраховка на отечественный стек

99

Mindbox

2 года

1C

GBQ

Я.облако

Clickhouse

Power BI

Datalens

Fine BI

..

=

=

основной BI стек

отчеты:

аналит. прог. лояльности

..

PostgreSQL|Greenplum

коннекторы CA

транз. фид

- тов. фид

клиен. фид

повед. фид.

web|app счетчики

коннекторы

РК кабинеты

запасной BI стек

нестндр. рк\ист

запасное

хранилище�(ежедневно)

+

gtm

ctm

matomo

js code

100 of 103

Типовой план проекта на BI “под ключ”

  1. Интервью с командой / заполнение брифа / ТЗ
  2. Подписание NDA
  3. Получаем доступ к данным, договора
  4. Интеграционные задачи
  5. Прототип проекта и промежуточный результат
  6. Структура отчетов, варианты метрик
  7. Рабочий прототип. Автоматизируем сбор данных
  8. Финальная версия. Кастомный дизайн
  9. Техническая поддержка решения

1-2 дня

2 недели

2 недели

2 недели

101 of 103

Корпоративное обучение

на собственных данных компании

102 of 103

Обучение на данных компании

Компания предоставляет формат корпоративного обучения по моделям: LTV, скоринг клиентов, MMO, ROPO

и BI/БД инструментам: Power BI, BigQuery, SQL

Первичный аудит:

  • Выделение нескольких отчетов, на которых будет производиться обучение сотрудников
  • Получение данных от компании либо предоставление доступа к данным для создания отчетов
  • Создание и согласование целевых отчетов в Power BI

Проведение обучения:

  • Обучение проводится онлайн в формате Zoom с записью эфиров и материалами для самостоятельной работы
  • Обучаемые в режиме on-line повторяют все действия за преподавателем
  • По завершении обучения проводится итоговая самостоятельная работа

103 of 103

103

Как запустить ваш проект?

Андрей Муратов

Управляющий партнер

amuratov@coffee-analytics.ru

tlgm: @muratov_com

стоимость услуг