1 of 28

Modely pro predikci �Customer Lifetime Value

Datarestart, 7. 4. 2017

@paveljasek

2 of 28

Tým z &

Lucie Šperková

Lenka �Vraná

Pavel

Jašek

Marek

Kobulský

Zdeněk

Smutný

3 of 28

Minulost

Současnost

Budoucnost

Zákazník 1

Zákazník 2

Zákazník 3

4 of 28

Customer Lifetime Value (CLV, dlouhodobá hodnota zákazníků)je čistá současná hodnota budoucích zisků navázaných na konkrétního zákazníka

Fáze učení

Minulost

Současnost

Budoucnost

Zákazník 3

Na jak dlouho dopředu? 52 týdnů?

5 of 28

Co je výstupem CLV pro dataře

6 of 28

7 of 28

Podmínky a omezení CLV modelů

8 of 28

Specifika při modelování B2C e-commerce

Nekontrakční prostředí

Bez zavazujících věrnostních programů

Dávno ztracený zákazník může opět nakoupit

Nakupovat lze kdykoliv

Velmi různorodá útrata [i marže]

Nedokonalé možnosti identifikace zákazníka

Confidential & Proprietary

9 of 28

Přístupy k modelování CLV

10 of 28

Různé přístupy k modelování CLV

na individuální úrovni i pro celou bázi

Naivní model

Protahování průměrných profitů

Pareto/NBD

Životaschopnost zákazníka a výše útraty

Vector Autoregressive Model

Časová řada profitů

Markov chain model with decision tree learning

+ více různých dat, která by měla pomoci s určením hodnoty zákazníka

11 of 28

#sq

Status Quo

Individuální úroveň, dle dat o transakcích

Protahujeme průměrný profit za poslední rok

Zákazník bez objednávky za jeden rok je ☠️

Confidential + Proprietary

12 of 28

#ep/nbd

Extended Pareto/NBD

Individuální úroveň, dle dat o transakcích

RF není závislé s M

p|alive, spend model

Balíček v R: BTYD

Confidential + Proprietary

13 of 28

#var

Vector Autoregressive Model

Časové řady celé zákaznické báze

Interakce mezi Paid / Owned / Earned marketingovými kanály přes impulzivní funkci

Confidential + Proprietary

14 of 28

#mcm

Markov chain model with decision tree learning

Individuální úroveň, více dat

Rozhodovací strom rozdělí objednávky do podobných skupin

Markovovy řetězce řeší přechody mezi hodnotovými skupinami

Confidential + Proprietary

15 of 28

Srovnávání modelů

Confidential + Proprietary

Confidential + Proprietary

16 of 28

Empirické srovnání na velkých souborech dat

z aktuálně připravovaného článku

17 of 28

Ukázka datasetů

18 of 28

19 of 28

MAE: Mean Absolute Error [in the percentage of average CLV]

SQ: 93%, EP/NBD: 114%, MC: 190%

Nemá smysl srovnávat pro VAR

20 of 28

FA: Forecast vs. Actual

EP/NBD: 93 %, SQ: 138%

21 of 28

MAPE: Mean Absolute Percentage Error [Weekly]

EP/NBD: 21 %, SQ: 64 %

22 of 28

Sensitivity: True positive rate of scoring the top 10%

EP/NBD: 43 %, SQ: 41 %, MC: 13 %

Nemá smysl srovnávat pro VAR

23 of 28

Rozhodování o modelech

#sq #ep/nbd #var #mcm

24 of 28

Rekapitulace využití CLV z Datarestartu 2016

Prezentace z 2016

  • Zákaznická Akvizice / Aktivace / Podpora / Retence

Import hodnoty do AdWords + automatické bidování dle CLV

CLV segmenty v Google Analytics + remarketingové seznamy do AdWords

  • Direct marketing

Skóring zákazníků pro e-mailing, SMS, bonusy, soutěže

  • Customer Intelligence

Manažerské reportování CRM

25 of 28

Způsoby využití CLV

Individuální zákazníci

Celá zákazníká báze

26 of 28

Individuální zákazníci

Aktuální přesná hodnota: 123,45 Kč

Trend přesných hodnot: 107 Kč → 123 Kč

Segment: Vysoké CLV (3000+ Kč)

27 of 28

tl;dr

noca.cz/CLVrestart

  • Pro e-shopy dává smysl používat Pareto/NBD k modelování CLV
  • Nečekejte zázraky od netransakčních proměnných
  • Uveďte CLV v život: v digitálním marketingu přes segmenty

Confidential + Proprietary

28 of 28

jasek@google.com

@paveljasek

Confidential & Proprietary