Modely pro predikci �Customer Lifetime Value
Datarestart, 7. 4. 2017
@paveljasek
Tým z &
Lucie Šperková
Lenka �Vraná
Pavel
Jašek
Marek
Kobulský
Zdeněk
Smutný
Minulost
Současnost
Budoucnost
Zákazník 1
Zákazník 2
Zákazník 3
“ Customer Lifetime Value (CLV, dlouhodobá hodnota zákazníků) �je čistá současná hodnota budoucích zisků navázaných na konkrétního zákazníka “
Fáze učení
Minulost
Současnost
Budoucnost
Zákazník 3
Na jak dlouho dopředu? 52 týdnů?
Co je výstupem CLV pro dataře
Podmínky a omezení CLV modelů
Specifika při modelování B2C e-commerce
Nekontrakční prostředí
Bez zavazujících věrnostních programů
Dávno ztracený zákazník může opět nakoupit
Nakupovat lze kdykoliv
Velmi různorodá útrata [i marže]
Nedokonalé možnosti identifikace zákazníka
Confidential & Proprietary
Přístupy k modelování CLV
Různé přístupy k modelování CLV
na individuální úrovni i pro celou bázi
Naivní model
Protahování průměrných profitů
Pareto/NBD
Životaschopnost zákazníka a výše útraty
Vector Autoregressive Model
Časová řada profitů
Markov chain model with decision tree learning
+ více různých dat, která by měla pomoci s určením hodnoty zákazníka
#sq
Status Quo
Individuální úroveň, dle dat o transakcích
Protahujeme průměrný profit za poslední rok
Zákazník bez objednávky za jeden rok je ☠️
Confidential + Proprietary
#ep/nbd
Extended Pareto/NBD
Individuální úroveň, dle dat o transakcích
RF není závislé s M
p|alive, spend model
Balíček v R: BTYD
Confidential + Proprietary
#var
Vector Autoregressive Model
Časové řady celé zákaznické báze
Interakce mezi Paid / Owned / Earned marketingovými kanály přes impulzivní funkci
Confidential + Proprietary
#mcm
Markov chain model with decision tree learning
Individuální úroveň, více dat
Rozhodovací strom rozdělí objednávky do podobných skupin
Markovovy řetězce řeší přechody mezi hodnotovými skupinami
Confidential + Proprietary
Srovnávání modelů
Confidential + Proprietary
Confidential + Proprietary
Empirické srovnání na velkých souborech dat
z aktuálně připravovaného článku
Ukázka datasetů
MAE: Mean Absolute Error [in the percentage of average CLV]
SQ: 93%, EP/NBD: 114%, MC: 190%
Nemá smysl srovnávat pro VAR
FA: Forecast vs. Actual
EP/NBD: 93 %, SQ: 138%
MAPE: Mean Absolute Percentage Error [Weekly]
EP/NBD: 21 %, SQ: 64 %
Sensitivity: True positive rate of scoring the top 10%
EP/NBD: 43 %, SQ: 41 %, MC: 13 %
Nemá smysl srovnávat pro VAR
Rozhodování o modelech
#sq #ep/nbd #var #mcm
Rekapitulace využití CLV z Datarestartu 2016
Import hodnoty do AdWords + automatické bidování dle CLV
CLV segmenty v Google Analytics + remarketingové seznamy do AdWords
Skóring zákazníků pro e-mailing, SMS, bonusy, soutěže
Manažerské reportování CRM
Způsoby využití CLV
Individuální zákazníci
Celá zákazníká báze
Individuální zákazníci
Aktuální přesná hodnota: 123,45 Kč
Trend přesných hodnot: 107 Kč → 123 Kč
Segment: Vysoké CLV (3000+ Kč)
tl;dr
noca.cz/CLVrestart
Confidential + Proprietary
jasek@google.com
@paveljasek
Confidential & Proprietary