1 of 58

FINAL PROJECT

by Arsenal Team

2 of 58

ALUR KERJA PROJECT

03

02

Modelling

Understand the dataset given

Get the insight from dataset

Preprocessing

01

3 of 58

Stage 1

Understand the dataset given

4 of 58

“Tidak ada bisnis yang dapat berkembang tanpa pelanggannya. Di sisi lain, pelanggan yang meninggalkan bisnis adalah mimpi buruk yang ditakuti oleh setiap pemilik bisnis. Faktanya, salah satu metrik kunci untuk mengukur kesuksesan bisnis adalah dengan mengukur tingkat churn pelanggannya - semakin rendah churn, semakin disukai perusahaan”

Problem Statement

5 of 58

Tingkat churn adalah metrik pemasaran yang menggambarkan jumlah pelanggan yang meninggalkan bisnis selama periode waktu tertentu. Setiap pengguna diberi nilai prediksi yang memperkirakan status churn mereka pada waktu tertentu

6 of 58

Data Description

Data Train memiliki 36992 baris and 25 kolom

Data test memiliki 19919 baris and 24 kolom

Train Data

Test Data

7 of 58

Column name Description

Merupakan nomor identifikasi unik pelanggan.

customer_id

Merupakan nama customer

Name

Merupakan umur customer

Age

Merupakan nomor security unik yang digunakan untuk mengidentifikasi seseorang

security_no

Mewakili wilayah tempat pelanggan berada.

region_category

Mewakili jenis langganan yang digunakan pelanggan

membership_ category

8 of 58

Column name Description

Merupakan tanggal ketika pelanggan menjadi anggota.

joining_date

Mewakili apakah pelanggan bergabung menggunakan kode referral atau ID

joined_through_referral

Mewakili referral ID

referral_id

Mewakili jenis penawaran yang disukai pelanggan

preferred_offer_types

Mewakili media operasi yang digunakan pelanggan untuk transaksi

medium_of_

operation

9 of 58

Column name Description

Mewakili jenis layanan internet yang digunakan pelanggan

internet_option

Menunjukkan terakhir kali pelanggan mengunjungi situs web

last_visit_time

Mewakili jumlah hari sejak pelanggan terakhir masuk ke situs web

days_since_last_login

Mewakili waktu rata-rata yang dihabiskan oleh pelanggan di situs web

avg_time_spent

Mewakili nilai transaksi rata-rata pelanggan

avg_transaction_value

10 of 58

Column name Description

Mewakili berapa kali pelanggan masuk ke situs web

avg_frequency_

login_days

Merupakan poin yang diberikan kepada pelanggan pada setiap transaksi

points_in_wallet

Mewakili apakah pelanggan lebih menyukai penawaran

offer_application_preference

Mewakili apakah pelanggan telah mengajukan keluhan

past_complaint

Mewakili feedback yang diberikan oleh pelanggan

feedback

Mewakili churn risk score dengan tingkatannya 1 sampai 5

churn_risk_score

11 of 58

In column churn_risk_score divide into 2 categories

churn_risk_score

-1

1, 2, 3, 4, 5

Artinya pelanggan tidak akan churn

Artinya pelanggan akan churn

Dengan jangkauan 1 sampai 5

12 of 58

Tips to reduce customer churn rate

  1. Memahami Penyebabnya

Daripada meraba-raba dan membuat penawaran yang menarik mereka atau bahkan pelanggan baru, cobalah selesaikan masalah utama terlebih dahulu

  • Bersikap Proaktif

Mintalah feedback pelanggan Anda, apa yang ingin Anda ubah untuk mendapatkan pengalaman yang lebih baik pada produk Anda.

  • Fokus terhadap Pelanggan Setia

Memfokuskan energi, biaya, dan waktu pada pelanggan setia yang terbukti!!

Source: glints.com

13 of 58

Stage 2

Get the insight from dataset

14 of 58

96,86%

Merupakan customer yang bersifat churn

15 of 58

sedangkan 3,14% sisanya merupakan yang tidak churn. Adanya ketidakseimbangan dalam persebaran data churn dan yang tidak churn sehingga jika dibuat model terjadi overfitting

16 of 58

Jumlah antar Tingkat Churn

Berdasarkan barplot tersebut bisa kita lihat bahwa tingkat 3, 4, dan 5 yang paling banyak proporsinya. Tingkat 3 yang paling banyak jumlahnya dengan 10424 customer.

17 of 58

Jumlah antar Jenis Feedback

Berdasarkan barplot tersebut jenis feedback yang paling banyak intensitasnya ada 5 yaitu, Poor Product Quality, No reason specified, Too many ads, Poor website, Poor CS. Poor Product Quality yang memiliki jumlah paling banyak di jenis feedback ini dengan jumlah 6350 customer

18 of 58

Jumlah antar Jenis Komplain

Berdasarkan barplot tersebut jenis komplain yang paling banyak intensitasnya yaitu Not Applicable dengan jumlah customer sebanyak 18602.

19 of 58

Jumlah antar Jenis Membership

Berdasarkan barplot tersebut jenis membership yang paling banyak intensitasnya yaitu Basic Membership dengan jumlah customer sebanyak 7724.

20 of 58

Jumlah antar Jenis Kelamin

Berdasarkan barplot tersebut jenis kelamin memiliki jumlah kurang lebih sama. Jumlah customer perempuan sebanyak 18490 dan jumlah customer laki-laki sebanyak 18443.

21 of 58

Jumlah antar Wilayah

Berdasarkan barplot tersebut wilayah yang memiliki persentase yang akan churn di wilayah Town dan yang paling sedikit di wilayah Village

22 of 58

Hubungan antara jenis feedback

dengan churn risk score

23 of 58

Jenis feedback yang paling banyak intensitasnya ada 5 yaitu, Poor Product Quality, No reason specified, Too many ads, Poor website, Poor CS. Berdasarkan barplot tersebut kelima jenis feedback tersebut memiliki churn risk score yang tinggi pula antara 3 sampai 5.

24 of 58

Hubungan antara jenis komplain

dengan churn risk score

25 of 58

Berdasarkan barplot tersebut, semua tingkatan churn risk score -1 sampai 5 ada di semua jenis komplain

26 of 58

Hubungan antara jenis membership

dengan churn risk score

27 of 58

Berdasarkan barplot tersebut, basic membership dan no membership yang memiliki kemungkinan terbesar akan churn dikarenakan churn risk score bernilai 5 sangat banyak di kedua jenis membership ini

28 of 58

Hubungan antara jenis Wilayah

dengan churn risk score

29 of 58

Berdasarkan barplot tersebut, hampir semua persentase distribusi atau proporsi data di setiap tingkatan churn merata di setiap wilayahnya

30 of 58

Hubungan antara jenis Komplain

dengan jenis membership

31 of 58

Berdasarkan barplot tersebut, yang paling menjadi perhatian utama adalah gold membership memiliki lebih banyak memiliki komplain di jenis not applicable daripada silver membership

32 of 58

Hubungan antara jenis feedback

dengan jenis membership

33 of 58

Berdasarkan barplot tersebut, basic membership dan no membership yang memiliki frekuensi yang cukup banyak di kelima jenis feedback yang sudah dibahas sebelumnya

34 of 58

Hubungan antara jenis Wilayah

dengan jenis membership

35 of 58

Berdasarkan barplot tersebut, distribusi jenis membership bisa dikatakan sama disetiap wilayah, yaitu di village, town, dan city

36 of 58

Stage 3

Preprocessing dataset

37 of 58

Melihat Anomali

Days since login

Avg time spent

Avg freg days login

Point in wallet

38 of 58

Melihat Nilai Negatif

Before

39 of 58

Melihat Nilai Negatif

After

40 of 58

Melihat Missing Value

41 of 58

Melihat Missing Value

42 of 58

Melihat Missing Value

43 of 58

Label Encouder

Before

44 of 58

Label Encouder

After

45 of 58

Hapus kolom yang tidak relevan

Customer_ID

Security_No

Name

Reffreal_id

Joining_date

Last_visit_time

46 of 58

Standarisasi

Before

47 of 58

Standarisasi

After

48 of 58

Stage 4

Modeling

Machine Learning

49 of 58

Model yang Dipilih

Random Forest

Decision Tree

VS

50 of 58

Random Forest

Decision

Tree

Akurasi sebelum Grid Search

78,86%

76,71%

51 of 58

Random Forest

Decision Tree

Akurasi setelah Grid Search

78,28%

78,46%

77,86%

76,71%

+0,54%

+2,29%

52 of 58

Random Forest

Decision Tree

Feature Importance

53 of 58

Random Forest

Decision Tree

Akurasi setelah Feature Importance

78,40%

78,58%

78,28%

78,46%

+0,15%

+0,12%

54 of 58

Random Forest

Decision Tree

Confusion Matrix

55 of 58

Prediksi dengan Data Test

56 of 58

DECISION TREE

Sebagai model yang lebih baik daripada Random Forest pada dataset tersebut dengan akurasi terbaik sebesar 78,56%

57 of 58

Our Team

He can even doing final project by himself! I have to re-read what he had written in the notebook

Wiranto Widotomo

“Guys, end-of-year is coming! Brace yourself *brb ambil snack dan beli kopi*

Riana Prameswari

It is good to know you, Mas Dede. See you in another great story learning uler piton.

Dede Rukmana

58 of 58