GERMAN
CREDIT RISK
Here is where your presentation begins
ALUR KERJA PROJECT
03
02
Modelling
Understand the dataset given
Get the insight from dataset
Preprocessing
01
Stage 1
Understand the dataset given
Credit scoring merupakan sistem atau cara yang dipakai oleh suatu lembaga pembiayaan/bank di dalam menentukan layak tidaknya untuk menerima pinjaman dari lembaga tersebut berdasarkan history transaksi calon nasabah.
Problem Statement
ALUR KERJA PROJECT
03
02
Modelling
Understand the dataset given
Get the insight from dataset
Preprocessing
01
Stage 1
Understand the dataset given
Credit scoring atau penilaian kredit merupakan sistem atau cara yang dipakai oleh suatu lembaga pembiayaan/bank di dalam menentukan layak tidaknya untuk menerima pinjaman dari lembaga tersebut.
Problem Statement
Data Description
Baris
Kolom
1000
10
Column name Description
Merupakan umur customer
Age
Merupakan Jenis kelamin customer
Sex
Merupakan tingkatan kemampuan customer
Job
Merupakan kelas kepemilikan rumah customer
Housing
Merupakan kelas tabungan customer
Saving accounts
Column name Description
Merupakan kelas rekening giro customer
Checking accounts
Merupakan jumlah kredit customer
Credit amount
Merupakan durasi kredit customer
Duration
Merupakan tujuan customer melakukan kredit
Purpose
Merupakan jenis risiko kredit customer
Risk
Dataset
Kolom dataset yang berjenis data kategorik
Kategori Nominal
Sex, Purpose
Job, Housing, Saving accounts, Checking accounts, Risk
Kategori Ordinal
Di kolom ‘Risk’ dibagi menjadi dua kategori
Risk
Good
Bad
Artinya customer layak diberikan kredit
Artinya customer tidak layak diberikan kredit
Stage 2
Get the insight from dataset
70%
Merupakan customer yang layak diberikan kredit
Perbandingan Jumlah Risk
Berdasarkan barplot tersebut bisa kita lihat bahwa customer yang layak diberikan kredit lebih banyak daripada yang tidak layak, sebanyak 700 customer.
Jumlah antar Jenis Kelamin
Berdasarkan barplot tersebut bahwa Laki-laki yang sering melakukan pengajuan kredit dibandingkan wanita.
Persentase terhadap ‘bad’ pada pria lebih rendah dibandingkan wanita
Jumlah antar Jenis Rumah
Berdasarkan barplot tersebut bahwa orang yang memiliki rumah sendiri kemungkinan gagal bayar kredit itu kecil.
Jumlah antar Jenis Tabungan
Berdasarkan barplot tersebut bahwa orang yang memiliki tabungan yang sedikit memiliki rating yang bagus.
Jumlah antar Jenis Rekening
Berdasarkan barplot tersebut bahwa yang memiliki rekening yang rendah hampir setengahnya memiliki rating yang buruk
Jumlah antar Jenis Tujuan
Berdasarkan barplot tersebut bahwa tujuan customer untuk mengajukan kredit adalah untuk membeli mobil
Credit Amount & Duration
Berdasarkan kdeplot tersebut, persebaran tertinggi pada duration antara angka 15 - 25, sedangkan persebaran tertinggi pada credit amount di kisaran angka 1000 - 3000.
Jumlah kredit yang lebih tinggi dan durasi yang lebih lama berarti risiko yang lebih tinggi bagi bank
Stage 3
Preprocessing dataset
Melihat Missing Value
Label Encouder
Before
After
Standarisasi
Before
After
Stage 4
Modeling
Machine Learning
Model Yang Dipilih
KNN
Decision Tree
Random Forest
SVM
Naive Bayes
Akurasi Model
KESIMPULAN
Model terbaik untuk memprediksi status kelayakan customer dalam mengajukan kredit adalah KNN dengan akurasi sebesar 84%