1 of 31

GERMAN

CREDIT RISK

Here is where your presentation begins

2 of 31

ALUR KERJA PROJECT

03

02

Modelling

Understand the dataset given

Get the insight from dataset

Preprocessing

01

3 of 31

Stage 1

Understand the dataset given

4 of 31

Credit scoring merupakan sistem atau cara yang dipakai oleh suatu lembaga pembiayaan/bank di dalam menentukan layak tidaknya untuk menerima pinjaman dari lembaga tersebut berdasarkan history transaksi calon nasabah.

Problem Statement

5 of 31

ALUR KERJA PROJECT

03

02

Modelling

Understand the dataset given

Get the insight from dataset

Preprocessing

01

6 of 31

Stage 1

Understand the dataset given

7 of 31

Credit scoring atau penilaian kredit merupakan sistem atau cara yang dipakai oleh suatu lembaga pembiayaan/bank di dalam menentukan layak tidaknya untuk menerima pinjaman dari lembaga tersebut.

Problem Statement

8 of 31

Data Description

Baris

Kolom

1000

10

9 of 31

Column name Description

Merupakan umur customer

Age

Merupakan Jenis kelamin customer

Sex

Merupakan tingkatan kemampuan customer

Job

Merupakan kelas kepemilikan rumah customer

Housing

Merupakan kelas tabungan customer

Saving accounts

10 of 31

Column name Description

Merupakan kelas rekening giro customer

Checking accounts

Merupakan jumlah kredit customer

Credit amount

Merupakan durasi kredit customer

Duration

Merupakan tujuan customer melakukan kredit

Purpose

Merupakan jenis risiko kredit customer

Risk

11 of 31

Dataset

Kolom dataset yang berjenis data kategorik

Kategori Nominal

Sex, Purpose

Job, Housing, Saving accounts, Checking accounts, Risk

Kategori Ordinal

12 of 31

Di kolom ‘Risk’ dibagi menjadi dua kategori

Risk

Good

Bad

Artinya customer layak diberikan kredit

Artinya customer tidak layak diberikan kredit

13 of 31

Stage 2

Get the insight from dataset

14 of 31

70%

Merupakan customer yang layak diberikan kredit

15 of 31

Perbandingan Jumlah Risk

Berdasarkan barplot tersebut bisa kita lihat bahwa customer yang layak diberikan kredit lebih banyak daripada yang tidak layak, sebanyak 700 customer.

16 of 31

Jumlah antar Jenis Kelamin

Berdasarkan barplot tersebut bahwa Laki-laki yang sering melakukan pengajuan kredit dibandingkan wanita.

Persentase terhadap ‘bad’ pada pria lebih rendah dibandingkan wanita

17 of 31

Jumlah antar Jenis Rumah

Berdasarkan barplot tersebut bahwa orang yang memiliki rumah sendiri kemungkinan gagal bayar kredit itu kecil.

18 of 31

Jumlah antar Jenis Tabungan

Berdasarkan barplot tersebut bahwa orang yang memiliki tabungan yang sedikit memiliki rating yang bagus.

19 of 31

Jumlah antar Jenis Rekening

Berdasarkan barplot tersebut bahwa yang memiliki rekening yang rendah hampir setengahnya memiliki rating yang buruk

20 of 31

Jumlah antar Jenis Tujuan

Berdasarkan barplot tersebut bahwa tujuan customer untuk mengajukan kredit adalah untuk membeli mobil

21 of 31

Credit Amount & Duration

22 of 31

Berdasarkan kdeplot tersebut, persebaran tertinggi pada duration antara angka 15 - 25, sedangkan persebaran tertinggi pada credit amount di kisaran angka 1000 - 3000.

Jumlah kredit yang lebih tinggi dan durasi yang lebih lama berarti risiko yang lebih tinggi bagi bank

23 of 31

Stage 3

Preprocessing dataset

24 of 31

Melihat Missing Value

25 of 31

Label Encouder

Before

After

26 of 31

Standarisasi

Before

After

27 of 31

Stage 4

Modeling

Machine Learning

28 of 31

Model Yang Dipilih

KNN

Decision Tree

Random Forest

SVM

Naive Bayes

29 of 31

Akurasi Model

30 of 31

KESIMPULAN

Model terbaik untuk memprediksi status kelayakan customer dalam mengajukan kredit adalah KNN dengan akurasi sebesar 84%

31 of 31