1 of 13

TUGAS KELOMPOK

DATA SCIENCE FUNDAMENTAL

FORECASTING

Kelompok 2

2 of 13

Business Understanding

3 of 13

  • Investor ABC bermaksud menginvestasikan modal yang dimilikinya pada instrumen saham perusahaan X.

  • Investor ABC melakukan penelitian data mining - forecasting untuk mendapatkan prediksi pergerakan harga saham di masa depan.

  • Dari model algoritma yang diperoleh, Investor ABC dapat membuat keputusan sehingga investasi tersebut mampu memberikan profit yang konsisten.

4 of 13

Data Understanding

  • Penelitian ini menggunakan dua dataset yang berasal dari Dataset Studi Kasus - LMS Data Science Fundamentals, yaitu “hargasaham-training.xls” dan “hargasaham-testing.xls”.

  • Dataset merupakan data harga saham emiten X periode 11 April 2006 s.d. 18 Maret 2010 dengan tipe data numerik dan memiliki 6 (enam) Parameter/Atribut:
  1. “Date” → berperan sebagai “id”
  2. “Open”
  3. “High”
  4. “Low”
  5. “Close” → berperan sebagai “Label”
  6. “Volume”

5 of 13

Data Preparation

6 of 13

Data Preparation

Memeriksa data sebelum melakukan modelling dengan cara:

  • Import dataset: hargasaham-training.xls → mengecek apakah ada data missing & noisy → mengubah role atribut “Close” menjadi “label”
  • Import dataset: hargasaham-testing.xls → mengecek apakah ada data missing & noisy → mengubah role atribut “Close” menjadi “label”

7 of 13

8 of 13

Modelling

9 of 13

Modelling

Model regresi linier adalah suatu model yang menyatakan hubungan antara variabel independen dan variabel dependent yang dinyatakan dalam garis lurus (linier). Bentuk persamaan matematika untuk model regresi linier adalah

Untuk membuat peramalan di waktu tertentu, dapat diselesaikan model di atas dengan menemukan nilai beta sebagai koefisen dari variabel independen. Adapun alat bantu dalam proses pengolahan data mining yaitu Rapidminer Studio Educational 9.10.001, bertujuan agar dapat mencari nilai beta dan prediksi lebih cepat dan efisien.

10 of 13

Evaluation

11 of 13

RMSE Linear Regression : 5,766

12 of 13

RMSE Linear Regression : 5,766

RMSE Support Vector Machine : 5,823

RMSE Neural Network : 5,253

13 of 13

Deployment

Berdasarkan model regresi linier yang digunakan, model yang terbentuk adalah:

close = 16.961 +0.990 High - 0.00 Volume

MRSE = 5.766

Bila melihat sekilas, model ini sudah cukup baik karena nilai yang dihasilkan pada data training dan data testing tidak terlalu jauh.

Namun, bila membandingkan dengan metode lain seperti Neural Network dan Support Vectore Machine, nilai MRSE pada neural network lebih kecil.

Sehingga, pemanfaatan neural network untuk prediksi harga saham ini akan menghasilkan nilai prediksi yang lebih akurat.