1 of 33

Statistika

  • Statistika adalah metode pengolahan data yang didapat dari suatu operasi yang dilakukan secara berulang-ulang.
  • Operasi dilakukan melalui
    • observasi
    • pengukuran
    • eksperimen

2 of 33

Statistika

3

  • Data
    • Angka
    • Numerik
  • Contoh
    • Nilai ujian anda 50, maka anda dinyatakan tidak lulus ujian.
    • Tingkat hunian kamar hotel turun hingga 40%.
    • Kebocoran anggaran di 80% kabupaten mencapai tingkat yang mengkhawatirkan, tingkat kebocoran rata-rata 35%, tertinggi 55%, dan terendah 15%.

3 of 33

Statistika

  • Data
    • Data kualitatif
    • Data kuantitatif: fakta yang dinyatakan dalam bentuk angka

4 of 33

Statistika

  • Pemakaian statistika
    • Descriptive statistics
    • Statistical inference

5 of 33

Descriptive Statistics Statistical Inference

6

  • Contoh
    • Hasil wawancara terhadap responden yang dipilih secara acak dari sebuah wilayah, menunjukkan bahwa 15% responden merupakan pelanggan PDAM.
    • Kemudian dilakukan kampanye pemakaian air PDAM kepada penduduk wilayah tersebut.
    • Hasil wawancara terhadap responden yang dilakukan beberapa waktu setelah kampanye tersebut menunjukkan bahwa 21% responden merupakan pelanggan PDAM.

6 of 33

Descriptive Statistics Statistical Inference

7

  • Pertanyaan
    • Apakah kita benar dalam menganggap bahwa kenaikan jumlah pelanggan dari 15% pada kelompok responden pertama menjadi 21% pada kelompok responden kedua adalah akibat kampanye pemakaian air PDAM?
    • Apabila kita meragukan bahwa kampanye tersebut telah meningkatkan jumlah pelanggan, bagaimanakah dengan data hasil wawancara tersebut?
    • Bagaimana dengan data dari penduduk yang tidak diwawancarai?

7 of 33

Descriptive Statistics Statistical Inference

8

  • Descriptive statistics
    • Angka 15% dipakai untuk menunjukkan bagian dari penduduk pada responden pertama yang memakai air PDAM.
    • Dalam hal ini, angka 15% tersebut merangkum dengan ringkas, padat, dan jelas fakta yang tak diperlihatkan bahwa dari 140 responden, 21 adalah pemakai air PDAM.
    • Dengan demikian, dapat dikatakan bahwa
      • descriptive statistics adalah pemakaian angka untuk merangkum informasi yang diketahui mengenai suatu keadaan.

8 of 33

Descriptive Statistics Statistical Inference

9

  • Statistical inference

Apabila kita memakai hasil wawancara tadi untuk mengatakan bahwa sekitar 15% penduduk wilayah tersebut adalah pemakai air PDAM, maka

kita memakai angka untuk menyimpulkan suatu hal mengenai populasi, yang lebih besar daripada responden (sampel), yang kita sendiri tidak memiliki informasi yang lengkap tentang populasi tersebut.

Dengan demikian dapat dikatakan bahwa

statistical inference adalah pemakaian angka untuk mengatakan suatu informasi mengenai populasi, yang pada umumnya lebih besar daripada sampel darimana data diperoleh.

9 of 33

Pemakaian Statistika

10

  • Contoh
    • Sebutkan beberapa contoh pemakaian statistika yang Saudara kenal.
    • Diskusikan
      • descriptive statistics,
      • statistical inference.

10 of 33

Pemakaian Statistika

11

  • Contoh
    • Misal dijumpai suatu penyakit yang ¾ penderitanya sembuh dalam 3 bulan tanpa pengobatan.
    • Kemudian seorang dokter menyatakan bahwa dia telah menemukan obat penyembuh penyakit tersebut.
    • Obat tersebut diberikan kepada 100 penderita.
    • Kalaupun obat tersebut tak berfungsi, kita tetap dapat memperkirakan bahwa 75 penderita akan sembuh.

11 of 33

Pemakaian Statistika

12

  • Contoh penyakit vs obat
    • Salah satu permasalahan dalam inferensi statistis dalam contoh di atas adalah:
      • berapa jumlah penderita yang harus sembuh sebelum kita menerima bahwa obat penemuan dokter tersebut benar-benar menyembuhkan penyakit tersebut?
    • Tentu saja, apabila ke-100 penderita tersebut sembuh, maka kita akan dengan sangat antusias menerima bahwa obat tersebut benar-benar menyembuhkan.
    • Namun, apabila jumlah penderita yang sembuh adalah 95, atau 90, atau 85, apakah kita bisa menerima klaim tersebut?

12 of 33

Pemakaian Statistika

13

  • Jadi?
    • Tugas memutuskan atau menjawab pertanyaan tersebut merupakan satu hal penting bagi seorang statistikawan.
  • Diskusi
    • Dapatkah kita mengatakan dengan yakin bahwa obat tersebut benar-benar manjur?
    • Bahkan andaikata ke-100 penderita tersebut sembuh, masih ada kemungkinan (walaupun kecil) bahwa ke-100 penderita tersebut memang sembuh dengan sendirinya, tanpa ada kontribusi dari obat.
      • Ada kemungkinan bahwa ke-100 penderita memang memiliki kekebalan terhadap penyakit tersebut.

13 of 33

Pemakaian Statistika

  • Peringatan
    • Adalah penting untuk diperhatikan dalam pengambilan sampel (penderita, dalam hal ini):
      • bahwa sampel dipilih/ditetapkan tanpa bias,
      • bahwa sampel benar-benar mencerminkan situasi dari populasi yang kita ingin ketahui perilakunya (dalam hal ini: para penderita penyakit tersebut).

14

14 of 33

Terminologi

15

data mentah (raw score)

nilai aset

distribusi, sebaran

kumpulan nilai aset

data

nilai aset, usia aset, tingkat depresiasi

populasi

kumpulan semua orang, obyek, score, pengukuran

sampel

bagian dari populasi

acak, random

setiap item memiliki kemungkinan sama untuk terambil kedalam sampel

sampel acak

sampel yang setiap itemnya diambil secara acak

15 of 33

Sampel Acak

16

  • Istilah ACAK dipakai untuk menunjukkan proses pengambilan sampel
  • Hal ini tidak berarti bahwa sampel yang dihasilkannya dijamin representatif dari populasi asal/sumber sampel tersebut

16 of 33

Pengorganisasian dan Penyajian Data

2

  • Koleksi data statistika perlu disusun (diorganisir) dan disajikan (divisualisasikan) sedemikian hingga dapat “dibaca” dengan jelas dan mudah
  • Salah satu pengorganisasian data dan penyajian data statistika adalah dengan:
    • tabel
    • grafik
  • Sifat data
    • kuantitatif: data dapat dinyatakan dengan angka
    • kualitatif

17 of 33

Pengorganisasian dan Penyajian Data

3

  • Tabel
    • Di dalam tabel, setiap raw score sejenis dikelompokkan.
    • Pengelompokkan tsb kemudian dirangkum ke dalam suatu tabel yang ringkas.
  • Grafik
    • Penyajian data secara grafis untuk menunjukkan pola dan trend

18 of 33

Pengorganisasian dan Penyajian Data

4

  • Contoh
    • Nilai ujian mata kuliah Statistika dan Probabilitas yang diperoleh mahasiswa
      • jumlah mahasiswa 15 orang
      • nilai ujian A, B, C, D, E
    • Tabel dan grafik
      • nilai per mahasiswa
      • frekuensi kejadian per nilai ujian

19 of 33

Contoh Data Nilai Ujian

5

No.

Nama Mahasiswa

Nilai

1

Anabel

E

2

Barbado

C

3

Cironde

C

13

Maxim

D

14

Nopol

B

15

Ozone

A

  • Data pada tabel di samping ini data kuantitatif atau kualitatif?

20 of 33

Contoh Data Nilai Ujian

Nilai

Jumlah mahasiswa

A

5

B

4

C

3

D

1

E

2

Jumlah

15

A

B

C

D

E

Jumlah mahasiswa

Distribusi Nilai Ujian

6

5

4

3

2

1

0

6

21 of 33

Contoh Data Nilai Ujian

7

Kuantifikasi data kualitatif dilakukan dengan cara memberikan nilai atau “score” kepada setiap kelompok data (dalam hal ini nilai ujian):

A=4, B=3, C=2, D=1, E=0.

0

1

2

3

4

Score nilai ujian

Nilai Ujian Statistika dan Probabilitas

22 of 33

Contoh Data Nilai Ujian

8

Data kualitatif dapat pula disajikan dalam bentuk grafik tanpa melakukan kuantifikasi data dulu. Ini memerlukan trik dalam memplotkan data pada perintah/ langkah pembuatan grafik pada MSExcel.

Nilai Ujian Statistika dan Probabilitas

A

B

C

D

E

23 of 33

Contoh Data Nilai Ujian

9

  • Tabel dan grafik untuk penyajian data
    • Jelas, mudah dibaca, tidak menimbulkan salah baca
    • Efisien, hanya menyajikan data atau informasi yang diperlukan
    • Tampilan tidak berlebihan (tidak perlu warna-warni)
    • Ukuran proporsional (grafik, judul, font)
    • Duplikasi informasi (judul, legenda, sumbu) dihindari

24 of 33

Pengorganisasian dan Penyajian Data

10

  • Contoh
    • Seseorang mencatat keterlambatan kedatangan bus setiap jadwal kedatangan di suatu tempat.
    • Angka keterlambatan dibulatkan ke dalam satuan menit.
    • Data keterlambatan selama 30 jadwal kedatangan terakhir dicatat dalam suatu tabel.
      • Tabel raw scores
      • Tabel frekuensi

25 of 33

Catatan Keterlambatan Kedatangan Bus di Suatu Perhentian Selama 30 Jadwal Kedatangan Terakhir

11

Kedatangan ke-

1

2

3

4

5

6

7

8

9

10

Keterlambatan (menit)

9

7

3

4

2

5

3

7

2

6

Kedatangan ke-

11

12

13

14

15

16

17

18

19

20

Keterlambatan (menit)

5

3

10

1

10

3

3

2

5

1

Kedatangan ke-

21

22

23

24

25

26

27

28

29

30

Keterlambatan (menit)

4

6

4

3

5

6

3

5

3

4

26 of 33

Scatter Plot

12

Scatter plot dipakai untuk menunjukkan atau memberikan informasi mengenai pola sebaran data.

12

10

8

6

4

2

0

0

5

10

20

25

30

Keterlambatan (menit)

15

Jadwal kedatangan ke-

Keterlambatan Kedatangan Bus di Suatu Perhentian Selama 30 Jadwal Kedatangan Terakhir

27 of 33

Tabel Frekuensi

Keterlambatan (menit)

Frekuensi

1

2

2

3

3

8

4

4

5

5

6

3

7

2

8

0

9

1

10

2

Jumlah =

30

Keterlambatan (menit)

Frekuensi

10

2

9

1

8

0

7

2

6

3

5

5

4

4

3

8

2

3

1

2

Jumlah =

30

13

28 of 33

Bar Chart

14

2

3

8

4

5

3

2

0

1

2

10

8

6

4

2

0

1

2

3

4

7

8

9

10

Frekuensi

5 6

Keterlambatan (menit)

Keterlambatan Kedatangan Bus di Suatu Perhentian Selama 30 Jadwal Kedatangan Terakhir

29 of 33

Histogram

15

2

3

8

4

5

3

2

0

1

2

10

8

6

4

2

0

1

2

3

4

7

8

9

10

Frekuensi

5 6

Keterlambatan (menit)

Keterlambatan Kedatangan Bus di Suatu Perhentian Selama 30 Jadwal Kedatangan Terakhir

30 of 33

Histogram

16

1

2

3

4

7

8

9

10

Frekuensi

5 6

Keterlambatan (menit)

Keterlambatan Kedatangan Bus di Suatu Perhentian Selama 30 Jadwal Kedatangan Terakhir

10

8

6

4

2

0

31 of 33

Tabel Frekuensi

17

Keterlambatan (menit)

Frekuensi

Frekuensi relatif

Persentase

1

2

0.07

7%

2

3

0.10

10%

3

8

0.27

27%

4

4

0.13

13%

5

5

0.17

17%

6

3

0.10

10%

7

2

0.07

7%

8

0

0.00

0%

9

1

0.03

3%

10

2

0.07

7%

Jumlah =

30

1

100%

32 of 33

Histogram

Keterlambatan Kedatangan Bus di Suatu Perhentian Selama 30 Jadwal Kedatangan Terakhir

0.3

0.25

0.2

0.15

0.1

0.05

0

18

1

2

3

4

7

8

9

10

Frekuensi

5 6

Keterlambatan (menit)

33 of 33

Pengorganisasian dan Penyajian Data

19

Tabel di samping menyajikan catatan kejadian suplai air PDAM di suatu rumah macet, dicatat setiap hari.

Cobalah untuk menyajikan data ini dengan berbagai bentuk tabel dan grafik.

Bulan

Bulan ke-

Ta

ngg

al

Jumlah

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

Jan-03

1

1

1

1

1

1

1

1

1

1

9

Feb-03

2

1

1

1

1

1

1

1

7

Mar-03

3

1

1

1

3

Apr-03

4

1

1

1

1

4

May-03

5

1

1

2

Jun-03

6

1

1

1

1

1

5

Jul-03

7

1

1

1

3

Aug-03

8

1

1

1

1

1

1

1

7

Sep-03

9

1

1

2

Oct-03

10

1

1

1

1

1

1

6

Nov-03

11

1

1

1

1

1

5

Dec-03

12

1

1

1

3

Jan-04

13

1

1

1

1

1

1

1

1

1

1

10

Feb-04

14

1

1

Mar-04

15

1

1

1

1

1

1

1

1

1

1

10

Apr-04

16

1

1

1

3

May-04

17

1

1

1

3

Jun-04

18

1

1

2

Jul-04

19

1

1

1

1

1

5

Aug-04

20

1

1

Sep-04

21

1

1

1

1

4

Oct-04

22

1

1

1

1

1

1

6

Nov-04

23

1

1

1

1

4

Dec-04

24

1

1

1

3

Jan-05

25

1

1

1

1

1

5

Feb-05

26

1

1

1

1

1

1

6

Mar-05

27

1

1

1

3

Apr-05

28

1

1

1

1

1

5

May-05

29

1

1

1

3

Jun-05

30

1

1

1

1

4