1 of 28

EDA 1130�PENTAKSIRAN PENDIDIKAN(EDUCATIONAL ASSESSMENT)Bab 3, 4 & 5�Video B

Dr Kim Teng Siang

kskim2007@gmail.com

0124661131

2 of 28

Bab 3Makna Skor Ujian

3 of 28

Bab 3 OVERVIEW

  • Apa itu ujian?
  • Apa itu skor ujian?
  • Skor berujukan Norm dan Skor berujukan Kriteria
  • Huraian secara deskriptif untuk skor

4 of 28

Apa itu Ujian?

  • Ujian ialah alat yang mengukur prestasi seseorang individu secara kualiti atau kuantiti
  • Ujian ialah satu prosedur yang sistematik yang mengukur sifat seseorang.
  • Ia merupakan cara yang formal dan sistematik untuk mengumpul maklumat tentang individu

5 of 28

  • Skor ujian ialah maklumat, biasanya dalam bentuk numbor, yang menyampaikan prestasi seseorang peserta dalam sesuatu ujian.
  • (A test score is a piece of information, usually a number, that conveys the performance of an examinee on a test).
  • One formal definition is that it is "a summary of the evidence contained in an examinee's responses to the items of a test that are related to the construct or constructs being measured."

Apa itu skor ujian?

6 of 28

Raw scores (Asal / mentah)

  • A raw score is a score without any sort of adjustment or transformation, such as the simple number of questions answered correctly

Jenis Skor

Scaled scores (Berskala)

  • Skor berskala ialah hasilan daripada proses transformasi mengikut cara tertentu terhadap skor asal.

7 of 28

Interpretasi Skor Berujukan Norm & Berujukan Kriteria

Norm-Referenced Interpretations

Criterion-Referenced Interpretations

  • Skor ini bermaksud skor yang anda dapat berbanding dengan skor orang lain
  • Norm-referenced tests make comparisons between individuals

  • Skor ini bermaksud skor yang anda dapat berbanding dengan kriteria yang ditetapkan seperti markah putus atau sesuatu jenis pengetahuan yang diperlu
  • (cut score or a body of knowledge)
  • Criterion-referenced tests measure a test taker's performance compared to a specific set of standards or criteria

8 of 28

Ujian Berujukan Norm

Ujian Berujukan Kriteria

Aim

(Tujuan)

Banding prestasi antara pelajar

Memilih pelajar dalam pensijilan

Banding prestasi pelajar terhadap

Sesuatu kriteria (e.g. hasil pembelajaran)

Setakat mana pelajar memperolehi sesuatu kemahiran/ pengetahuan

menambahbaik P & P

Types of Questions

Questions from simple to difficult

Questions of nearly similar difficulty relating to the criteria

Reporting of results

Grades are assigned

No grades are assigned (whether skill or knowledge achieved or not)

Content coverage

Wide content coverage

Specific aspects of the content

Examples

UPSR, PMR, SPM national examinations, end of semester / year exams

Class tests, exercises and assignments

9 of 28

Huraian Skor secara Deskriptif

10 of 28

Chapter 4 & 5�Kebolehpercayaan dan Validiti untuk Guru�(Reliability and Validity for Teachers)�

11 of 28

Bab 4 & 5 Overview

  • Apa itu Kebolehpercayaan (Reliability)?
  • Pekali Kebolehpercayaan (Reliability Coefficient)
  • Methods to Estimate Kebolehpercayaan
  • Kebolehpercayaan Inter dan Intra-rater
  • Jenis-jenis Validiti
  • Strategi Praktikal untuk Guru
  • Faktor yang mempengaruhi Kebolehpercayaan dan

Validiti

12 of 28

Pengenalan

Dalam sesuatu pengukuran kita dapat skor:

e.g. 60%

Adakah skor ini mengambarkan kebolehan sebenar sesorang?

Skor yang diperhatikan = Skor Sebenar + Ralat

(apa kita lihat/ukur) (Kebolehan sebenar)

Mustahil untuk kita membina satu ujian tanpa ralat,

Tetapi apa yg penting ialah ralat itu kecil dan

konsisten; ujian itu betul-betul mengukur apa yang dihasratkan utk mengukur (true score)

  • Reliability is the consistency of the measurement.

13 of 28

Apa itu Kebolehpercayaan?

Skor yang diperhatikan = Skor Sebenar + Ralat

(apa kita lihat/ukur) (Kebolehan sebenar)

  • Sesuatu ujian yang baik mesti mempunyai Kebolehpercayaan dan Validiti
  • Kebolehpercayaan ialah konsistensi sesuatu pengukuran atau the ralat itu adalah stabel and konsisten
  • Validiti merujuk kepada ketepatan (accuracy) sesuatu instrumen/ ujian untuk mengambarkan kebolehan sebenar (mengukur apa yang hendak diukur)

14 of 28

Pekali Kebolehpercayaan (Reliability Coefficient)

  • Pekali Kebolehpercayaan (R ) menunjukan setakat mana sesuatu instrumen / ujian boleh dipercayai
  • Atau setakat mana tetap penskoran / pengujian itu

  • It is the variance of the true score divided by the variance of the observed score (R from 0 🡪 1)

Reliability True Score Variance

Coefficient, (R) = ----------------------------------

Observed Score Variance

R = 1 bermaksud ujian itu sempurna, tiada ralat

(variance is a measure of error)

15 of 28

Interpretasi Nilai Pekali Kebolehpercayaan

Reliabiliti (R)

Interpretasi

0.90 and above

0.80 – 0.90

0.70 – 0.80

0.60 – 0.70

0.50 – 0.60

0.50 and below

Excellent reliability (comparable to the best standardised tests like SAT)

Very good for a classroom test

Good for a classroom test but there are probably a few items which could be improved

Somewhat low. There are probably some items which could be removed or improved

The test needs to be revised.

Questionable reliability and the test should be replaced or needs major revision

16 of 28

Cara Menganggarkan Reliabiliti sesuatu Ujian

Kumpulan Pelajar yg sama (ujian 2 kali):

  • Test-Retestrepeat the same test after some time
  • Parallel or Equivalent Forms two equivalent tests (forms) with items (not similar) measuring the same level of knowledge, skills or attitude

  • Internal Consistency (Ujian Sekali Sahaja)
    • Split-Halftest split into 2 equal parts for analysis
    • Cronbach’s Alpha -individual questions correlate with the total test (commonly used – using computer software)

17 of 28

Inter-rater and Intra-rater Reliability�(antara pengukur) (Pengukur sendiri)

Utk kaedah penilaian menggunakan pemerhatian atau Lisan

(For observation and oral presentation method of evaluation)

  • Inter-rater Reliability - the consistency of grading by two or more raters ( 2 atau lebih pemeriksa/ penilai).

  • Intra-rater Reliability - the consistency of grading by a single rater.

18 of 28

Validiti (Kesahan)

Apa itu VALIDITI?

  • Setakat mana sesuatu ujian atau instrument mengukur apa yang direka untuk mengukur.

E.g.

  • You want to measure the Maths ability of Year 1 students, can you give an English test?
  • Or give a Form 5 Maths test?
  • Or have items asking them to spell a word or finding the meaning of a word unrelated to Maths?

19 of 28

Jenis Validiti

Types (Jenis)

Description (Huraian)

Construct V.

(Konstruk)

actual purpose like math achievement, map skills, reading comprehension

Content V.

(isi kandungan)

coverage of appropriate and necessary content for the purpose

Criterion-Related V.

relating the scores obtained to the scores of some other criterion or other related test

  1. Predictive V.

(Ramalan)

high predictive - TOEFL, SAT

b) Concurrent V.

(Serentak)

Correlate with same skill - MUET & oral test

20 of 28

Reliabiliti & Validiti

21 of 28

Reliabiliti: Strategi Praktical untuk Guru

  • Pastikan murid biasa dengan pentaksiran
  • Menyediakan Corak kertas soalan yang perinci sebelum setiap peperiksaan
  • Ukangkaji konsep yang terlibat sebelum pentaksiran .
  • Sesuatu pentaksiran mengandungi banyak soalan.
  • Mengadakan suasana yang konsisten untuk pelajar

22 of 28

Semakan isi kandungan

Semakan kesaksamaan ujian

Semakan sifa-sifat praktikal

Limitasi soalselidik

Validiti: Strategi Praktical untuk Guru

23 of 28

Faktor Mempengaruhi Reliabiliti and Validiti

  • Jangka masa Ujian (Length of the Test)
  • Pemilihan topik (Selection of Topics)
  • Pilihan Teknik ujian (Choice of Testing Techniques)
  • Keadah mentakbirkan ujian (Method of Test Administration)
  • Kaedah menyemak kertas soalan

24 of 28

Ralat Piawai Pengukuran Standard Error of Measurement (SEM)

  • Menyediakan indeks realibiliti terhadap sesuatu skor
  • (Provides an index of the reliability of an individual’s score.)
  • The standard deviation of the theoretical distribution of errors
  • Semakin ujian menyakinkan semakin kecil SEM
  • (The more reliable a test, the smaller the SEM.)

25 of 28

Sifat individu

  • Anxiety
  • Motivation
  • Health
  • Fatigue

Sifat Luaran (External Characteristics)

  • Environmental
  • Scoring errors
  • Biases
  • Sampling size

Sumber Ralat Pengukuran (Sources of Measurement Error)

26 of 28

Ancaman terhadapValiditi

27 of 28

Bias (Berat sebelah) Pentaksiran

  • It is present whenever one or more items on a test offend or unfairly penalize students because of those students' personal characteristics such as race, gender, socioeconomic status, or religion.

28 of 28

Masalah Bias dalam Pentaksiran Pendidikan�

  • Apa itu Bias (berat sebelah)?
  • Kebimbangan dulu dan sekarang (Past and present concerns)
  • Cultural bias & minorities
  • Bias dlm isi kandungan ujian dan sifat-sifat dalaman ujian
  • Bias dalam faktor ramalan dan luaran
  • Ujian Bebas Budaya, muatan budaya dan bias budaya

(Cultural free tests, cultural loading and cultural bias)