You are on page 1of 79

UNIT PELAJARAN 1 KONSEP ASAS PENGUJIAN, PENGUKURAN, PENILAIAN DAN PENTAKSIRAN

HASIL PEMBELAJARAN
Di akhir unit ini, anda diharap dapat: 1. Menghuraikan maksud pengujian (testing), pengukuran (measurement), penaksiran (assessment) dan penilaian (evaluation). 2. Menghuraikan perkaitan di antara pengujian, pengukuran, penaksiran dan penilaian.

PENGENALAN

Sebagai seorang guru atau pelajar kita harus memahami bahawa matlamat utama penilaian adalah untuk membekalkan maklumat. Situasi seperti di Rajah 1.1 mungkin anda hadapi ketika anda ingin mengumpul maklumat tersebut. Untuk mengumpul maklumat tersebut, guru akan memberi ujian kepada murid-muridnya. Pada pendapat anda, adakah kaedah ujian yang dijalankan seperti dalam rajah di atas boleh dilaksanakan?

dakah anda sedar bahawa biasanya, murid ingin mengetahui prestasinya sendiri melalui ujian dan guru pula boleh mengenal pasti kelemahan murid, dan menilai keberkesanan pengajarannya. Di pihak ibu bapa pula, mereka boleh menilai prestasi anaknya melalui

laporan kemajuan murid. Bagi pentadbir pula, berbagai-bagai keputusan boleh dibuat berdasarkan maklumat ujian tersebut.

ISI KANDUNGAN
Apa maksud pengujian?

aiklah. Selepas menyedari kepentingan penilaian kepada murid serta pihak-pihak yang berkepentingan, kita akan mempelajari apakah maksud ujian atau pengujian itu. Ujian merupakan satu kaedah, tugas atau prosedur untuk memperoleh pemerhatian yang

sistematik tentang sifat seseorang berhubung dengan aspek pendidikan atau psikologi. Tujuan ujian pencapaian adalah untuk mengukur prestasi murid dalam berbagai-bagai mata pelajaran di sekolah. Manakala ujian psikologi adalah untuk mengukur sikap, minat, personaliti dan ciri-ciri psikologi yang lain. Kebiasaannya ujian memerlukan murid bertindak balas terhadap soalan atau butiran. Ujian boleh dibuat secara bertulis dalam bentuk soalan pelbagai pilihan atau esei dan juga dalam bentuk pemerhatian yang memerlukan pemerhati membuat pemeringkatan atau catatan rekod. Oleh itu, murid tidak semestinya sedar bahawa ia sedang diuji. Cronbach (1970) telah mendefinisikan ujian sebagai satu prosedur sistematik untuk memerhati tingkah laku seseorang dan memperihalkannya dengan bantuan skala bernombor atau satu sistem berkategori. Contoh skala bernombor adalah seperti angka 20/100 untuk ujian penglihatan, 120 untuk ujian kecerdasan (IQ Test) dan 75/100 untuk ujian pencapaian bagi mata pelajaran Geografi.

Bagi sistem berkategori ialah ekstrovert atau introvert bagi ujian personaliti dan buta warna hijau merah bagi ujian penglihatan. Dari segi perlaksanaannya, ujian terbahagi kepada dua kumpulan: 1. ujian berbahasa 2. ujian bukan berbahasa Ujian berbahasa adalah seperti ujian pensel dan kertas (ujian bertulis) dan ujian lisan. Ujian bukan berbahasa adalah ujian prestasi yang lebih menumpukan kepada kemahiran psikomotor daripada kemahiran kognitif. Contohnya ujian membaiki radas elektronik. Bilangan calon yang mengambil ujian terbahagi kepada ujian perseorangan dan ujian berkumpulan. Ujian berkumpulan seperti ujian pencapaian di sekolah, manakala ujian perseorangan seperti ujian kecerdasan The Stanford Biner Intelligence Scale dan The Weschsler Intelligence Scale. Kedua-dua ujian kecerdasan itu ditadbir kepada seorang murid pada satu-satu masa.

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan pengujian?. ____________________________________________________________ ______________________________________________________________________

Apa maksud pengukuran?


Sax (1997), mendefinisikan pengukuran sebagai umpukan atau pemberian angka-angka atau nombor kepada sesuatu objek atau perkara mengikut satu set peraturan yang telah ditetapkan. Dalam erti kata lain, ujian berupaya mengukur pencapaian murid. Bagi seseorang guru di bilik darjah, aspek pengukuran pendidikan itu selalu dikaitkan dengan ujian di bilik darjah. Bagi ahli psikologi klinikal, pengukuran pendidikan melibatkan ujian-ujian psikologi yang lebih bertumpu kepada pengukuran nilai-nilai afektif individu.

Pengukuran dalam pendidikan sebenarnya adalah langkah untuk menentukan tahap sejauh mana seseorang memiliki sifat tertentu. Biasanya suatu indeks berangka kepada prestasi seseorang diberikan supaya status individu tersebut secara lebih tepat dapat mewakili sifat tertentu. Misalnya, Azman dapat markah 75 peratus dalam ujian Bahasa Melayu, atau prestasi purata sekumpulan murid dalam mata pelajaran Matematik ialah 60 peratus. Kita hanya mengukur dan tidak menentukan nilai. Sebab itu, contoh tersebut tidak dinyatakan sama ada prestasi tersebut baik atau sebaliknya. Pengukuran ialah penentuan status dan penilaian ialah penentuan nilai. Seseorang murid mungkin mengukur panjang sebuah meja, jarak masa larian satu kilometer, rintangan satu litar arus elektrik atau pencapaian seseorang murid. Setiap pengukuran ini melibatkan sifat atau pemboleh ubah yang berbeza-beza bagi satu objek atau perlakuan tertentu. Pengukuran memberi maklumat tentang sifat atau aktiviti yang diukur. Biasanya maklumat yang diperoleh ada kaitan dengan telahan ke atas fenomena tertentu. Contohnya panjang meja diperlukan untuk mengetahui sama ada meja itu boleh ataupun tidak untuk diletakkan di ruang tamu. Sebenarnya, apa yang diukur bukanlah objek tetapi sifat objek. Begitu juga kita tidak mengukur pelajar tetapi mengukur tinggi, berat atau pencapaian pelajar. Atribut-atribut yang boleh diukur mempunyai sifat-sifat kuantitatif, iaitu nilainya adalah dalam bentuk nombor.

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan pengukuran?. _______________________________________________________________ ________________________________________________________________________

Apa maksud penaksiran?


Pada umumnya penaksiran melibatkan membuat keputusan berdasarkan kepada sesuatu peraturan atau piawaian. Penaksiran mempunyai ciri-ciri berikut: a) b) Merupakan satu proses mengumpul data bertujuan membuat keputusan tentang individu atau kumpulan Ujian merupakan sebahagian daripada penaksiran

c)

Apabila penaksiran dibuat ke atas pelajar, guru sebenarnya mengukur tahap kecekapan untuk menentukan sama ada tahap kecekapan yang perlu dikuasai pada satu-satu peringkat pengajaran dan pembelajaran telah dapat diwujudkan.

Penaksiran boleh dibahagikan kepada beberapa jenis mengikut kriteria tertentu, iaitu pembahagian mengikut: 1. tujuan penaksiran, 2. darjah keutamaan antara faktor ekonomi, ketulenan atau realisme (autentik), dengan kebolehpercayaan, 3. cara bagaimana data yang dikumpul ditafsir dan dinilai.

Pengkelasan penaksiran mengikut tujuan penaksiran. Tujuan Mengenal pasti kelemahan dan kesediaan belajar Mempelbagaikan penaksiran secara berkala bagi tujuan memberi gred Membantu pelajar belajar secara berterusan Memberi gred Melapor kepada pihak luar Membuat keputusan tentang sesuatu tindakan Jenis Penaksiran diagnostik (diagnostic assessment) Penaksiran formatif (formative assessment) Penaksiran untuk pembelajaran (assessment for learning dan assessment as learning) Penaksiran sumatif (summative assessment) atau penaksiran hasil pembelajaran (assessment of learning)

Perbezaan antara assessment for learning dengan assessment as learning Assessment for learning Sejauh mana pembelajaran berlaku dibuat perbandingan dengan kriteria yang merujuk kepada hasil pembelajaran yang diharapkan Assessment as learning Sejauh mana pembelajaran berlaku dibuat perbandingan dengan prestasi kendiri sebelumnya

Pengkelasan penaksiran mengikut darjah keutamaan antara faktor ketulenan (realisme), ekonomi (praktikal) dan kebolehpercayaan (konsisten)

Faktor yang diutamakan

Jenis

Ketulenan (authenticity) Ekonomi dan kebolehpercayaan

Penaksiran autentik Penaksiran konvensional/tradisional atau pengujian

Menyeimbangkan faktor ketulenan, ekonomi, dan kebolehpercayaan penaksiran Apabila konteks penaksiran prestasi mempunyai darjah ketulenan yang sangat tinggi, biasanya ia tidak seragam dan/atau tidak ekonomi untuk dijalankan. Memaksimumkan salah satu daripada tiga faktor ini (ketulenan, kebolehpercayaan, dan ekonomi) akan menyebabkan dua faktor lain terjejas dengan teruk. Oleh sebab ketulenan, ekonomi, dan kebolehpercayaan semuanya penting, guru perlu mempertimbangkan dengan teliti semua faktor ini dan cuba menonjolkan salah satu hanya apabila faktor lain itu tidak begitu terjejas. Strategi terbaik adalah mencari titik keseimbangan di mana tahap setiap faktor itu cukup tinggi berbanding memaksimumkan hanya satu faktor. Namun pemilihan banyak juga bergantung kepada tujuan penaksiran itu dijalankan. Perbezaan antara penaksiran autentik dengan penaksiran konvensional/tradisional atau pengujian Penaksiran autentik Biasanya pelajar perlu melakukan sesuatu tugasan Konteks kehidupan sebenar Membina/mengaplikasi Penstrukturan pelajar Bukti secara langsung Penaksiran konvensional/ tradisional atau pengujian Biasanya pelajar memilih respon dan/atau menulis ayat pendek Konteks terkawal Mengingat kembali/mengenal pasti Penstrukturan guru/pengajar Bukti secara tidak langsung

Terdapat juga istilah penaksiran alternatif yang agak sinonim dengan penaksiran autentik. Namun terdapat sedikit perbezaan iaitu penaksiran alternatif merupakan penaksiran selain daripada penaksiran kertas-dan-pensel. Ada kalanya darjah ketulenannya tidak begitu tinggi, cuma ia bukan ujian kertas-dan-pensel, maka mungkin tidak boleh dikategorikan sebagai penaksiran autentik. Penaksiran autentik biasanya mempunyai darjah ketulenan yang tinggi iaitu penaksiran itu dijalankan dalam konteks kehidupan sebenar. Sebagai contoh, menaksir kebolehan mengajar semasa pelajar menjalankan latihan mengajar di makmal mikropengajaran merupakan penaksiran alternatif tetapi darjah ketulenannya tidak begitu

tinggi berbanding menjalankan latihan mengajar di sekolah, di mana ia dilakukan dalam konteks kehidupan sebenar. Namun jika dibandingkan latihan mengajar di makmal dengan ujian kertas-dan-pensel seperti peperiksaan akhir semester, darjah ketulenan latihan mengajar di makmal mikropengajaran bagi mengukur kebolehan mengajar itu adalah lebih tinggi, maka lebih autentik daripada ujian kertas-dan-pensel. Walau bagaimanapun, dalam konteks kebolehan menghasilkan penulisan kreatif, misalnya, penaksiran kertas-dan-pensel merupakan penaksiran autentik jika diberi kebebasan dari segi masa kerana bertepatan dengan situasi penulisan kreatif dalam kehidupan seharian.

Pengkelasan penaksiran mengikut cara bagaimana data yang dikumpul ditafsir dan dinilai

Cara tafsir dan nilai Mengikut kriteria tertentu yang telah ditetapkan lebih awal Membandingkan prestasi seorang pelajar dengan pelajar lain

Jenis Penaksiran rujukan kriteria (criterion-referenced assessment) Penaksiran rujukan norma (norm-referenced assessment)

Bagi penaksiran rujukan kriteria, contoh kriteria yang ditetapkan yang digunakan di UPSI adalah seperti berikut: Peratus Markah 80-100 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 <35 Penilaian Cemerlang (A) Cemerlang (A-) Kepujian (B+) Kepujian (B) Kepujian (B-) Lulus (C+) Lulus (C) Lulus (C-) Lulus (D+) Lulus (D) Gagal

Setiap pelajar yang mencapai peratus markah tertentu akan dinilai sewajarnya mengikut penilaian yang telah ditetapkan tanpa mengira prestasi pelajar lain. Penaksiran rujukan kriteria bertujuan

membezakan antara pelajar berpencapaian tinggi dengan rendah dan menyusun mereka dari segi pencapaian tersebut. Bagi penaksiran rujukan norma pula, pencapaian atau prestasi setiap pelajar dibuat perbandingan dengan pelajar lain dalam satu kumpulan besar bagi menetapkan kedudukannya. Oleh itu, jika seorang pelajar mendapat markah 75% misalnya, jikalau mengikut rujukan kriteria, pencapaian pelajar ini akan dinilai sebagai cemerlang (A-), tetapi jikalau dibandingkan dengan pelajar lain yang dinilai bersama, pelajar ini kemungkinan mendapat prestasi cemerlang (A) jikalau markah 75% ini merupakan markah yang tertinggi dalam kumpulan pelajar yang ditaksir. Penaksiran jenis ini meletakkan pelajar mengikut lengkung taburan normal. Pelajar bersaing antara satu sama lain. Peperiksaan peringkat kebangsaan seperti SPM, PMR, dan UPSR biasanya merupakan penaksiran rujukan norma Airasian (1991) mengatakan bahawa ramai orang membuat tanggapan tentang perkataan penaksiran bilik darjah membawa imej pelajar mengambil uijan kertas dan pensil, guru menskor jawapan dan memberikan gred sepadan dengan prestasi yang ditunjukkan. Penaksiran dimulakan dengan yang tak formal di bilik darjah dan diakhiri dengan keputusan tentang penggredan dan ulangan bagi seseorang murid. Bagi Principles for Fair Students Assessment Practices Education in Canada (1993), penaksiran adalah satu proses mengumpul dan menginterpretasi maklumat yang boleh digunakan untuk : a. memaklumkan pelajar atau ibu bapa mereka tentang kemajuan terhadap penguasaan pengetahuan, kemahiran, sikap dan perlakuan yang sepatutnya telah dipelajari atau dikuasai b. memaklumkan kepada mereka yang terlibat dalam membuat keputusan pendidikan ( pengajaran, perancangan kurikulum, dasar dan pembentangan program) tentang pelajar. Sekolah-sekolah di Malaysia biasanya menggunakan kertas dan pensil untuk menaksir dan menilai pelajar mereka. Guru akan mengajar dan membuat ujian terhadap apa yang diajar. Guru membina satu ujian, mentadbirkan ujian berkenaan, menskor ujian, merekod markah yang didapati ke dalam buku rekod pelajar, memulangkan kertas ujian kepada pelajar untuk semakan dan guru

akan mencampurkan semua skor dari pelbagai mata pelajaran secara keseluruhan. Masalah yang dihadapi ialah ujian bilik darjah, umumnya, menguji kemahiran aras rendah dalam domain kognitif. Kebanyakan soalan yang dibina oleh guru kurang menekankan Jadual Penentuan Ujian (JPU), ini menyebabkan pengujian hanya dibuat pada aras pengetahuan dan kefahaman sahaja.

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan penaksiran? _______________________________________________________________ ________________________________________________________________________

Apa maksud penilaian?


Penilaian adalah satu pertimbangan atau pembuatan keputusan tentang nilai sesuatu perkara atau benda. Gay (1985), mengatakan bahawa penilaian merupakan satu proses yang sistematik dalam pengumpulan dan analisis data untuk menentukan sama ada sesuatu objektif itu telah tercapai yang membolehkan sesuatu pertimbangan atau keputusan dibuat. Pengukuran melibatkan pemberian nombor atau peringkat maklumat yang diperlukan dan lebih kepada kuantitatif. Penilaian boleh menggunakan maklumat kualitatif yang mengandungi pernyataan deskriptif bertujuan untuk menghuraikan dengan lebih lanjut, jelas atau membuat analisis terhadap sesuatu isu. Jika sesuatu objektif itu telah tercapai, maka perlu juga diketahui tahap pencapaian objektif berkenaan. Ini bermakna setakat mana pencapaian objektif itu boleh diterima. Keadaan ini boelh memudahkan guru untuk membuat keputusan. Dalam proses penilaian komponen pentingnya ialah untuk membuat keputusan. Penilaian bertujuan menentukan status sesuatu objek yang dinilai dengan membanding status berkenaan dengan satu set standard atau kriteria uantuk dibuat keputusan. Proses yang terlibat dalam membuat penilaian ialah: a) menentukan jenis data yang harus dikumpulkan b) menentukan jenis responden

c) pengumpulan data d) analisis data e) interpretasi data f) membuat keputusan

Tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan penilaian?. _______________________________________________________________ _______________________________________________________________________

Apa perkaitan antara penaksiran, pengujian, pengukuran, penaksiran dan penilaian?


Penaksiran merupakan keseluruhan proses mengumpul data sehinggalah kepada membuat keputusan berdasarkan data tersebut (contohnya membuat keputusan sama ada pelajar tertentu layak bergraduat atau tidak). Jika data dikumpul dalam keadaan terkawal, maka proses itu dipanggil pengujian; jika sebaliknya, dipanggil penaksiran autentik atau alternatif. Selepas data dikumpul ia perlu dinyatakan dalam bentuk kuantiti, sebaiknya dalam bentuk yang membenarkan perbandingan antara individu atau kumpulan dilakukan. Maka proses ini dipanggil pengukuran. Proses seterusnya ialah penilaian di mana perbandingan dengan satu set kriteria atau kumpulan dilakukan bagi menentukan nilai atau kualiti data tersebut (contohnya menetapkan pencapaian sebagai cemerlang, sederhana atau gagal). Namun ada pihak yang mengkonsepsi proses penilaian sebagai sinonim dengan penaksiran iaitu sebagai keseluruhan proses mengumpul data dan akhirnya menilai dan membuat keputusan.

RUMUSAN
Peranan penaksiran dan penilaian menentukan sama ada keperluan kanak-kanak boleh dipenuhi, dapat diperbaiki kandungan kurikulum serta amalan pengajaran atau menentukan kualiti tadika. Oleh kerana terdapat tadika yang menjalankan penaksiran dan penilaian secara formal, iaitu kanak-kanak prasekolah perlu menduduki ujian dan diberi gred markah dan kedudukan selepas

10

dinilai. Kesan dari kemasukan gred dan markah adalah penglabelan ke atas kanak-kanak secara langsung. Melabelkan kanak-kanak hasil satu atau dua ujian adalah tidak sesuai. Sewajarnya, guru harus memahami bagaimana untuk membuat pengujian, pengukuran, penaksiran dan penilaian ke atas kanak-kanak supaya tidak melakukan kesilapan dalam membuat keputusan tentang pendidikan.

KATA KUNCI
Pengujian Pengukuran Penaksiran Penilaian

PENILAIAN KENDIRI
1. Dengan menggunakan perkataan sendiri, huraikan apa yang dimaksudkan dengan pengujian psikologi? 2. Senaraikan satu contoh ujian berkumpulan dan satu ujian perseorangan?. 3. Apakah perbezaan utama di antara pengujian dan pengukuran? 4. Apakah perbezaan di antara penaksiran autentik dengan penaksiran konvensional? 5. Huraikan perkaitan di antara pengujian, pengukuran, penaksiran dan penilaian?

RUJUKAN
Linn, R.L & Gronlund, N.E.(2000). Measurement and Assessment in Teaching (8th ed.). New Jersey: Prentice-Hall Inc. Bhasah Abu Bakar, (2003). Asas Pengukuran Bilik Darjah. Tanjong Malim, West Malaysia : Quantum Books. Mokhtar Ismail, (1995). Penilaian di Bilik Darjah. Kuala Lumpur: Dewan Bahasa Pustaka

11

UNIT 2 PENTAKSIRAN KONVENSIONAL DAN PENGUJIAN


HASIL PEMBELAJARAN
Di akhir unit ini anda akan dapat 1. Mengetahui langkah-langkah perancangan dan pembinaan ujian 2. Membina ujian sumatif berdasarkan tajuk-tajuk dalam sukatan pelajaran masingmasing 3. Memahami pentingnya menganalisis item untuk menilai kualiti ujian 4. Memahami perbezaan di antara konsep kesukaran item dan diskriminasi item dalam analisis item 5. Memahami perkaitan antara kesukaran item dan diskriminasi item

PENGENALAN
Dalam Unit 1, kita telah membincangkan tentang beberapa konsep asas seperti pengujian, pengukuran, pentaksiran dan penilaian. Memahami perkaitan di antara konsep-konsep tersebut adalah amat berguna kepada guru dalam merancang pengajaran dan pembelajaran. Unit ini akan memberikan tumpuan kepada pengujian untuk mendapatkan maklumat yang penting tentang pembelajaran dan pencapaian pelajar. Memandangkan peserta kursus ini terdiri daripada guru-guru yang telah mengajar dan mempunyai pengetahuan dan pengalaman dalam merancang dan membina ujian, maka Unit ini akan juga menumpukan kepada perbincangan tentang isu-isu yang berkaitan dengan pengujian dan penilaian.

ISI KANDUNGAN
Perancangan dan pembinaan ujian
Sebagai guru kita perlu merancang pengujian yang sesuai dengan topik yang diajar dan kebolehan pelajar-pelajar. Perancangan yang teliti adalah penting bagi mempastikan ujian yang ditadbirkan dapat menghasilkan maklumat yang sah dan boleh dipercayai. Dalam merancang dan membina ujian, beberapa pertimbangan umum berikut boleh dijadikan panduan: i. Mengetahui kandungan pelajaran dengan baik guru perlulah menguasai dengan baik kandungan pelajaran yang diajar. Ini penting bagi mempastikan yang guru dapat menentukan apakah skop kandungan pelajaran yang hendak diuji serta tahap kebolehan pelajar dalam memahami topik-topik yang diajar. Mengetahui dan memahami pelajar yang akan diuji ujian yang dirancang perlulah mengambil kira latar belakang serta kebolehan pelajar. Ini perlu supaya guru dapat menyesuaikan kandungan ujian, format ujian, item ujian dengan tahap pelajar. Berkemahiran menulis item ujian memerlukan kemahiran serta penguasaan bahasa yang baik supaya dapat menghasilkan ujian yang berkualiti. Kreatif menulis item ujian juga memerlukan kreativiti bagi menghasilkan item-item yang sesuai dan menarik. Penggunaan pelbagai media, rajah, simbol, gambar serta lain-lain bentuk rangsangan atau stimulus akan menjadikan item-item lebih pelbagai bentuk serta dapat mengukur pelbagai aras kemahiran.

ii.

iii. iv.

v.

Kesahan dan Kebolehpercayaan Ujian Sejauhmanakah ujian mengukur apa yang sepatutnya diukur adalah merupakan soalan berkait dengan kesahan ujian. Guru perlu mempastikan skop kandungan yang diuji merupakan pengetahuan dan kemahiran yang telah diajar dan penting untuk diketahui oleh pelajar. Ini melibatkan kesahan kandungan yang merupakan aspek penting dalam penyediaan ujian. Di samping itu, ketekalan skor yang dihasilkan oleh ujian juga perlu diperhatikan bagi mempastikan keboleh percayaan ujian. Konsep kesahan dan kebolehpercayaan akan dibincangkan dengan lebih lanjut dalam Unit 4.

Proses Asas Pembinaan Ujian


Sebagai seorang guru sudah tentu anda mempunyai pengalaman dalam menyediakan ujian bagi mengukur pengetahuan dan kemahiran pelajar anda. Dalam menyediakan ujian sudah tentu anda mengikuti proses dan prosedur yang telah ditetapkan oleh pihak sekolah. Berikut dinyatakan proses asas dalam pembinaan ujian yang standard dan mungkin anda boleh bandingkan dengan amalan yang dilakukan selama ini. i. ii. iii. iv. Penentuan Tujuan Ujian sebelum sesuatu ujian dibina, guru perlu terlebih dahulu tentukan tujuan ujian diadakan. Adakah untuk tujuan formatif, sumatif, penempatan atau diagnostik. Menyediakan Jadual Penentuan Ujian - menentukan bidang cakupan ujian - kandungan yang perlu diuji serta menentukan aras kemahiran atau jenis perlakuan yang diharapkan Penulisan Item- tentukan perlakuan yang akan diukur dengan merujuk kepada objektif pengajaran. Di samping itu tentukan jenis-jenis item yang sesuai Menilai semula soalan - dikaji semula oleh rakan-rakan lain atau jawatankuasa untuk memperbaiki aspek-aspek seperti idea yang diuji, kemahiran yang diuji, format item, pokok soalan, penyusunan ayat, struktur pilihan jawapan dan kunci soalan. Analisis Item/Soalan - untuk mengetahui peratus pelajar yang dapat menjawab sesuatu item dengan betul, keberkesanan pengganggu, kuasa diskriminasi soalan dan sejauhmana soalan menepati objektif pembelajaran. Pemilihan Soalan Yang Bermutu - pemilihan soalan-soalan untuk memenuhi JPU yang ditetapkan - berdasarkan analisis item Susunan Soalan - Soalan yang terpilih disusun mengikut jenis item untuk mengelakkan kekeliruan, memudahkan pelajar mengekalkan mental set, memudahkan guru memeriksa. Soalan juga disusun mengikut aras kesukaran, aktiviti mental berkembang dari mudah ke kompleks, menimbulkan keyakinan dan motivasi dan jawapan betul disusun mengikut random pattern. Percetakan Soalan - kualiti percetakan adalah penting dan perkara-perkara seperti kualiti kertas, ruang antara soalan, penggunaan gambar rajah serta dakwat perlu diberi perhatian.

v.

vi. vii.

vii.

Sekarang cuba anda renungkan adalah langkah-langkah tersebut di atas dijalankan dalam merancang dan membina ujian. Sekairanya ada, langkah-langkah yang manakah yang anda belum lakukan dan kenapa? Bagaimana membina ujian yang baik? 1. Aspek keseluruhan ujian Ujian yang dibina dengan baik memastikan inferens atau kesimpulan yang dibuat tentang pengetahuan dan kemahiran pelajar adalah tepat, adil, dan sah. Selain daripada itu, ujian tersebut adalah stabil dari segi mutu, tahap, dan kesukarannya dari setahun ke setahun. Oleh itu adalah penting membina Jadual

Spesifikasi Ujian yang merupakan satu dokumen yang merakamkan buah fikiran dan perancangan keseluruhan ujian. Langkah-langkah umum pembinaan JSU ini adalah seperti berikut: Tentukan skop ujian (topik yang akan dimasukkan) Anggarkan % masa pembelajaran bagi setiap topik Tentukan hasil pembelajaran yang ingin ditaksir serta arasnya Tentukan jenis ujian yang sesuai (objektif dan/atau subjektif) Tentukan bilangan soalan bagi setiap topik (% masa x jumlah markah) Tentukan masa yang diperuntukkan untuk menjawab (kebiasaannya, 13 min/soalan bagi ujian aneka pilihan dan 15-30 min/soalan bagi ujian berstruktur/esei) Jana atau pilih soalan yang sesuai daripada bank soalan berdasarkan Jadual Spesifikasi Ujian. Contoh JSU yang biasa dibina adalah seperti berikut: Contoh JSU bagi peperiksaan akhir semester kursus Kurikulum dan Pengajaran Fizik (5 soalan struktur dan 5 esei)
BIL 1 2 3 4 5 6 Topik Teras pengetahuan guru Pendekatan Inkuri Penaksiran Miskonsepsi Fizik Kemahiran mikropengajaran Teknologi & Media Peratus wajaran (%) Pengetahuan Kefahaman 1 Aplikasi 1 1 1 1 1 30 1 1 10 20 20 20 1 1 Analisis Sintesis Penilaian Peratus wajaran, % 15 15 20 30 15 10 100

2. Aspek khusus ujian soalan objektif Ujian objektif adalah merupakan bentuk ujian yang luas digunakan sama ada di peringkat bilik darjah mahu pun di peringkat peperiksaan kebangsaan. Sebagai seorang guru anda juga pernah menggunakan ujian objektif dalam mengukur pengetahuan dan kemahiran pelajar anda. Sebagai refleksi, cuba anda senaraikan format soalan objektif yang biasa anda gunakan: i. ii. ___________________________________ ___________________________________

iii. ___________________________________ iv. ___________________________________ Soalan objektif terbahagi kepada dua jenis: i. ii. Jenis membekalkan jawapan - jawapan pendek Jenis memilih jawapan - betul/salah, padanan dan anika pilihan

Secara umumnya, soalan objektif ini merupakan cara mudah mendapatkan maklumat serta memerlukan masa yang kurang dibandingkan dengan ujian esei. Di samping itu lebih banyak isi kandungan boleh diuji, maka sampelan kandungan yang diuji adalah lebih representatif. Ini secara langsung dapat meningkatkan kebolehpercayaan dan kesahan ujian. Ujian objektif juga lebih mudah diperiksa secara tepat dan objektif. Walaubagaimana pun, ujian objektif memerlukan masa serta kemahiran yang baik untuk membinanya. Oleh itu, di bawah disenaraikan panduan umum dalam menulis soalan objektif.

Jangan ada item yang menjadi jawapan kepada item yang lain Setiap item menaksir satu konsep sahaja Setiap item bermula dengan pangkal item dan berakhir dengan sebaik-baiknya 5 pilihan jawapan. Jika ingin mengelakkan pelajar meneka, pilihan kelima diletakkan sebagai Saya tidak tahu. Jangan sekali-kali meletakkan jawapan tepat bagi pilihan kelima. Pangkal item perlu jelas menyatakan masalah yang hendak diselesaikan. Format yang lebih baik bagi pangkal item adalah berbentuk soalan ayat penuh. Jikalau item dalam bentuk ayat tergantung, pilihan jawapan harus merupakan penyambung sehingga terbentuk ayat penuh. Elakkan penggunaan ayat negatif, iaitu yang mengandungi perkataan bukan, tidak, melainkan. Jika perlu digunakan juga, hitamkan, gariskan, atau gunakan huruf besar. Pangkal item tidak sepatutnya mengandungi kiu dengan menggunakan perkataan penting yang diulang dalam pilihan jawapan. Pilihan jawapan mesti ada hanya satu jawapan tepat mengikut pakar. Pilihan jawapan haruslah semuanya mempunyai struktur ayat yang serupa, termasuk istilah dan panjang yang hampir serupa juga. Susun pilihan jawapan mengikut susunan logik di mana sesuai, misalnya apabila menyenarai nombor. Pilihan jawapan harus disusun secara rawak bagi keseluruhan item ujian supaya pelajar tidak mudah meneka.

Sebagai latihan, cuba anda teliti item-item objektif berikut, dan berikan ulasan anda tentang kelemahan yang terdapat pada item-item tersebut. i. Yang manakah di antara berikut yang merupakan contoh amalan penyelidikan yang beretika? A. Sebagai pelajar universiti anda tidak dikehendaki terlibat dalam sebarang penyelidikan B. Sekiranya ada di antara keputusan penyelidikan adalah berbeza daripada yang lain, adalah dibolehkan membuang mana-mana yang berbeza C. Adalah boleh menjalankan penyelidikan yang melibatkan pelajar di bawah umur 18 tanpa mendapatkan kebenaran sekiranya penyelidikan itu untuk pendidikan D. Adalah beretika untuk melibatkan kanak-kanak dalam penyelidikan tanpa kebenaran ibubapa mereka ii. Pentaksiran tradisonal dikatakan tidak bersesuaian dengan paradigma dan teori pembelajaran konstruktivisme yang sedang berkembang sekarang. Pandangan ini lebih menekankan kepada kelemahan pentaksiran tradisional dalam mengukur kemahiran berfikir tahap tinggi pelajar-pelajar. Kelemahan lain yang pada pandangan anda juga merupakan kelemahan pentaksiran tradisional adalah I. II. III. IV. A. B. C. D. penggunaan prosedur dan proses yang standard bagi pelajar-pelajar yang berbeza kebolehan tidak dapat mengukur kemampuan sebenar pelajar kesahan dan kebolehpercayaan yang rendah terutama ujian tara lebih memihak kepada golongan pelajar yang berkebolehan (elit) I & II sahaja III & IV sahaja I, II & III sahaja I, II & IV sahaja

iii. Salah satu objektif pengajaran Geografi yang hendak dicapai oleh Cikgu Lily adalah seperti berikut: "Membolehkan pelajar mengumpul maklumat, menganalisis maklumat dan membuat laporan daripada lawatan yang diadakan ke kawasan perkampungan orang asli". Untuk mengukur kemahiran-kemahiran tersebut, jenis pentaksiran yang paling sesuai digunakan oleh Cikgu Lily adalah A. B. C. D. Pentaksiran persembahan terbuka Pentaksiran persembahan terhad Ujian Subjektif Ujian Objektif

3. Aspek khusus ujian soalan berstruktur dan esei Soalan berstruktur dan esei juga merupakan bentuk ujian yang biasa dijalankan di sekolah. Berbanding dengan ujian objektif, soalan esei dikatakan lebih baik untuk mengukur aras kemahiran yang kompleks. Ini memandangkan ujian esei memberi peluang kepada pelajar untuk mengoraganisasi, menyepadu dan mensintesis pengetahuan serta menggunakan maklumat yang dipelajari untuk menyelesaikan masalah dalam situasi yang sebenar. Secara umumnya, soalan berstruktur dan esei ini mempunyai dua jenis: Jenis soalan respon terhad Soalan bentuk ini meletakkan had pada jawapan yang perlu diberikan oleh calon. Sempadan kandungan mata pelajaran yang perlu dipertimbangkan biasanya ditakrifkan secara sempit oleh masalah, dan bentuk jawapan yang khusus juga lazimnya ditunjukkan (oleh kata tugasan seperti; senaraikan, takrifkan, dan beri alasan). Dalam sesetengah kes, respon dihadkan oleh penggunaan arahan khusus atau maklumat pengenalan. Soalan jenis ini adalah paling sesuai pada peringkat aras pengetahuan, pemahaman, aplikasi dan analisis Contoh soalan: Beri sebab-sebab mengapa masalah penyalahgunaan dadah masih lagi merupakan masalah yang utama di kalangan belia-belia di negara ini. Jawapan anda mestilah tidak melebihi 100 patah perkataan Jenis soalan respon lanjutan Soalan jenis ini memberi kebebasan kepada calon untuk menjawab. Had pada bahan yang boleh dimasukkan dalam jawapan dan pada bentuk respon adalah minimum walaupun dalam sesetengah kes, had yang munasabah boleh dikenakan seperti had masa dan had halaman. Dalam soalan jenis ini, calon hendaklah diberi kebebasan untuk menunjukkan kemahiran kepada aras sintesis dan penilaian. Soalan ini dapat mengukur penyepaduan idea yang kreatif, penilaian bahan secara keseluruhan, dan pendekatan yang luas kepada penyelesaian masalah. Contoh soalan: Kebelakangan ini keamanan dunia sering terancam dengan pelbagai tragedi dan peperangan. Pertubuhan Bangsa-Bangsa Bersatu tidak dapat menjalankan tugas menjaga keamanan dunia dengan berkesan. Huraikan mengapakah badan ini tidak dapat

menjalankan tugas dengan berkesan dan cadangkan langkah-langkah yang boleh diambil oleh badan ini untuk mengekalkan keamanan dunia. Dalam membina soalan berstruktur dan esei, secara keseluruhannya perkara-perkara berikut boleh dijadikan panduan: Pastikan sama ada rangsangan soalan (gambar rajah, gambar, perangkaan dan lainlain) perlu bagi soalan yang akan digubal serta relevan kepada soalan. Gubal soalan dengan menggabungkan tugasan soalan, tajuk dan rangsangan (jika ada) dengan memberikan pertimbangan kepada perkara berikut: o o o o o o o o o Soalan hendaklah seberapa ringkas yang mungkin Soalan hendaklah tepat dan jelas Soalan hendaklah berkemampuan membezakan pelajar baik, sederhana dan lemah (Kebiasaaannya aras kemahiran menentukan kedudukan soalan) Konsep yang disoalkan hendaklah sesuai dengan peringkat pemelajaran yang telah diajarkan. Tidak mengandungi unsur emosi, keperibadian, kepercayaan, kebudayaan, agama dan lain-lain perkara sensitif. Sediakan rangka model jawapan kepada soalan supaya mudah untuk menyemak) Sediakan skema pemarkahan beserta dengan pecahan dan wajaran markah. Tentukan soalan-soalan mengikut standard (dari segi aras kesukaran, masa untuk menjawab, liputan jawapan dan kepentingan tajuk) Dapatkan pandangan kedua semakan

Sebagai kesimpulan, berdasarkan pemahaman dan pengalaman anda, cuba anda senaraikan TIGA kekuatan dan kelemahan kedua-dua bentuk ujian objektif dan ujian esei: Kekuatan: I. _____________________________________________________________

II. _____________________________________________________________ III. _____________________________________________________________ Kelemahan: i. ii. _____________________________________________________________ _____________________________________________________________

iii. _____________________________________________________________

Analisis item
Kualiti sesuatu ujian bergantung kepada kualiti tiap-tiap item dalam ujian tersebut. Kualiti item-item memberi kesan kepada kesahan, kebolehpercayaan dan kegunaan sesuatu ujian. Pada umumnya, analisis item merupakan teknik untuk menilai kekuatan dan kelemahan ujian, memberikan maklumbalas yang berguna kepada guru, membantu guru menulis item ujian yang baik. Mengikut Mehren (1975), analisis item adalah proses meneliti tindakbalas calon terhadap tiap-tiap item untuk membuat

pertimbangan tentang kualiti item-item tersebut. Penilaian ke atas tiap-tiap item dengan mengaitkannya dengan kriteria luaran atau hubungannya dengan lain-lain item dalam ujian. Analisis ini menilai kualiti item dan juga ujian. Analisis juga boleh digunakan untuk meneliti semula setiap item dan meningkatkan keberkesanan setiap item dan juga ujian Tujuan analisis item Pada umumnya analisis item bertujuan: untuk mengenalpasti item yang baik dan item yang tidak baik untuk mengenalpasti pengetahuan atau kemahiran yang pelajar telah dan belum menguasai

Kesukaran Item Kesukaran item merupakan peratus pelajar yang mengambil ujian yang menjawab dengan betul. Lebih besar peratus yang mendapat jawapan betul, lebih mudah item tersebut. Untuk mendapatkan kesukaran item, bahagikan bilangan calon yang menjawab betul dengan umlah calon yang menjawab item tersebut. Kesukaran item juga dikenali sebagai nilai p. Oleh itu, sesuatu item yang dijawab dengan betul oleh 85% calon akan mempunyai kesukaran item atau nilai p .85. Nilai p pada asasnya adalah merupakan ukuran tingkahlaku. Ini kerana kesukaran item lebih didefinisikan dari segi kekerapan relatif dengan calon-calon lain yang memilih jawapan betul daripada didefinisikan dari segi ciri-ciri intrinsik item tersebut. Dengan ertikata lain, kesukaran item atau nilai p memberi kesan ke atas kepelbagaian/sebaran skor serta ketepatan skor ujian membezakan di antara kumpulan yang berbeza. Contohnya, apabila tidak ada calon yang memilih jawapan yang betul, sudah tentu tidak ada perbezaan individu dari skor ke atas item tersebut. Keadaan yang sama juga benar sekiranya semua calon memilih jawapan yang betul bagi item tersebut. Dengan ertikata lain, kesukaran item atau nilai p .0 (tidak seorang yang memilih jawapan betul) atau nilai p 1.0 (semua calon memilih jawapan betul) tidak memberi apa-apa sumbangan dalam mengukur perbezaan individu, oleh itu ianya tidak berguna. Untuk mendapatkan indeks kesukaran item, cara yang mudah biasanya diperolehi melalui formula berikut: NT + NR __________ N NT = Bilangan calon Kump. Tinggi yang menjawab betul NR = Bilangan calon Kump. Rendah yang menjawab betul N = Jumlah semua calon yang menjawab item berkenaan

Garis panduan umum tentang indeks kesukaran item Nilai p 0.7 ke atas 0.3 hingga 0.69 0.29 ke bawah Aras kesukaran mudah sederhana sukar

Diskriminasi Item Secara umumnya, sesuatu item yang baik dapat mendiskriminasikan di antara pelajar yang mendapat pencapaian tinggi dalam ujian dengan pelajar berpencapaian rendah dalam ujian tersebut. Dengan ertikata lain, pelajar yang berpencapaian tinggi dalam ujian akan memilih jawapan yang betul dalam sesuatu item dan yang berpencapaian rendah akan memilih pengganggu (jawapan salah). Indeks diskriminasi item, D Indeks diskriminasi item diperolehi dengan menolak bilangan calon yang menjawab dengan betul daripada kumpulan berpencapaian tinggi dengan bilangan calon yang menjawab dengan betul daripada kumpulan berpencapaian rendah, dibahagi dengan bilangan calon bagi kedua-dua kumpulan tersebut. Ini boleh digambarkan dalam formula berikut: NT D= - NR

___________ N/2

Di mana, NT = bilangan calon dari kumpulan tinggi yang memilih jawapan betul NR = bilangan calon dari kumpulan rendah yang memilih jawapan betul N = jumlah calon Contoh:
Kumpulan Rendah (27%) Omit A B C D E JUMLAH 0 2 10 2 11 11 36 Kumpulan Tinggi (27%) 0 0 0 0 26 10 36

*D adalah jawapan betul

Indeks diskriminasi = 26 11 ---------36 = 0.42

Lebih tinggi indeks diskriminasi lebih baik item tersebut dalam mendiskriminasi di antara pelajar yang baik dan pelajar yang lemah. Di mana pelajar yang baik sepatutnya dapat menjawab jawapan betul lebih daripada pelajar lemah bagi item tersebut. Bagi item yang di mana semua pelajar dapat memilih jawapan betul (nilai D=.0) atau item di mana semua pelajar tidak dapat memilih jawapan yang betul (nilai D=1.0) adalah merupakan item-item yang tidak dapat memberi apa-apa maklumat yang berguna tentang pencapaian pelajar. Bagi item yang nilai D adalah negatif, ini menunjukkan yang item tersebut mempunyai kesilapan-kesilapan tertentu. Indeks diskriminasi negatif mungkin berlaku apabila sesuatu item itu merangkumi bahan-bahan yang kompleks dan ditulis dengan cara dimana memerlukan kefahaman yang tinggi. Pelajar yang lemah mungkin meneka dan mendapat jawapan betul. Pelajar yang baik pula mungkin mempunyai pelbagai interpretasi atau penyelesaian masalah untuk menjawabnya dan akhirnya mungkin memilih jawapan yang salah.
Garispanduan Umum Indeks Diskriminasi

Nilai D 0.4 atau lebih 0.2 hingga 0.39 0.10 hingga 0.19 0 atau negatif Sumber: Ebel & Frisbie, 1986

Penjelasan Diskriminasi positif yang tinggi Diskriminasi positif yang sederhana Diskriminasi positif rendah Tiada kuasa dismriminasi

Cadangan Item disimpan dan boleh digunakan Kaji dan baiki Item ditulis semula Item dibuang

Langkah-langkah Analisis Item Ujian Bilik Darjah i. ii. Kertas jawapan diperiksa dan skor disusun mengikut skor rendah kepada yang tinggi Asingkan skor kepada dua kumpulan iaitu kumpulan berpencapaian tinggi dalam ujian (T) dan kumpulan berpencapaian rendah dalam ujian (R). Jumlah kedua-dua kumpulan memadai sebanyak 27% atau 25% sahaja daripada jumlah kesemua calon dalam kumpulan tersebut, sekiranya calon ramai. Bagi tiap-tiap item, tentukan bilangan yang tidak memilih sebarang jawapan (omit),bilangan calon yang memilih pilihan jawapan A,B,C,D,E. Sediakan jadual yang sesuai seperti berikut:

iii.

Kumpulan Rendah (27%) Omit A B C *D E JUMLAH *D adalah jawapan betul iv. 0 2 10 2 11 11 36

Kumpulan Tinggi (27%) 0 0 0 0 26 10 36

Kira indeks kesukaran item (nilai p) dan indeks diskriminasi item (nilai D) mengikut formula yang diberikan. Kemudian sediakan satu penjelasan analisis bagi setiap item.

Pengganggu (Distractors) Menganalisis pengganggu (pilihan jawapan salah) adalah berguna dalam menentukan kegunaan relatif pengganggu dalam setiap item. Indeks diskriminasi item perlu diperolehi bagi setiap item untuk menentukan keberkesanan pengganggu. Sepatutnya nilai diskriminasi bagi jawapan betul adalah positif dan nilai diskriminasi bagi pengganggu sepatutnya rendah atau negatif. Pengganggu perlu diteliti dengan betul apabila item menunjukkan nilai diskriminasi positif yang besar.

Di bawah adalah sampel analisis item yang menunjukkan ringkasan jadual untuk semua item dalam satu ujian objektif anika pilihan. Sila teliti kesukaran item (nilai p), indeks diskriminasi (nilai D) dan pengganggu (pilihan B E). Berdasarkan jadual analisis item di bawah, sila beri pandangan anda terhadap soalan-soalan berikutnya. Analisis Item (sampel 10 item) jawapan betul adalah A N = 932 ITEM 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. . . 40. Item atau item-item yang manakah yang boleh dibuang? Mengapa? Min = 69.4 p 0.72 0.90 0.60 0.99 0.94 0.77 0.47 0.12 0.08 0.35 D 0.34 0.21 0.39 -0.06 0.14 -0.01 0.31 0.08 0.04 0.42 Sisihan Piawai = 10.2 OMIT 1 1 0 0 0 0 3 8 0 0 A 667 840 561 923 876 716 432 114 75 330 B 187 1 233 3 0 16 107 218 64 98 Alfa = .84 C 37 76 46 3 12 25 68 264 120 74 D 30 9 88 3 24 35 165 153 67 183 E 10 5 4 0 20 140 157 175 606 247

Pengganggu-pengganggu yang manakah yang perlu disemak semula? Mengapa?

Item-item yang manakah yang berfungsi dengan baik?

RUMUSAN
Membina ujian yang sempurna adalah sesuatu yang mustahil. Walaupun garispanduan membina item yang betul dipatuhi, namun banyak faktor-faktor yang mempengaruhi persepsi pelajar tentang item-item ujian yang mereka cuba jawab. Namun, dengan melakukan item analisis dan melihat kesukaran dan diskriminasi item akan membantu penggubal soalan menentukan apakah kesilapan bagi tiap-tiap item

ujian. Analisis item dan ujian menyediakan data empirikal tentang bagaimana individu item dan seluruh ujian berfungsi dalam situasi ujian sebenar.

KATA KUNCI
Perancangan ujian Pembinaan ujian Jadual Spesifikasi Ujian Item objektif Item esei Analisis item

PENILAIAN KENDIRI
1. Apakah pertimbangan yang perlu diberi perhatian dalam merancang dan membina ujian? 2. Mengapakah perlunya disediakan Jadual Spesifikasi Ujian dalam merancang dan membina ujian? 3. Adakah dengan menambah bilangan item dalam ujian akan meningkatkan kesahan dan keboleh percayaan ujian? Mengapa? 4. Aras kesukaran dan indeks diskriminasi diperolehi dengan mengambil kira skor semua calon yang memberi respons kepada setiap item dalam ujian. Adakah kemungkinan bahawa aras kesukaran dan indeks diskriminasi akan berbeza mengikut kumpulan yang mengambil ujian yang sama?

RUJUKAN
Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New York: Mc-Graw Hill. Gronlund, N. E. (1998). Assessment of student achievement. 6th Edition. Boston: Allyn and Bacon

UNIT 3 PENAKSIRAN PRESTASI DAN AUTENTIK


HASIL PEMBELAJARAN
Di akhir unit ini anda akan dapat 1. 2. 3. 4. 5. 6. Menerangkan bagaimana penaksiran prestasi berbeza dengan pentaksiran tradisional Mengenalpasti bentuk-bentuk penaksiran prestasi Mengenalpasti kekuatan dan kekurangan penaksiran prestasi Menerangkan tatacara umum menjalankan penaksiran prestasi Menyediakan perancangan pemerhatian, merekod dan penskoran tugasan penaksiran prestasi Menggunakan portfolio untuk mengumpul, mempersembahkan/memaparkan dan menilai kerja-kerja pelajar

PENGENALAN
Penaksiran prestasi merupakan satu bentuk penaksiran yang berdasarkan kepada pemerhatian dan penilaian terhadap sesuatu proses atau produk hasil daripada pelaksanaan sesuatu tugasan (Stiggin, 1997, p.175). Oleh itu penaksiran prestasi meliputi kaedah pengujian yang begitu luas yang memerlukan pelajar menunjukkan kecekapannya atau pengetahuannya dengan memberikan jawapan yang tepat atau satu hasil produk yang baik. Menurut Linn dan Gronlund (1995, p.238), penaksiran prestasi kadang-kadang disebut juga sebagai penaksiran authentik. Penaksiran authentik lebih kepada penggunaan/amali terhadap sesuatu tugasan seperti yang dilakukan di dalam keadaan sebenarnya. Pada umumnya, ujian yang authentik harus mempunyai empat ciri: a. b. c. d. Soalan yang dibina mestilah benar-benar mewakili prestasi yang berlaku dalam keadaan sebenar Penekanan yang khusus hendaklah diberikan kepada pengajaran dan pembelajaran tentang kriteria yang harus digunakan Penaksiran kendiri memainkan lebih peranan berbanding dengan ujian konvensional Pelajar dikehendaki membentangkan dan mempertahankan kerja-kerja secara umum dan secara lisan untuk menentukan bahawa penguasaannya adalah benar.

Penaksiran prestasi adalah satu bentuk penaksiran yang memerlukan guru membuat penilaian terhadap pengetahuan, kemahiran dan ciri-ciri afektif pelajar. Di sini pelajar dikehendaki melakukan satu tugasan dan prestasi mereka melakukan tugasan itu akan ditaksir. Ia melibatkan

penaksiran pelajar dalam konteks tugasan di bilik darjah di mana pelajar dikehendaki melakukan sesuatu tugasan yang kompleks tetapi bererti, berdasarkan pengetahuan awal, pembelajaran semasa dan kemahiran yang relevan untuk menyelesaikan masalah yang sebenar atau authentik. Guru akan menentukan prestasi pelajar berdasarkan kepada kriteria yang telah ditetapkan dan dipersetujui bersama. Dalam pengajaran anda, sila senaraikan 3 contoh pentaksiran prestasi yang telah anda jalankan. 1. _____________________________________________________ 2.______________________________________________________ 3.______________________________________________________

ISI KANDUNGAN
Mengapa Penaksiran Prestasi?
Terdapat dua trend pendidikan yang menjadikan penaksiran prestasi diberi penekanan semula dalam aspek penilaian pelajar. Pertama, berkaitan dengan perubahan penekanan daripada ujian rujukan norma kepada ujian rujukan kriteria dalam penilaian pelajar dan penilaian bilik darjah yang memerlukan pengukuran yang lebih langsung tentang prestasi pelajar-pelajar. Jadi, sekiranya kita hendak menjelaskan kecekapan pelajar dalam melakukan sesuatu aktiviti atau kemahiran, maka penaksiran prestasi biasanya digunakan. Kedua, teori pembelajaran moden menekankan kepada perlunya memberi tumpuan kepada hasil pembelajaran yang lebih kompleks (misalnya, kemahiran menaakul dan berfikir), menggalakkan pelajar membuat projek yang komprehensif berasaskan kepada masalah sebenar, dan menggalakan pelajar melakukan aktiviti-aktiviti yang membolehkan mereka membina makna sendiri. Dengan ertikata lain, teori pembelajaran moden menyarankan penggunaan penaksiran prestasi terbuka sebagai asas kepada peningkatan pembelajaran. Penaksiran prestasi menyediakan cara yang sistematik untuk menilai kemahiran berfikir dan menaakul serta hasilnya yang tidak dapat diukur oleh ujian objektif dan esei yang biasa. Walaupun ujian dapat menyediakan data yang menunjukkan pelajar tahu melakukan sesuatu dalam keadaan-keadaan tertentu, penaksiran prestasi adalah perlu untuk menilai kemahirankemahiran sebenar yang sedang dilakukan. Kemahiran-kemahiran ini adalah penting dalam banyak mata pelajaran yang diajar di sekolah. Contohnya, dalam mata pelajaran Sains, mementingkan kemahiran menyelesaikan masalah dan kemahiran-kemahiran makmal; matapelajaran Matematik menumpukan kepada pelbagai jenis kemahiran penyelesaian masalah praktikal; mata pelajaran Bahasa pula menekankan kepada kemahiran berkomunikasi; matapelajaran kajian sosial mementingkan kemahiran melukis dan membina graf, peta dan sebagainya.

Apakah Ciri-ciri Penaksiran Prestasi?


Penaksiran prestasi ini mempunyai beberapa ciri seperti berikut: tugasan-tugasan yang berkait rapat dengan dunia sebenar

tugasan-tugasan yang lebih kompleks dan kurang berstruktur yang menggalakkan keaslian dan kemahiran berfikir serta mempunyai pelbagai cara penyelesaiannya masa yang lebih diperlukan untuk menilai ini berkaitan dengan kesukaran mereka bentuk tugasan, bentuk tugasan yang komprehensif dan masa yang lebih diperlukan untuk menilai hasil-hasil tugasan lebih banyak menggunakan judgment dalam memeriksa tugasan pelajar ini disebabkan tugasan yang kompleks, keaslian tugasan yang dihasilkan, dan dalam kes-kes tertentu terdapat pelbagai kemungkinan cara penyelesaian yang dikemukakan

Dan, apakah pula bentuk-bentuk tugasan yang sering digunakan dalam penaksiran prestasi? Biasanya bentuk-bentuk tugasan melibatkan: Menyelesaikan masalah yang realistik (contoh: bagaimana mencegah penyalahgunaan dadah di Malaysia) ii. Kemahiran-kemahiran lisan dan psikomotor tanpa produk (contoh: memberi ucapan, bertutur bahasa asing, menggunakan mikroskop, dan membaiki enjin) iii. Kemahiran penulisan dan psikomotor dengan produk yang dihasilkan (contoh: menulis laporan kajian, menulis cerita pendek, membina tempat letak buku) i. Bagaimana pemahaman anda setakat ini tentang penaksiran prestasi? Sila tuliskan satu ayat yang dapat menggambarkan pentaksiran prestasi sebagaimana yang anda faham. ___________________________________________________________________________ _________________________________________________

Kategori Penaksiran Prestasi


Jenis tugasan penaksiran prestasi boleh dibahagikan kepada dua kategori berdasarkan kepada objektif pengajaran yang dicakupinya. Bagi tugasan yang terhad dan mencakupi objektif pengajaran yang spesifik, penilaian ini dipanggil sebagai penaksiran prestasi terhad. Namun begitu terdapat juga tugasan yang komprehensif yang mencakupi beberapa objektif pengajaran, penilaian ini dipanggil penaksiran prestasi terbuka (extended). Penaksiran Prestasi Terhad Penaksiran prestasi terhad adalah lebih berstruktur dan terhad skopnya. Dengan menghadkan skop tugasan, memudahkan untuk dikaitkan dengan objektif-objektif tertentu, mentadbirkannya dan menilainya. Contohnya: Tulis satu muka surat laporan tentang lawatan ke muzium Bina graf daripada data-data yang diberi

Tunjukkan bagaimana menyediakan alat makmal

Penaksiran Prestasi Terbuka Penaksiran prestasi terbuka pula mempunyai skop tugasan yang lebih komprehensif dan tidak begitu berstruktur. Ini bagi membolehkan pelajar mempersembahkan kebolehannya dalam membuat tugasan atau menyelesaikan masalah yang berkait rapat dengan dunia sebenar. Dengan kata lain, kita boleh mendapatkan maklumat tentang kebolehan pelajar dalam mengenalpasti punca sebenar sesuatu masalah, mengumpul dan mengatur maklumat untuk menyelesaikan masalah dan menyediakan kesimpulan yang asli dan mantap. Dalam aspek kemahiran pula, penaksiran prestasi terbuka ini membolehkan kita menentukan bagaimana pelajar boleh mensepadukan beberapa kemahiran-kemahiran spesifik bagi melakukan pergerakan yang kompleks ataupun menghasilkan produk yang lebih baik dan canggih. Sesetengah projek pentaksiran prestasi terbuka menggabungkan ketiga-tiga jenis kemahiran: menyelesaikan masalah, komunikasi dan psikomotor bagi menghasilkan sesuatu produk. Antara contoh-contoh tugasan adalah seperti berikut: Reka bentuk dan jalankan eksperimen ke atas topik-topik yang disediakan dan persembahkan serta pertahankan dapatan kajian Baca sebuah novel dan tulis kritik ke atas novel tersebut Reka bentuk dan bina tempat letak buku dan tulis satu penilaian sama ada ia menepati kriteria-kriteria yang diberi

Projek penaksiran prestasi terbuka akan memberikan pelajar lebih kebebasan dalam memilih projek, bagaimana menjalankannya, membuat penilaian kendiri dan mempertahankan kualitinya. Perbincangan hasil kajian pelajar dengan guru biasanya menumpukan kepada kualiti projek serta penilaian kendiri yang dibuat oleh pelajar.

Langkah-langkah Melaksanakan Penaksiran Prestasi


Sekarang kita akan cuba melihat secara lebih terperinci bagaimana melaksanakan penaksiran prestasi. Secara umumnya terdapat lima langkah untuk melaksanakan penaksiran prestasi. Langkah-langkah tersebut adalah: Langkah I: Langkah II: Langkah III: Langkah IV: Langkah V: Langkah I: Menetapkan hasil prestasi Memilih fokus penilaian (prosedur, produk atau kedua-duanya) Memilih darjah realisme yang sesuai Memilih situasi tugasan Memilih metod pemerhatian, merekod dan memeriksa Menetapkan hasil prestasi atau hasil pembelajaran

Hasil prestasi yang hendak diukur perlu dikenal pasti dan didefinisikan. Hasil penaksiran prestasi terhad biasanya menggunakan perkataan-perkataan seperti kenalpasti, membina, menunjukkan dan lain-lain. Spesifikasi hasil prestasi termasuklah analisis tugasan bagi mengenalpasti faktor-faktor spesifik yang kritikal bagi prestasi yang hendak diukur. Pensampelan tugasan-tugasan yang sesuai adalah penting bagi menentukan pemerhatian dan

penilaian yang lebih tepat. Berikut adalah contoh-contoh bagi satu set tugasan-tugasan untuk penaksiran prestasi terhad:

i.

Kemahiran Dalam Membuat Laporan Secara Lisan: 1. 2. 3. 4. 5. 6. 7. 8. 9. Berdiri dengan cara yang natural Mengekalkan eye contact dengan baik Menggunakan ekspresi muka yang sesuai Menggunakan gerakbadan secara berkesan Bercakap dengan jelas dan nada yang terang Bercakap pada kadar kelajuan yang sesuai Mempersembahkan idea-idea dengan teratur Menggunakan bahasa yang sesuai Mengekalkan minat kumpulan

ii.

Membaiki Injin Rosak 1. 2. 3. 4. 5. 6. 7. 8. 9. Kenalpasti tahap kerosakan Kenalpasti sistem yang menyebabkan kerosakan Pilih ujian-ujian yang akan dilakukan Menjalankan ujian-ujian mengikut sekuen yang betul Mengenalpasti komponen-komponen yang tidak berfungsi Ganti atau baiki komponen Ubah dan ganti alatganti dengan sekuen yang sesuai Menggunakan alat-alat yang sesuai dengan cara yang betul Mematuhi peraturan-peraturan keselamatan sepanjang kerja-kerja membaiki

Dalam keadaan-keadaan tertentu, senarai tugasan-tugasan tidak perlu mengikut aturan-aturan tertentu (seperti dalam contoh pertama) dalam keadaan yang lain pula, terdapat langkahlangkah yang disusun mengikut sekuen supaya memudahkan dibuat pemerhatian dan penilaian (seperti dalam contoh kedua) Projek berbentuk penaksiran prestasi terbuka biasanya melibatkan pelbagai objektif pengajaran dan hasil pembelajaran. Bagi satu projek penyelidikan, hasil pembelajaran antaranya adalah seperti berikut: Memilih tugasan-tugasan kajian yang sesuai Menggunakan perpustakaan dengan berkesan Mengesan, menganalisis dan mensepadukan maklumat-maklumat yang relevan Mereka bentuk dan menjalankan eksperimen Menulis laporan kajian dengan tepat Menyatakan kesimpulan yang sah Menulis kritik tentang tatacara kajian dan dapatan kajian Mempersembahkan dan mempertahankan dapatan kajian dalam kelas

Hasil-hasil pembelajaran di atas perlu didefinisikan lagi dengan lebih spesifik. Menyatakan objektif umum dahulu dan kemudian menyatakannya dengan lebih spesifik adalah merupakan

tatacara yang berkesan. Dalam mendefinisikan setiap hasil pembelajaran utama, mungkin perlu dibahagikan kepada dua hasil pembelajaran (Misalnya: merekabentuk eksperimen, menjalankan eksperimen). Dalam kes-kes yang lain, mungkin digabungkan, seperti nyatakan kesimpulan yang sah boleh digabungkan sebagai sebahagian daripada Menulis laporan kajian dengan tepat. Yang pentingnya, senarai hasil pembelajaran utama perlu menyatakan deskripsi tentang apa yang pelajar boleh buat untuk menunjukkan pencapaian hasil pembelajaran. Langkah II: Memilih Fokus Penaksiran

Penaksiran prestasi boleh menumpukan kepada prosedur, produk atau gabungan keduaduanya. Menilai Prosedur Bagi jenis-jenis tugasan yang tidak menghasilkan produk, memerlukan tugasan tersebut dinilai semasa ianya dilakukan. Dalam banyak keadaan, kedua-dua prosedur dan produk merupakan aspek penting dalam sesuatu tugasan. Selalunya prosedur ditekankan pada tahap awal pembelajaran, dan kemudiannya produk, iaitu selepas prosedur telah dikuasai. Misalnya, dalam membaiki set television, memerlukan prosedur yang sistematik diikuti, sebelum dapat menghasilkan set television yang telah dibaiki. Perkara yang sama juga dijalankan dalam tugasan memasak, kerja pertukangan, melukis dan lain-lain lagi. Penilaian prosedur ini juga boleh digunakan di peringkat akhir pengajaran, dengan tujuan untuk mengesan kesilapankesilapan yang berlaku dalam prosedur yang boleh memberi kesan kepada kualiti produk. Secara amnya, fokus penaksiran prestasi ke atas prosedur bila: i. ii. iii. iv. Tiada produk atau penilaian produk tidak dapat dijalankan sukar didapati atau pun terlalu mahal Prosedur yang digunakan adalah teratur dan boleh dilihat dengan jelas Prosedur yang betul adalah penting untuk menentukan kejayaan dalam melakukan sesuatu Analisis ke atas langkah-langkah dalam prosedur boleh memberi panduan dalam meningkatkan produk

Menilai Produk Penaksiran prestasi perlu memberi fokus kepada produk apabila: i. ii. iii. iv. Prosedur-prosedur yang berbeza boleh menghasilkan produk yang sama mutunya Prosedur tidak dapat dilihat dengan jelas (misalnya: kerja rumah, penaakulan dalam menyelesaikan masalah matematik) Langkah-langkah dalam prosedur telah dikuasai Produk mempunyai kualiti yang boleh di kenal dan dinilai dengan jelas Memilih Darjah Realisme Yang Sesuai

Langkah III:

Autentik adalah merupakan satu darjah. Dalam konteks penaksiran prestasi, darjah kehampiran kepada realiti dunia (apa yang sebenarnya berlaku) adalah merupakan tumpuan

utama perkara-perkara yang hendak diukur. Soalnya, setakat manakah realisme yang perlu atau mampu diukur dalam penaksiran prestasi? Lebih hampir kepada realiti adalah lebih baik. Dalam konteks pengajaran dan pembelajaran, penggunaan kaedah simulasi boleh menunjukkan masalah yang dikemukakan itu mempunyai darjah realisme yang rendah atau tinggi. Misalnya dalam Matematik, penggunaan kemahiran matematik dalam memahami jumlah wang, boleh dilakukan dalam bentuk cerita (rendah darjah realisme) atau membeli barang-barang dalam situasi gerai (tinggi darjah realisme). Darjah realisme yang akan dipilih bagi satu-satu situasi bergantung kepada beberapa faktor. Pertamanya, perlu dipertimbangkan objektif pengajaran. Sama ada objektif pengajaran yang hendak dicapai itu merupakan objektif yang berbentuk memahami sesuatu fakta baru atau pun untuk menguasai sesuatu kemahiran. Keduanya, sekuen pengajaran mungkin mengikuti aturan yang memerlukan pengukuran dalam bentuk pensil dan kertas dahulu sebelum pengukuran berbentuk amali (hands-on). Ketiganya, beberapa kekangan seperti masa, kos, kemudahan peralatan, kesukaran untuk mentadbir dan memberi markah, mungkin akan mengurangkan darjah realisme yang akan diperolehi. Keempat, tugasan yang hendak dilakukan mungkin boleh mengurangkan darjah realisme dalam situasi ujian. Misalnya, dalam menilai kemahiran-kemahiran pertolongan cemas, adalah sukar untuk menggunakan pesakit sebenar yang mengalami kemalangan untuk menjadikan situasi penilaian itu lebih realistik. Langkah IV: Memilih Situasi Tugasan

Penaksiran prestasi boleh diklasifikasikan mengikut jenis situasi atau latar (setting) yang digunakan. Sistem klasifikasi berikut berdasarkan darjah realisme yang terdapat dalam satusatu situasi: i. Tugasan Kertas dan Pensil Tugasan kertas dan pensil berbeza daripada ujian kertas dan pensil tradisional yang menekankan kepada aplikasi pengetahuan atau kemahiran dalam situasi yang telah ditetapkan (simulated setting). Aplikasi kertas dan pensil ini mungkin menghasilkan hasil pembelajaran yang diharapkan atau ia mungkin boleh dijadikan sebagai langkah ke arah tugasan yang melibatkan darjah realism yang lebih tinggi (misalnya, penggunaan alat yang sebenar). Dalam beberapa keadaan, tugasan kertas dan pensil boleh menyediakan produk yang mempunyai signifikan dari segi pendidikan. Kursus dalam pembinaan ujian, misalnya memerlukan pelajar melaksanakan aktiviti-aktiviti seperti berikut: Bina satu set Jadual Penentuan Ujian bagi satu ujian pengajaran Bina item-item ujian yang sesuai dengan Jadual Penentuan Ujian Bina satu senarai semak untuk menilai ujian pencapaian Perkataan bina selalu digunakan dalam ujian prestasi kertas dan pensil. Misalnya, pelajar mungkin disuruh membina peta cuaca, graf, pelan lantai, mereka bentuk pakaian, puisi, cerita pendek atau rancang satu percubaan. Dalam kes ini, produk kertas dan pensil adalah hasil daripada kedua-dua pengetahuan dan kemahiran. Dalam lain-lain kes, tugasan kertas dan pensil mungkin merupakan langkah pertama kearah tugasan hands-on. Misalnya, sebelum menggunakan alat ukuran tertentu,

seperti mikrometer, mungkin sesuai sekiranya pelajar mempelajari pelbagai ukuran daripada gambar-gambar. Walaupun kebolehan membaca skala tidak mencukupi untuk pengukuran yang tepat, tetapi ia adalah sesuatu yang perlu. Dalam keadaan yang lain pula, sekiranya prestasi tersebut agak kompleks dan peralatannya mahal, menjalankan tugasan dalam situasi kertas dan pensil mungkin boleh mengelakkan kemalangan ataupun kerosakan kepada peralatan tersebut. ii Ujian Identifikasi Ujian identifikasi terdapat dalam pelbagai situasi dan pelbagai darjah realisme. Dalam setengah keadaan, pelajar mungkin diminta untuk mengenalpasti sejenis alat dan jelaskan fungsinya. Dalam keadaan yang lebih kompleks, pelajar akan diberi tugasan seperti mengenalpasti litar pintas dan meminta pelajar mengenal pasti alat dan tatacara yang sesuai untuk membaikinya. Jenis ujian identifikasi yang lebih kompleks lagi mungkin melibatkan mendengar kepada mesin yang tidak berfungsi dengan baik, dan dari bunyinya, pelajar diminta mengenalpasti punca-punca yang menyebabkan mesin tersebut tidak berfungsi dengan baik. Walaupun ujian identifikasi luas digunakan dalam pendidikan industri, ia juga digunakan dalam mata pelajaran-mata pelajaran lain. Guru biologi misalnya boleh meminta pelajar mengenalpasti spesimen-spesimen yang diletakkan di beberapa stesen di dalam bilik atau mengenalpasti peralatan dan prosedur yang diperlukan untuk menjalankan percubaan. Guru bahasa juga misalnya boleh meminta pelajar mengenal pasti sebutan yang betul, guru matematik pula boleh meminta pelajar mengenal pasti prosedur menyelesai masalah yang betul. Mengenal pasti prosedur yang betul juga penting dalam pendidikan seni, muzik, pendidikan jasmani dan bidangbidang vokasional seperti pertanian, perdagangan dan ekonomi rumah tangga. iii. Ujian Prestasi Berstruktur Ujian prestasi berstruktur ini dijalankan dalam keadaan yang terkawal dan pelajar diminta melaksanakan sesuatu tugasan mengikut prosedur dan nilai tara yang setara. Misalnya, memasang mikroskop, mematuhi prosedur keselamatan dalam menghidupkan enjin, atau mengesan kerosakan pada alat elektronik. Pembinaan ujian prestasi berstruktur lebih kurang sama seperti membina lain-lain ujian pencapaian. Namun begitu, biasanya jarang sesuatu keadaan itu dapat dikawal dan disetarakan sepenuhnya, di samping mengambil masa lebih untuk menyedia dan mentadbirnya serta selalunya agak sukar untuk diperiksa. Untuk meningkatkan situasi ujian yang terkawal dan setara untuk semua pelajar, arahan-arahan yang jelas perlu diberikan terutama tentang situasi ujian dan tugasan yang akan dijalankan. Arahanarahan untuk mengesan peralatan elektronik yang rosak, misalnya, termasuk perkaraperkara berikut: i. Tujuan ujian ii. Peralatan yang disediakan iii. Prosedur ujian a. Jenis dan keadaan peralatan b. Deskripsi prestasi yang dikehendaki c. Had masa serta lain-lain keadaan

iv. Metod dalam menilai prestasi Bila menggunakan ujian prestasi, adalah perlu ditentukan nilai tara prestasi yang menunjukkan tahap minima prestasi yang boleh diterima. Ini mungkin berkaitan dengan ketepatan (ch: mengukur suhu kepada darjah dua persepuluh yang paling hampir), mengikut urutan langkahlangkah yang betul (ch: ubah mikroskop mengikut urutan langkah-langkah yang betul), mengikut prosedur sepenuhnya (ch: periksa semua safety guard sebelum menghidupkan mesin), atau kelajuan prestasi (ch: kesan kerosakan peralatan elektronik dalam masa tiga minit). Di antara nilai tara yang biasa digunakan untuk menilai prestasi adalah seperti berikut: Jenis Kadar Contoh Selesaikan sepuluh masalah campur dalam masa dua minit Taip 40 perkataan seminit Tidak lebih daripada dua kesilapan bagi satu muka surat yang ditaip Kira sebanyak 20 dalam Bahasa Arab tanpa kesilapan Sediakan peralatan makmal dalam masa lima minit Kesan kerosakan peralatan dalam masa tiga minit Baca thermometer sehingga darjah dua persepuluh Lengkapkan 20 percubaan makmal Kesan 15 rujukan yang relevan Tulis surat perniagaan yang kemas Persembahkan bentuk yang betul dalam penerjunan

Kesilapan

Masa Kepersisan (precision) Kuantiti Kualiti

iv.

Persembahan berbentuk Simulasi Bertujuan untuk memadankan persembahan dengan situasi sebenar sama ada secara keseluruhan atau sebahagian Contoh: Pendidikan Jasmani: memukul bola, berenang, pukulan tenis Sains sosial: simulasi perbicaraan, mesyuarat, latihan penerbangan Kemahiran yang ditunjukkan dalam situasi berbentuk simulasi menandakan kesediaan pelajar untuk melakukan tugasan sebenar

v.

Sampelan Kerja/Tugasan

Memerlukan pelajar melakukan tugasan sebenar yang mewakili keseluruhan tugasan yang diukur. Sampelan tugasan biasanya termasuk elemen yang paling penting dalam keseluruahn tugasan dan dilakukan dalam keadaan yang terkawal Contoh: Menaip surat Menggunakan komputer dalam menganalisis data Membaiki alat vi. Projek penyelidikan Jenis penaksiran yang paling komprehensif. Melibatkan kombinasi beberapa kemahiran dan proses berfikir dalam menyelesaikan masalah, menghasilkan produk atau kedua-duanya sekali Contoh: Mengenalpasti masalah Menjalankan kajian Menulis laporan Merekabentuk dan membina produk Mempertahankan hasil kajian Langkah V: Memilih Metod Pemerhatian, Merekod dan Menskor

Terdapat beberapa prosedur digunakan untuk menilai prosedur, produk atau kedua-dua prosedur dan produk. Di antara prosedur yang sering digunakan: i. Pemerhatian Bersistematik Bagi tugasan yang kecil/mudah, pemerhatian secara informal mungkin boleh dijalankan. Bagi tugasan yang lebih komprehensif, pemerhatian perlu lebih bersistematik bagi meningkatkan keobjektifan dan kegunaannya kemudian. Pemerhatian biasanya dibantu oleh senarai semak atau skala kadar ii. Rekod Anekdot Deskripsi ringkas tentang sesuatu peristiwa yang signifikan. Ia termasuk tingkahlaku yang diperhatikan, latar di mana tingkahlaku berlaku dan interpretasi tentang peristiwa. Rekod akan lebih bermakna apabila: iii. Ia menumpukan kepada peristiwa/perkara yang bermakna Ia direkodkan sebaik sahaja insiden selesai Ia mengandungi maklumat yang mencukupi untuk mudah difahami kemudian Perlakuan yang diperhatikan dan interpretasinya diasingkan

Senarai Semak

Merupakan senarai dimensi prestasi atau produk yang boleh diukur dan mempunyai ruang untuk merekod penilaian ya atau tidak. Sekiranya senarai semak digunakan untuk menilai satu set prosedur, misalnya, langkahlangkah yang diikuti mungkin diletakkan dalam urutan pangkatan dalam borang; pemerhati akan menyemak sama ada setiap tindakan telah diambil atau tidak. Senarai semak untuk menilai produk pula biasanya mengandungi senarai ciri-ciri produk yang baik seperti saiz, warna, bentuk dan lain-lain serta terdapat ruang untuk merekod sama ada setiap ciri yang dikehendaki ada atau tidak. iv. Skala kadar Skala kadar adalah sama dengan senarai semak dan mempunyai tujuan yang sama iaitu untuk menilai prosedur dan produk. Perbezaan yang utama adalah skala kadar menyediakan peluang untuk menandakan darjah berdasarkan skala tertentu. Skala untuk pengkadaran biasanya berasaskan kepada kekerapan sesuatu tindakan itu dilaksanakan (contoh: selalu, kadang-kadang, tidak pernah), kualiti sesuatu prestasi (contoh: cemerlang, kepujian, sederhana, lemah) atau satu set frasa deskripotif yang menandakan darjah penerimaan prestasi (contoh: menyelesaikan tugasan dengan cepat, lambat dalam menyelesaikan tugasan, tidak dapat menyelesaikan tugasan tanpa bantuan. Anda mungkin telah pernah menjalankan penaksiran prestasi, cuba anda berikan LIMA faedah yang boleh diperolehi melalui penaksiran prestasi: i. ii. iii. iv. v. __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ __________________________________________________________________

Penskoran dan Penggredan Penaksiran Prestasi Pada asasnya terdapat dua pendekatan penskoran yang lazim digunakan dalam penaksiran prestasi penskoran analitik dan penskoran holistik. i. Penskoran Analitik

Penilaian ke atas setiap kriteria yang digunakan untuk mentaksir tugasan/produk Contoh: Skala kadar ii. Penskoran Holistik

Berasaskan pandangan keseluruhan sesuatu tugasan/produk daripada elemen-elemen spesifik. Penskoran boleh berpandukan kepada rubrik yang menjelaskan tentang kualiti bagi setiap tahap/kriteria yang digunakan

Untuk tujuan pengajaran, kedua-kedua bentuk penskoran adalah berguna. Sekiranya keduaduanya digunakan, penskoran secara holistik perlu dibuat dahulu supaya sesuatu elemen yang spesifik tidak menjejaskan pandangan kepada keseluruhan produk.

Rubrik Penskoran Rubrik merupakan satu panduan atau format untuk melakukan satu penaksiran bagi sesuatu perkara. Rubrik kerap digunakan di dalam pentaksiran kerja kursus. Dalam sesuatu penggredan yang menggunakan rubrik, ia menjelaskan tentang penskoran bagi sesuatu tahap pencapaian atau jawapan yang pelajar kemukakan. Rubrik digunakan untuk mentaksir secara analitik atau pun secara holistik. Rubrik analitik: Digunakan apabila penaksiran memerlukan maklumat terperinci yang boleh menunjukkan kelemahan dan kekuatan pelajar. Ia biasanya digunakan apabila prestasi yang ditaksir adalah more than the sum of its parts (contohnya prestasi mengajar dan pengucapan awam). Rubrik analitik mempunyai kesahan dan kebolehpercayaan yang lebih tinggi. Rubrik holistik: Digunakan apabila penaksiran hanya memerlukan gambaran keseluruhan prestasi dengan komponen yang secukupnya sahaja bagi membolehkan pengukuran yang konsisten dijalankan. Kedua-dua jenis rubrik boleh digunakan bersama-sama di mana rubrik analitik dijadikan panduan untuk menilai secara holistik.

Contoh penskoran yang menggunakan rubrik adalah seperti berikut: Gred A B C D E Poin 5 4 3 2 1 Maknanya Cemerlang Telah menguasai semua objektif utama dan minor. Dapat memberikan hujah yang baik dan berkesan Baik Telah menguasai semua objektif utama dan kebanyakan objektif minor. Dapat memberikan hujah dengan baik. Memuaskan Hampir menguasai semua objektif utama tetapi masih memerlukan bantuan dalam objektif minor. Dapat memberikan hujah dengan memuaskan. Lemah Memerlukan lebih bimbingan daripada guru. Perlu menguasai separuh daripada objektif utama dan sedikit objektif minor. Hujah yang diberikan masih belum cukup memuaskan. Kurang Memuaskan Belum lagi menguasai ssebarang objektif utama yang telah ditetapkan. Jika terdapat item betul pun adalah disebabkan bernasib baik, pelajar mungkin kurang faham kuliah yang diberikan. Hujah yang diberikan adalah lemah.

Pada umumnya rubrik penskoran boleh dibahagikan kepada tiga jenis. a. Holistik dan analitik

Pemilihan dibuat secara umum tentang sesuatu prestasi. Rubrik yang holistik mempunyai label-label kecekapan yang berkaitan dengannya seperti: cekap, lemah, cemerlang dan sebagainya. Manakala analitik pula merupakan rubrik yang lebih terperinci daripada holistik. Kriteria yang disediakan adalah lebih kemas.

b.

Perkembangan dan kuantitatif

Rubrik ini dibina untuk memanjangkan aras gred atau jarak kecekapan di atas satu kontinuum. Kuantiti merujuk kepada penggunaan skala kadar (rating) yang telah didefinisikan dalam angka dan digunakan secara holistik atau analitik. c. Umum dan spesifik

Satu set kategori kriteria dibentuk untuk semua tugasan kerap menggunakan rubrik holistik. Manakala rubrik yang tertentu dibina untuk tugasan yang tertentu sahaja seperti dalam soalan jawapan pendek atau soalan terbuka.

Portfolio
Kita akan cuba membincangkan satu contoh penaksiran prestasi yang banyak digunakan dalam mentaksir pembelajaran pelajar iaitu portfolio. Portfolio telah didefinisikan dalam pelbagai bentuk. Secara umumnya, portfolio A portfolio is more than just a container full of stuff. Its a systematic and organized collection of evidence used by the teacher and student to monitor growth of the students knowledge, skills, and attitudes in a specific subject area Vavrus, 1990, ms.48 Berdasarkan definisi di atas, bolehlah dikatakan bahawa portfolio merupakan proses mendokumentasi pembelajaran merentas masa bagi menunjukkan progres pelajar dan mengajar mereka melalui pentaksiran kendiri, penyuntingan, dan penambahbaikan tugasan. Bahan-bahan yang biasanya terdapat di dalam sesebuah portfolio termasuklah penulisan jurnal, penulisan reflektif, ulasan rakan sebaya, hasil kerja seni, gambar rajah, nota pelajar, draf dan penulisan yang siap. Bagi portfolio yang mempunyai ciri yang baik mestilah: Mengandungi bahan terpilih sahaja Menunjukkan progres pembelajaran Sistematik dan tersusun Menunjukkan bukti bimbingan yang diterima daripada ibu bapa, guru, dan rakan sebaya Menunjukkan bukti kerja kolaboratif dan interaksi dengan rakan sebaya

Menunjukkan bukti hasil pemikiran kritis dan kreatif

Membina portfolio Secara umumnya, langkah-langkah membina portfolio adalah seperti berikut: 1. Kenalpasti bidang kemahiran dan pengetahuan yang pelajar perlu bina 2. Tentukan hasil pembelajaran yang perlu pelajar capai berdasarkan bidang ini 3. Kenalpasti indikator prestasi yang menunjukkan pelajar telah mencapai hasil pembelajaran dan nyatakan bukti yang pelajar perlu kumpulkan 4. Kumpulkan bukti yang menunjukkan pelajar telah mencapai indikator prestasi tersebut 5. Susun bukti ini dalam satu portfolio supaya penilai mudah memahami bagaimana bukti dikaitkan dengan setiap indikator prestasi Mengurus dan mengguna portfolio Pelajar adalah terlibat secara aktif dalam mengurus dan menjaga portfolio. Oleh kerana portfolio adalah merupakan koleksi kerja pelajar, maka mereka perlu dibimbing tentang apa yang perlu dimasukkan ke dalam portfolio, dalam memilih sampel kerja dan dalam menilai perkembangan pembelajaran sebagaimana yang digambarkan dalam sampelan kerja tersebut. Porfolio akan disemak secara berkala semasa konferen pelajar-guru yang memberi peluang kepada pelajar dan guru membandingkan penilaian mereka serta membincangkan kekuatan dan kelemahan pembelajaran serta aspek-aspek yang memerlukan penambahbaikkan. Portfolio juga digunakan semasa konferen ibubapa-guru untuk mempersembahkan perkembangan pembelajaran pelajar berdasarkan bukti-bukit hasil kerja yang konkrit.

RUMUSAN
1. 2. Penaksiran prestasi mementingkan darjah realisme tugasan serta mengukur tugasan yang lebih kompleks dibandingkan dengan ujian pensil dan kertas Penaksiran prestasi terhad biasanya adalah lebih berstruktur dan terhad skopnya serta merangkumi hasil pembelajaran yang spesifik yang hendak diukur. Sedangkan penaksiran prestasi terbuka kurang berstruktur, lebih terbuka dan luas skopnya serta boleh merangkumi beberapa hasil pembelajaran dalam satu-satu tugasan Fokus penaksiran prestasi adalah kepada mentaksir produk, proses atau keduaduanya sekali Terdapat pelbagai darjah realisme dalam penaksiran prestasi, dan matlamatnya adalah untuk mendapatkan setinggi darjah realisme yang mungkin dalam kekangan yang terdapat seperti kekangan masa, kos, kelengkapan, instrumen dan lain-lain Langkah-langkah melaksanakan penaksiran prestasi bermula dengan mendefinisikan hasil pembelajaran; diikuti dengan memilih fokus penaksiran (prosedur, produk atau kedua-dua); seterusnya memilih darjah realisme tugasan yang sesuai; memilih situasi tugasan; dan akhirnya memilih metod pemerhatian, merekod dan menskor. Beberapa teknik pemerhatian yang biasa digunakan adalah seperti pemerhatian berstruktur, rekod anekdot, senarai semai dan skala kadar. Penskoran penaksiran prestasi boleh dilakukan secara analitik atau pun secara holistik dengan menggunakan rubrik penskoran yang sesuai. Portfolio merupakan satu contoh pentaksiran prestasi yang sering digunakan untuk mentaksir progress pembelajaran pelajar dengan meneliti hasil kerja pelajar dalam

3. 4. 5.

6. 7. 8.

satu tempoh masa. Portfolio menekankan kekuatan pembelajaran pelajar, pembentukan penilaian kendiri serta penglibatan aktif pelajar dalam proses pengajaran dan pembelajaran.

Kuiz Sila jawab soalan-soalan berikut: 1. Dalam mentaksir kebolehan pelajar mengesan kerosakan enjin kereta berdasarkan kriteria yang telah ditetapkan, Cikgu Rama telah membawa pelajar-pelajarnya ke sebuah bengkel yang berhampiran dengan sekolah. Dengan bantuan mekanik di bengkel tersebut, Cikgu Rama telah meminta pelajar-pelajar nya mengesan jenis kerosakan pada enjin kereta yang terdapat di bengkel tersebut Tindakan Cikgu Rama ini menunjukkan yang beliau A. B. C. D. 2. ingin memberi peluang kepada pelajar-pelajarnya bekerja di bengkel kereta mementingkan darjah realisme pentaksiran yang dilakukannya cuba untuk mengelakkan pelajar-pelajar yang nakal membuat bising di kelas ingin membezakan pentaksiran bilik darjah dan pentaksiran persembahan

Penaksiran prestasi dikatakan sebagai penaksiran alternatif atau penaksiran autentik dan tergolong dalam bentuk-bentuk penaksiran yang sedang dikembangkan dalam paradigma penaksiran pada masa ini. Kenyataan ini menggambarkan bahawa penaksiran prestasi I. II. III. IV. A. B. C. D. mementingkan penaksiran ke atas kebolehan berfikir aras tinggi bersesuaian dengan paradigma pembelajaran konstruktivisme boleh menggantikan penaksiran tradisional yang menekankan pengukuran saintifik adalah merupakan sebahagian daripada proses pengajaran dan pembelajaran I & II sahaja 111 & IV sahaja I, II & III sahaja I, II & IV sahaja

3.

Salah satu objektif pengajaran Geografi yang hendak dicapai oleh Cikgu Lily adalah seperti berikut: "Membolehkan pelajar mengumpul maklumat, menganalisis maklumat dan membuat laporan daripada lawatan yang diadakan ke kawasan perkampongan orang asli".

Untuk mengukur kemahiran-kemahiran tersebut, jenis penaksiran yang paling sesuai digunakan oleh Cikgu Lily adalah A. B. C. D. 4. Penaksiran prestasi terbuka Penaksiran prestasi terhad Ujian Subjektif Ujian Objektif

Penaksiran prestasi dilaksanakan dengan mengikut langkah-langkah yang sesuai bagi mempastikan penaksiran tersebut dapat mengukur dengan tepat pengetahuan dan kemahiran yang hendak diukur. Berikut adalah langkah-langkah yang biasa digunakan dalam menjalankan penaksiran prestasi: I. II. III. IV. V. Memilih situasi tugasan Memilih fokus penaksiran (prosedur, produk atau kedua-duanya) Memilih metod pemerhatian, merekod dan memeriksa Menetapkan hasil tugasan Memilih darjah realisme yang sesuai

Pada pandangan anda, susunan langkah-langkah yang manakah yang paling sesuai untuk menjalankan penaksiran prestasi yang berkesan? A. B. C. D. 5. I, II, III, IV, V II, III, I, IV, V III, I, II,V, IV IV,II,V,I,III

Dibandingkan dengan bentuk-bentuk penaksiran lain, portfolio sebagai metod penaksiran merupakan satu cara yang terbaik untuk A. B. C. D. merakamkan tingkahlaku autentik menggantikan penaksiran berbentuk ujian pensel-kertas berkomunikasi tentang apa yang pelajar sebenarnya tahu mengesahkan skor-skor ujian yang diperolehi daripada bentuk-bentuk penaksiran lain

6.

Kekuatan portfolio sebagai metod penaksiran pelajar yang menjadi tarikan kepada guru-guru menggunakannya adalah A. B. C. D. kebolehpercayaan yang tinggi keberkesanan tinggi dan menjimatkan masa keseragaman tugasan untuk tujuan penggredan kemudahan untuk guru mengintegrasikannya dengan pengajaran

7.

Untuk tujuan pemberian gred, penilaian sesuatu portfolio paling baik dilakukan dengan menggunakan A. penilaian rakan sebaya

B. C. D.

penilaian kendiri pelajar kriteria pemarkahan holistik kriteria pemarkahan analitik

8.

Portfolio sangat berguna dalam konferen antara guru-ibubapa. Ia menyediakan maklumat tentang perkembangan pembelajaran pelajar kepada ibubapa berserta dengan A. B. C. D. rekod kerja pelajar yang lengkap skor yang boleh dipercayai dan mudah difahami contoh-contoh konkrit tentang pencapaian pelajar gred bagi setiap sampelan kerja yang dimasukkan dalam portfolio

9.

Di antara ciri-ciri penting penaksiran autentik adalah A. B. C. D. Penaksiran kendiri dibuat seiring dengan ujian konvensional Penekanan kepada soalan yang memerlukan pelajar menghafal fakta Soalan atau tugasan yang dibina menggambarkan apa yang berlaku dalam keadaan sebenar Pelajar dikehendaki membentangkan dan mempertahankan secara lisan untuk menentukan bahawa penguasaan nya adalah benar

JAWAPAN: 1. 2. 3. 4. 5. 6. 7. 8. 9. B D A D C D C C C

KATA KUNCI
Penaksiran prestasi Penaksiran autentik Penaksiran alternatif Penaksiran rujukan kriteria Penaksiran proses Darjah realisme Kemahiran berfikir aras tinggi Portfolio

PENILAIAN KENDIRI
1. Apakah perbezaan asas di antara penaksiran tradisional dan penaksiran prestasi? 2. Mengapakah penaksiran prestasi lebih merupakan penaksiran rujukan kriteria? 3. Dalam sistem penaksiran di sekolah didapati penaksiran prestasi kurang diberikan tumpuan, mengapa? 4. Apakah ciri-ciri yang ada pada penaksiran portfolio yang sesuai dengan kriteria penaksiran prestasi?

RUJUKAN
Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New York: Mc-Graw Hill. Gronlund, N.E., (1998). Assessment of Student Achievement, 6 th ed., Boston:Allyn & Bacon

Kesahan dan Kebolehpercayaan |1

UNIT 4 KESAHAN DAN KEBOLEHPERCAYAAN


HASIL PEMBELAJARAN
Di akhir unit ini, anda seharusnya dapat: Menghuraikan maksud kesahan (validity) dan kebolehpercayaan (reliability). Menjelaskan kepentingan kesahan dan kebolehpercayaan dalam pentaksiran pendidikan. Menjelaskan beberapa kaedah bagi menganggarkan kebolehpercayaan dan kesahan. Menghuraikan faktor-faktor yang mempengaruhi kesahan dan kebolehpercayaan. Menjelaskan langkah-langkah yang perlu diambil untuk mempertingkatkan kesahan dan kebolehpercayaan.

PENGENALAN

Berat badan saya hanya 52 kg, bukan 59 kg. Semua alat penimbang lain menunjukkan bacaan 51.5 atau 52 kg. Alat penimbang ini memberi bacaan yang berbeza-beza. Pagi tadi berat badan saya 55 kg, tapi sekarang 59 kg pula. Saya rasa alat penimbang ini rosak! Bob, 10 tahun. Rajah 1: Ilustrasi contoh penggunaan konsep kesahan dan kebolehpercayaan

Cerita dalam Rajah 1 tadi biasa kita dengar, malah sebahagian daripada kita juga mungkin pernah mengalaminya. Peristiwa tersebut boleh meninggalkan kesan yang besar kepada sesetengah orang. Dalam cerita di atas, Bob berkemungkinan menjadi murung dan enggan menjamah makanan beberapa hari sehingga beliau jatuh sakit.

Kesahan dan Kebolehpercayaan |2 Hal yang sama juga boleh berlaku apabila ramai pelajar yang berpencapaian tinggi gagal dalam satu ujian penting disebabkan oleh kualiti ujian. Kejadian ini akan mencetuskan beberapa persoalan yang meragui kualiti ujian yang dibina guru. Ia juga boleh menurunkan konsep kendiri pelajar dalam subjek tersebut dan berkemungkinan membawa kepada kesan negatif yang tidak diingini. Guru pula mungkin akan dipanggil oleh pengetua sekolah untuk menjelaskan pertanyaan yang datang bertubi-tubi daripada ibu bapa pelajar. Sebagai guru, apakah yang boleh kita lakukan untuk mengelakkan kejadian seperti itu? Mari kita membuat sedikit refleksi. Pernahkah anda membina soalan ujian sebelum ini? Kalau anda pernah mengajar, tentu sekali anda berpengalaman membina soalansoalan ujian atau peperiksaan akhir tahun. Cuba ingat kembali, bagaimana kebiasaannya anda membina soalan-soalan tersebut? Apakah anda membina sendiri soalansoalan ujian secara individu atau berkumpulan, atau mengambil terus soalan daripada bukubuku komersial yang ada di pasaran? Adakah kita duduk berbincang bersama guru lain dan meneliti soalan satu persatu untuk menentukan kesesuaian dan aras kemahiran yang berkaitan dengan setiap soalan? Mengapa kita perlu melakukan semua proses tersebut? Anda mungkin berkata, Saya dah mengajar lebih 10 tahun. Semua pengetahuan dihujung jari. Saya boleh sediakan 40 soalan objektif dalam setengah jam sahaja. Saya tak perlu buat semua tu.. Tunggu, selepas menyelesaikan modul ini, saya yakin persepsi anda akan berubah. Sekarang mari kita meneliti konsep kesahan dan kebolehpercayaan dan bagaimana kita boleh mengaplikasi konsep ini untuk mempertingkatkan kualiti ujian yang kita bina.

ISI KANDUNGAN
Apakah Kesahan?

esahan adalah berkaitan kesesuaian. Ia bermaksud instrumen yang digunakan mestilah benar-benar mengukur apa yang ingin diukur. Dalam penyelidikan, instrumen yang digunakan perlulah mempunyai kesahan dan kebolehpercayaan yang tinggi agar hasil atau dapatan kajian tersebut boleh diterima pakai, seterusnya syor yang dicadangkan boleh dipertimbang untuk dilaksanakan. Sebaliknya jika kesahan dan kebolehpercayaan rendah, hasil kajian tersebut tidak boleh diterima seterusnya syor tidak boleh dipertimbangkan walaupun kaedah analisis data yang sofistikated digunakan.

alam pentaksiran pendidikan pula, soalan ujian yang dibina perlulah sesuai, iaitu ujian tersebut benar-benar mengukur apa yang ingin kita ukur. Ujian yang mempunyai kesahan yang tinggi membolehkan hasil ujian tersebut ditafsir seterusnya penilaian boleh dibuat berdasarkan hasil ujian tersebut. Sebaliknya pula jika kesahan ujian rendah, hasil daripada ujian tersebut tidak dapat ditafsir secara bermakna, seterusnya penilaian yang dibuat berdasarkan ujian tersebut juga tidak bermakna.

Kesahan dan Kebolehpercayaan |3 Contohnya jika kita ingin mengukur kemahiran pelajar menyediakan apron dalam subjek Kemahiran Hidup, bagaimanakah bentuk ujian yang anda fikir paling sesuai untuk mencungkil kemahiran tersebut? Adakah anda akan memberi mereka ujian objektif, ujian esei, atau ujian amali? Apakah item tugasan atau soalan-soalan yang perlu diberi untuk membolehkan pelajar melahirkan kemahiran membuat apron tersebut? Cuba fikirkan dan tulis jawapan anda dalam ruang berikut: _________________

Cikgu Anis memilih untuk memberi ujian objektif untuk mengukur kemahiran menyediakan apron tersebut bagi memudahkan beliau memeriksa jawapan. Pada fikiran anda, adakah soalan objektif sesuai untuk mengukur kemahiran tersebut? _________________ Anda mungkin menjawab Ya, sebab soalan yang berkaitan dengan teori boleh ditanya dalam soalan objektif. Benar, kita boleh mengukur pengetahuan mereka tetapi tidak kemahiran mereka seperti kemahiran menggunting dan menjahit. Cikgu Lim pula mungkin memilih untuk memberi soalan esei bagi mengukur kemahiran tersebut. Adakah soalan esei sesuai? __________________ Anda mungkin menjawab Ya. Lebih baik daripada soalan objektif sebab pelajar berpeluang menulis dengan perkataan sendiri langkah-langkah kerja, melakar pelan, dan menerangkan setiap langkah dengan jelas dari mula hingga akhir. Benar, tetapi kita masih belum dapat melihat hasil yang sebenar. Bolehkah mereka menggunting dan menjahit dengan baik? Cikgu Linda pula mungkin memilih untuk member ujian amali bagi mengukur kemahiran membuat apron tersebut. Adakah ini sesuai? __________________ Sekali lagi anda mungkin menjawab, Ya. Kita dapat lihat bagaimana cara pelajar merancang dan membuat pelan, menggunting kain, menjahit, dan seterusnya kita boleh melihat kualiti apron yang terhasil.

Jadi soalan jenis mana harus dipilih. Kesemuanya kelihatan sesuai ada yang agak sesuai juga, lebih sesuai, dan sangat sesuai. Kita perlulah memilih yang paling sesuai, kerana ia akan menentukan kesahan yang tinggi. Sebenarnya, kesahan berkaitan dengan darjah kesesuaian. Messick (1989) mendefinisikan kesahan sebagai penilaian tentang sejauhmana bukti empirikal dan hujah teori menyokong kecukupan dan kesesuaian inferens yang dibuat berdasarkan skor ujian atau bentuk pentaksiran yang lain.

Kesahan dan Kebolehpercayaan |4

Bagaimana Menganggarkan Kesahan?

erdapat beberapa jenis kesahan yang boleh digunakan untuk menunjukkan instrumen atau ujian yang kita bina mempunyai bukti kesahan yang mencukupi. Antara yang utama adalah seperti berikut:

Kesahan Kandungan : Untuk menentukan sejauhmana sampel tugasan ujian mewakili apa yang ingin diukur. Di sini kita perlu membandingkan item ujian atau tugasan dengan objektif atau spesifikasi domain tugasan yang ingin diukur. Proses ini dilakukan ketika membina Jadual Penentu Ujian (JPU). Oleh sebab itu, kesahan kandungan sebenarnya sudah dipenuhi bila kita membina JPU. Kesahan Konstruk : Untuk menentukan sejauhmana pencapaian dalam ujian boleh ditafsir sebagai penting atau bermakna untuk mengukur kualiti yang ingin diukur. Berguna untuk pembolehubah berbentuk konsep dan tidak dapat diukur dengan mudah seperti kecerdasan, kebimbangan, dan personaliti. Dalam kaedah ini, kita perlu menentukan terlebih dahulu ciri-ciri atau indikator untuk menunjukkan kualiti yang ingin diukur. Contohnya bagi mengukur tahap sosio-ekonomi (SES), indikator yang boleh digunakan termasuklah tahap pendidikan; pendapatan; jenis pekerjaan; bilangan tanggungan; perbelanjaan; harta dimiliki; dan kawasan tempat tinggal. Bagi mengukur kemahiran penakulan sains dan penyelesaian masalah pula, indikator yang boleh dipertimbangkan termasuklah kebolehan menerangkan alasan di sebalik idea; menganalisis perkaitan menggunakan graf, carta,atau jadual; menyelesaikan soalan yang tiada langkah penyelesaian yang jelas atau serta merta; menghuraikan pemerhatian; serta menyusun objek atau peristiwa dalam urutan dan menyatakan sebab.

Kesahan Kriterion : Untuk menentukan sejauhmana pencapaian dalam ujian yang dibina
boleh meramalkan pencapaian pada masa depan (kriterion ramalan); atau sejauhmana ia berkait dengan pencapaian ujian lalu yang telah diakui kesahannya (kriterion ramalan); atau ujian lain lain pada masa yang sama (kriterion semasa). Caranya ialah dengan membandingkan prestasi dalam kedua-dua ujian dan dapatkan pekali korelasi bagi kedua-dua ujian tersebut. Kesahan Pakar : Untuk menentukan sejauh mana pencapaian dalam ujian boleh ditafsir sesuai untuk mengukur kualiti yang ingin diukur berdasarkan pandangan pakar-pakar dalam bidang tersebut. Dalam kaedah ini, instrumen yang telah dibina ditunjukkan kepada sekumpulan pakar untuk diteliti dan diniliai. Jika instrumen tersebut mendapat persetujuan pakar-pakar, kesahan pakar telah dipenuhi. Kesahan Muka : Kesahan ini merujuk kepada format dan pandangan kasar tentang ujian tersebut. Sekali pandang ujian kelihatan mengukur kandungan (kemahiran/ pengetahuan/nilai) yang hendak diukur kepada kumpulan sasaran. Walau bagaimanapun, kesahan jenis ini sahaja tidak mencukupi untuk menentukan kualiti ujian.

Kesahan dan Kebolehpercayaan |5

Bagaimanakah kita boleh menentukan kaedah atau jenis yang mana untuk digunakan?
Jawapannya mengikut kesesuaian, bergantung kepada jenis instrumen atau alat ukur yang kita bina. Jika kita ingin membina ujian bagi melihat pencapaian pelajar dalam subjek tertentu atau pencapaian peserta dalam kursus tertentu, kesahan kandungan dan kesahan kriterion boleh digunakan untuk menganggar kesahan ujian tersebut. Sekiranya kita ingin membina instrumen berbentuk soal selidik untuk mengukur suatu kualiti yang abstrak pula, kesahan konstruk dan kesahan pakar mungkin lebih sesuai.

Cuba fikirkan beberapa contoh kualiti abstrak yang tidak boleh diukur secara langsung, sebaliknya memerlukan kita membina konstruk tertentu dan mengenalpasti indikator yang berkaitan. o o o o o Personaliti_____________ _____________________ _____________________ _____________________ _____________________

Rujuk kepada Lampiran A4.1. Lampiran tersebut merupakan satu ujian mengandungi 5 item untuk subjek nuclear perubatan. Jawab semua soalan tersebut dan rekodkan jawapan anda dalam ruangan berikut.

1. 2. 3. 4. 5.

__________ __________ __________ __________ __________


Pada pendapat anda, adakah tersebut sesuai untuk mengukur pencapaian sains pelajar Tingkatan 2?

Apakah Faktor-faktor Yang Mempengaruhi Kesahan?


Kesahan akan menjadi rendah jika item ujian kurang baik, iaitu item tidak dapat mengukur dengan tepat kemahiran atau pengetahuan yang ingin diukur. Berikut adalah antara faktor yang boleh menyebabkan kesahan menjadi rendah dan perlu dielakkan: Item tugasan tidak sesuai untuk mengukur kemahiran yang ingin diukur Arahan kurang jelas Soalan kabur

Kesahan dan Kebolehpercayaan |6 Penggunaan perbendaharaan kata yang sukar difahami pelajar Masa menjawab soalan atau menyelesaikan tugasan tidak mencukupi Bilangan item tidak mencukupi Susunan jawapan item objektif boleh diramal

Apakah Kebolehpercayaan?
Kita mungkin pernah mendengar dialog seperti ini: Saya tidak percaya macamana saya boleh mendapat markah 25/40 sahaja bagi Bahagian Esei dalam Ujian Sains bulan Mac. Jawapan saya hampir sama dengan jawapan Aishah, tapi dia mendapat 36 markah. Cikgu Nora mungkin silap memberi markah. Saya telah meminta Cikgu Jaya yang mengajar Sains Tingkatan 4 Melati pula memeriksa kertas jawapan saya, dan saya memperolehi 33 markah.

ebanyakan kamus mendifinisikan kebolehpercayaan daripada sudut kebergantungan atau darjah keyakinan terhadap sesuatu. Walau bagaimanapun, dalam konteks pengukuran, kebolehpercayaan merujuk kepada ketekalan atau kestabilan (consistency) hasil pengukuran. Kita ingin mengetahui sejauhmana keputusan ujian konsisten jika ditadbirkan pada salah satu daripada keadaan berikut: o ditadbirkan kepada kumpulan yang sama pada waktu yang berbeza; atau o ditadbirkan kepada kumpulan yang berlainan; atau o jawapan calon yang sama diperiksa oleh guru yang berlainan. Dalam contoh di atas, Cikgu Nora dan Cikgu Jaya telah memberi markah yang berbeza kepada kertas jawapan murid yang sama. Pada pendapat anda, mengapakah hal tersebut boleh berlaku? ____________________________________________________________________ _____________________________________________________________________ ______________________________________________

Bagaimana Menganggarkan Kebolehpercayaan?

erdapat beberapa jenis kebolehpercayaan yang boleh digunakan untuk menunjukkan instrumen atau ujian yang kita bina mempunyai bukti kebolehpercayaan yang mencukupi. Antara yang utama adalah seperti berikut:

Bentuk Belah Dua (Split-Half) Kaedah ini biasa digunakan untuk mengukur ketekalan dalaman. Satu ujian dibahagikan kepada dua sub-ujian melalui kaedah berikut: Item ganjil Bentuk A, Item genap - Bentuk B; atau Item disusun mengikut aras kesukaran. Kemudian, kelompokkan item, contohnya Item ganjil Bentuk A, Item genap Bentuk B; atau

Kesahan dan Kebolehpercayaan |7 Item dikelompokkan kepada Bentuk A dan Bentuk B berdasarkan tugasan yang sepadan. Setiap murid akan memperolehi 2 skor, satu untuk jumlah skor bagi item Bentuk A dan satu lagi jumlah skor bagi item Bentuk B. Akhirnya dua set skor (Bentuk A dan B) akan diperolehi bagi semua pelajar dan pekali korelasi akan dihitung. Nilai pekali korelasi yang tinggi menunjukkan ketekalan dalaman yang tinggi bagi ujian tersebut. Kebohpercayaan ujian akan dianggar menggunakan formula berikut: Bentuk A
36 27 32 25 .. .. ..

Bentuk B
39 28 30 27 .. .. ..

Amin Nawi Rozy

Kebolehpercayaan, rxx =

2r1/2,1/2 -------------------1 + r1/2,1/2 yang mana rxx = kebolehpercayaan ujian r1/2,1/2 = korelasi antara dua sub-ujian (Bentuk A dan B)

Menggunakan Kovarian Item Dalam kaedah ini, ketekalan dalaman dianggarkan dengan menggunakan formula: Pekali alpha Formula Kuder-Richardson

Formula Cronbach alpha:


Kebolehpercayaan, = k i2 ------- ( 1 - ----- ) ; yang mana k1 x2

k = bilangan item i2 = jumlah varian bagi setiap item x2 = varian bagi keseluruhan ujian berkenaan

Kesahan dan Kebolehpercayaan |8

Formula Kuder-Richardson 20:


Digunakan untuk item dengan jawapan betul/salah. Kebolehpercayaan, k pq ------- ( 1 - ----- ); yang mana k1 r2 p = perkadaran calon yang dapat jawapan betul; (0<p<1) q = perkadaran calon yang dapat jawapan salah (1-p) 2 r = varian bagi jumlah skor k = bilangan item KR20 =

Formula Kuder-Richardson 21:


Kebolehpercayaan, KR20 = k ------- ( 1 k1 m(k-m) ----------- ); yang mana ks2

k = bilangan item dalam ujian m = min ujian s2 = varian ujian

Kaedah Uji dan Ulang Uji (Test-Retest) Ujian yang sama ditadbirkan kepada kumpulan pelajar yang sama dalam dua masa yang berbeza. Dapatkan pekali korelasi (r) bagi dua set skor tersebut. Ujian 1 Lim Rais Ravi
76 77 62 55 .. .. ..

Ujian 2
78 78 63 54 .. .. ..

Kesahan dan Kebolehpercayaan |9 Kaedah Bentuk Setara (Equivalent Form) Dua ujian yang berlainan tetapi setara dari segi aras kemahiran dan kandungan diberi kepada pelajar. Dapatkan pekali korelasi (r) antara bagi dua skor tersebut. Ketekalan antara Pemeriksa (Inter-rater Reliability) Ketekalan skor yang diberi oleh beberapa orang pemeriksa atau pakar. Dalam kaedah ini, jika dua orang atau lebih pemeriksa memberi skor yang sama atau hampir sama, ujian dikatakan mempunyai kebolehpercayaan yang tinggi. Kaedah ini tidak sesuai bagi soalan objektif yang mempunyai satu jawapan tepat.

Faktor Yang Mempengaruhi Kebolehpercayaan


Panjang ujian atau bilangan item. Lebih banyak item atau lebih panjang ujian, lebih tinggi kebolehpercayaan. Kepelbagaian kebolehan individu dalam kumpulan. Kumpulan kebolehpercayaan lebih tinggi berbanding kumpulan homogen. heterogen

Kebolehan pelajar yang mengambil ujian. Jika item terlalu sukar pelajar akan meneka jawapan menyebabkan ketekalan keputusan rendah. Kaedah atau prosedur yang digunakan untuk menganggar kebolehpercayaan. Contoh Kebolehpercayaan yang diperolehi daripada kaedah bentuk setara biasanya lebih rendah berbanding prosedur uji dan ulang uji atau bentuk belah dua. Pembolehubah yang diukur. Kebolehpercayaan umumnya lebih tinggi bila kita mengukur pengetahuan atau kemahiran berbanding sikap atau nilai. Contohnya mengukur pencapaian akademik keputusan biasanya lebih konsisten berbanding sahsiah atau sikap. Jenis ujian. Kebolehpercayaan bagi ujian objektif biasanya lebih tinggi berbanding ujian esei disebabkan panjang ujian dan juga perbezaan antara pemeriksa. Skema pemarkahan yang jelas boleh membantu mengurangkan perbezaan antara pemeriksa seterusnya mempertingkatkan kebolehpercayaan ujian.

Hubungan antara Kesahan dan Kebolehpercayaan


Ujian perlu mempunyai kesahan dan kebolehpercayaan yang tinggi supaya keputusan daripada ujian tersebut boleh ditafsir dengan tepat. Kesahan akan menentukan sejauhmana ujian yang dibina menepati matlamat, manakala kebolehpercayaan pula memastikan ketekalan dalam pengukuran pencapaian murid dalam ujian tersebut.

K e s a h a n d a n K e b o l e h p e r c a y a a n | 10 Kebolehpercayaan menjadi pra-syarat kepada kesahan, tetapi kebolehpercayaan sahaja belum mencukupi untuk memastikan kesahan. Ujian yang sah semestinya mempunyai kebolehpercayaan, tetapi ujian yang mempunyai kebolehpercayaan tidak semestinya sah. Perkaitan ini digambarkan dalam rajah berikut:

Konsisten tetapi tidak sah (tidak menepati sasaran)

Tidak sah dan tidak konsisten

Sah dan konsisten

Rajah 2: Hubungan antara kesahan dan kebolehpercayaan Sumber: http://www.doe.k12.de.us/aab/files/rel_val_19991109.pdf

RUMUSAN

erdasarkan apa yang telah kita bincangkan dalam Unit ini, apakah yang boleh anda rumuskan tentang kebolehpercayaan dan kesahan?

_________________________________________________________________

_________________________________________________________________________ ____________________________________________________________________ Berikut adalah beberapa rumusan yang boleh dibuat: Pengertian kesahan : o Berkaitan kesesuaian (appropriateness). o Sejauhmana instrumen/ujian mengukur objektif pembelajaran yang ingin diukur. o Menentukan sejauhmana hasil penilaian itu boleh digunakan. o Spesifik untuk tujuan tertentu sahaja. o Melibatkan penilaian darjah kesesuaian

K e s a h a n d a n K e b o l e h p e r c a y a a n | 11 Kaedah menentukan kesahan : o Kesahan kandungan o Kesahan kriterion o Kesahan konstruk o Kesahan pakar o Kesahan muka

Faktor-faktor yang mempengaruhi kesahan :


o o o o o o o Item tugasan tidak sesuai untuk mengukur kemahiran yang ingin diukur Arahan kurang jelas Soalan kabur Penggunaan perbendaharaan kata yang sukar difahami pelajar Masa menjawab soalan atau menyelesaikan tugasan tidak mencukupi Bilangan item tidak mencukupi Susunan jawapan item objektif boleh diramal

Kebolehpercayaan
o o Berkaitan ketekalan, kestabilan (consistency) hasil pengukuran. Menunjukkan sejauhmana keputusan ujian konsisten jika ditadbirkan pada salah satu daripada berikut: ditadbirkan kepada kumpulan yang sama pada waktu yang berbeza; atau ditadbirkan kepada kumpulan yang berlainan; atau jawapan calon yang sama diperiksa oleh guru yang berlainan.

Kaedah menentukan kebolehpercayaan : o Kaedah belah dua o Kaedah kovarian item o Kaedah uji dan ulang uji o Kaedah bentuk setara o Ketekalan pemeriksa Faktor yang mempengaruhi kebolehpercayaan : o Panjang ujian atau bilangan item. o Kepelbagaian kebolehan individu dalam kumpulan. o Kebolehan pelajar yang mengambil ujian. o Kaedah atau prosedur yang digunakan untuk menganggar kebolehpercayaan. o Pembolehubah yang diukur. o Jenis ujian. Hubungan antara kebolehpercayaan dan kesahan o Kebolehpercayaan menjadi pra-syarat kepada kesahan, tetapi kebolehpercayaan sahaja belum dapat memastikan kesahan. o Ujian yang sah semestinya mempunyai kebolehpercayaan, tetapi ujian yang mempunyai kebolehpercayaan tidak semestinya sah.

K e s a h a n d a n K e b o l e h p e r c a y a a n | 12

KATA KUNCI
1. 2. 3. 4. 5. 6. 7. 8. Kesahan Kebolehpercayaan Ketekalan Konsisten Kesesuaian Ketekalan dalaman Bentuk belah dua Ketekalan antara pemeriksa 9. Kesahan kandungan 10. Kesahan kriterion 11. Kesahan konstruk 12. Kesahan pakar 13. Kesahan muka 14. Uji dan ulang uji 15. Bentuk setara 16. Korelasi

PENILAIAN KENDIRI
Uji kefahaman anda dengan menjawab soalan-soalan berikut: 1. Semasa menentukan kesahan berasaskan kriterion semasa, Cikgu Abby mendapati pekali korelasi (r) antara skor bagi ujian matematik dan sains bagi 93 orang pelajar Tingkatan 2 di sekolahnya ialah +1.25. Dapatan ini menunjukkan A. B. C. D. perhubungan antara skor matematik dan sains sangat kuat. terdapat kesilapan dalam pengiraan pekali korelasi (r). * perhubungan antara skor matematik dan sains adalah positif. pelajar yang mendapat skor tinggi dalam sains juga mendapat skor tinggi dalam matematik.

2.

Data berikut diperolehi daripada satu kajian tentang faktor yang mempengaruhi kepuasan kerja daripada persepsi pekerja dan majikan yang dibuat di Hulu Langat, Selangor. Didapati pekali korelasi (r) antara ranking oleh pekerja dan majikan ialah -.75. Faktor manakah yang paling banyak menyumbang kepada pekali korelasi yang negative tersebut? Faktor P. Penghargaan dan pujian Q. Gaji memuaskan R. Kerja menarik S. Suasana kerja yang baik T. Kebajikan pekerja dijaga U. Kenaikan gaji berdasarkan merit V. Jaminan pekerjaan Urutan Kepentingan (Ranking) Majikan Pekerja 1 2 3 4 5 6 7 6 3 1 5 7 4 2

A. B. C. D.

Faktor P dan T Faktor R dan U Faktor P dan V * Faktor R dan V

K e s a h a n d a n K e b o l e h p e r c a y a a n | 13 3. Semenjak beberapa tahun lalu, ujian M-TeSt digunakan untuk tapisan memasuki program perguruan di Institut Perguruan di seluruh negara. Sekumpulan penyelidik menyiasat korelasi antara keputusan ujian M-TeST dan gred purata kumulatif (PNGK) pelajar di akhir pengajian mereka. Prosedur tersebut adalah berkaitan dengan penentuan A. B. C. D. 4. kebolehpercayaan ujian kesahan kriterion * keobjektifan ujian kualiti ujian

Jadual Penentu Ujian (JPU) disediakan dengan tujuan untuk I. memastikan ujian mengandungi perwakilan yang mencukupi bagi tajuk-tajuk dalam kandungan sukatan. II. memastikan soalan mengandungi pelbagai aras kemahiran. III. menentukan kesahan kandungan. IV. memastikan soalan ujian tidak terlalu mudah atau terlalu sukar. A. B. C. D. I dan III sahaja. I, II dan III sahaja.* IV sahaja. I, II, III dan IV.

5.

Dari aspek manakah ujian esei lebih baik daripada ujian objektif? A. Perwakilan kandungan yang lebih menyeluruh mengikut topik. B. Kesahan muka yang lebih tinggi. C. Kebolehpercayaan ujian yang lebih tinggi. D. Mengukur kebolehan penyelesaian masalah yang melibatkan pelbagai kemahiran dan pengetahuan dengan lebih berkesan. *

6.

Manakah daripada ujian esei berikut yang mungkin mempunyai kebolehpercayaan paling tinggi? A. B. C. D. Satu soalan dengan 500 patah perkataan. Dua soalan dengan 250 patah perkataan setiap satu. Lima soalan dengan 100 patah perkataan setiap satu. * Kebolehpercayaan soalan essei sukar dianggarkan.

7.

Melissa mendapat markah 75 dalam satu ujian geografi di sekolahnya baru-baru ini. Rumah gurunya ditenggelami air dan semua kertas jawapan turut musnah. Melissa dan rakan-rakannya dikehendaki mengambil ujian tersebut sekali lagi pada keesokan harinya. Kali ini Melissa mendapat 75 markah juga. Apakah kesimpulan yang boleh dibuat berdasarkan keputusan ujian Melissa? A. Terdapat bukti yang menunjukkan keputusan ujian geografi tersebut boleh dipercayai. * B. Terdapat bukti yang menunjukkan keputusan ujian geografi tersebut TIDAK boleh dipercayai.

K e s a h a n d a n K e b o l e h p e r c a y a a n | 14 C. Tiada bukti yang boleh digunakan untuk membuat penilaian tentang kebolehpercayaan ujian geografi tersebut. D. Keputusan ujian tersebut menunjukkan bukti kesahan yang tinggi. 8. Dalam satu penilaian personaliti menggunakan skala kadar, Cikgu Nora memberi skor yang tinggi kepada Elly yang menunjukkan Ella seorang pelajar popular di kalangan rakan-rakannya. Pembantu guru di kelas tersebut pula memberi skor yang rendah menunjukkan Elly sukar bekerjasama dalam tugasan kumpulan. Hal ini menunjukkan A. keputusan pengukuran tersebut tidak boleh dipercayai. * B. keputusan pengukuran tersebut boleh dipercayai, tetapi sukar diinterpretasi. C. tiada bukti yang boleh digunakan untuk membuat penilaian tentang kebolehpercayaan pengukuran tersebut. D. keputusan pengukuran tersebut menunjukkan bukti kesahan yang rendah.

9.

Manakah antara berikut paling tepat menggambarkan kesahan? A. Kesahan menerangkan sama ada proses pengumpulan data konsisten dalam mengukur apa yang diukur. B. Kesahan menerangkan sama ada proses pengumpulan data mempunyai aras kesukaran yang sesuai. C. Kesahan adalah berkaitan dengan keseragaman prosedur pentadbiran, pemarkahan, dan interpretasi data. D. Kesahan menerangkan sama ada proses pengumpulan data benar-benar mengukur apa yang sepatutnya diukur. *

10.

Pengetua SMK Keembong menerima aduan daripada ibu bapa yang tidak berpuas hati dengan kualiti Peperiksaan Percubaan Sains PMR yang dikatakan mengandungi terlalu banyak soalan daripada tajuk fizik, sedangkan daripada tajuk Kimia dan Biologi tidak mencukupi. Setelah disiasat, aduan tersebut didapati benar. Manakah antara ciri-ciri ujian berikut yang kurang memuaskan? A. B. C. D. Kesahan criterion. Kebolehpercayaan bentuk setara. Kesahan kandungan. * Ketekalan dalaman.

JAWAPAN
1. 2. 3. 4. 5. B C B B D 6. 7. 8. 9. 10. C A A D C

K e s a h a n d a n K e b o l e h p e r c a y a a n | 15

RUJUKAN
Rujukan Utama
Linn, R.L. & Miller, D. E.(2005). Measurement and Assessment in Teaching ( 9th ed.). New Jersey: Prentice-Hall, Inc. Reynolds, C. R., Livingston, R. B., and Willson, V. (2009). Measurement and assessment in education. New Jersey: Pearson Education, Inc.

Rujukan Tambahan
Abu Bakar Nordin, (1995). Penilaian Afektif. Kajang, West Malaysia: Masa Bhasah Abu Bakar, (2003). Asas Pengukuran Bilik Darjah. Tanjong Malim, West Malaysia : Quantum Books. Cunningham, G.K. (1998). Assessment in the Classroom. London : Falmer Press. Hopkins, K.D. (1998). Educational and Psychological Measurement and Evaluation ( 8th ed.). Needham Heights : Allyn & Bacon. Linn, R.L. & Gronlund, N.E.(2000). Measurement and Assessment in Teaching ( 8th ed.). New Jersey: Prentice-Hall, Inc. Notes on Reliability and Validity of the Delaware Student Testing Program, http://www.doe.k12.de.us/aab/files/rel_val_19991109.pdf, retrieved on 21 Feb 2011. Popham, W.J. (1999). Classroom Assessment. Boston : Allyn & Bacon. Payne, D.A. (1997). Applied Educational Assessment. London : Wadsworth Pub. Company. Reynolds, C. R., Livingston, R. B., and Willson, V. (2006). Measurement and assessment in education. New Jersey: Pearson Education, Inc. Sax, G. (1997). Principles of Educational and Psychological Measurement and Evaluation (4th ed.). Belmont : Wadsworth Pub. Company. Tan Hui Leng & Ee Ah Meng, (1996). Penilaian dalam Proses Pendidikan. Kulala Lumpur: Fajar Bakti. Ward, A.W. (1999). Assessment in the Classroom. Belmont : Wadsworth Pub. Co.

K e s a h a n d a n K e b o l e h p e r c a y a a n | 16

K e s a h a n d a n K e b o l e h p e r c a y a a n | 17

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |1

UNIT 5 PENSKORAN, PENGGREDAN, PENTAFSIRAN DAN PELAPORAN


HASIL PEMBELAJARAN
Di akhir unit ini, anda diharap dapat: 1. Menganalisis dan mentafsir skor. 2. Menggunakan hasil penilaian untuk menambah baik pengajaran. 3. Menghuraikan cara melapor kepada pelajar, ibu bapa dan pihak lain.

PENGENALAN

Murid takut hendak tunjukkan kad laporan kepada bapa

Rajah 5.1 Kesan gred dan pelaporan kepada murid dan bapa

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |2

Pernahkah anda berada dalam situasi murid di atas? Pernahkah juga anda merasakan bahawa diri anda tidak cukup tepat digambarkan melalui penaksiran yang menggunakan sekeping kad sahaja?

dakah anda tahu bahawa gred yang guru berikan kepada murid sangatlah besar kesannya kepada pembelajaran murid. Selain gred yang terdapat di dalam kad laporan murid, bagaimana pelaporan prestasi murid itu didokumenkan adalah penting. Adakah pelaporan itu bersifat objektif, telus dan mempunyai kebolehpercayaan? Adakah pelaporan itu bersifat berterusan? Adakah pelaporan itu juga bersifat professional? Iaitu bertujuan untuk menggalakkan pembelajaran terus berlaku dengan lebh maju. Mari kita bayangkan beberapa keadaan dalam masyarakat kita. Pertama, Halim adalah seorang murid yang pandai tetapi dia seorang yang cepat panik dan amat gementar apabila hendak menduduki peperiksaan.bertulis. Walaupun semasa dalam kelas, Halim dapat menjawab dan mengikuti pelajaran dengan baik tetapi keputusan gred peperiksaannya sentiasa kurang baik. Kedua, Bapa Rudy seorang yang panas baran dan sentiasa menghendaki Rudy memperoleh gred A dalam semua mata pelajarannya di sekolah. Ketiga, Sarah seorang yang pasif, tidak suka bercakap dan tidak mempunyai ramai kawan, dia hanya menghabiskan masanya dengan membaca dan tidak berinteraksi dengan orang lain. Bagaimanapun gred peperiksaan Sarah adalah cemerlang. Bila anda sudah selesai memahami ketiga-tiga situasi berkenaan, buat refleksi dengan menjawab soalan berikut: Adakah gred yang diperoleh menggambarkan prestasi sebenar murid-murid itu? Adakah berkemungkinan gred yang mereka perolehi akan menimbulkan , kemurungan, salah laku seperti menipu dalam peperiksaan atau kesombongan? Adakah pelaporan gred murid-murid tersebut membantu murid belajar dengan cemerlang dan mencapai matlamat pembelajaran untuk menghasilkan individu yang seimbang dari segi jasmani, emosi, rohani, intelek dan sosial?

ISI KANDUNGAN
Apa itu penskoran?
Sebelum kita mempelajari berkenaan penggredan, kita akan melihat dahulu apa itu penskoran. Penskoran sangat berkait rapat dengan pengukuran. Di dalam bilik darjah, contoh pengukuran yang paling lazim ialah apabila guru memberikan skor selepas sesuatu ujian atau kuiz dijalankan. Penskoran ialah proses memberi skor kepada jawapan murid. Iaitu penskoran menghasilkan satu huraian prestasi dalam bentuk numerik. Terdapat dua kaedah penskoran iaitu penskoran holistik dan penskoran analitik. Penskoran holistik melihat yang keseluruhan itu adalah lebih besar daripada jumlah kesemua bahagian yang terlibat. Ia melihat hubungan dan saling kaitan di antara kesemua bahagian yang terlibat. Seandainya mana-mana

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |3

satu bahagian itu didapati sangat lemah, keseluruhan prestasi berkemungkinan akan terjejas dengan teruk.Oleh kerana itu, penskoran holistik biasanya dilakukan selepas penskoran analitik serta memperoleh maklumat daripada penskoran analitik. Penskoran analitik boleh membantu seseorang guru daripada terlepas pandang akan ciri-ciri yang sepatutnya merupakan faktor penting yang patut dimasukkan dalam penskoran holistik. Dengan lain perkataan,penskoran holistik menggambarkan pandangan keseluruhan, misalnya sebuah karangan, dengan memberikan satu skor sahaja. Manakala penskoran analitik melihat sebuah karangan itu terdiri daripada banyak bahagian, dan memberikan skor berasingan bagi setiap bahagian. Penskoran analitik memberikan maklumbalas yang mendalam untuk pelajar menambahbaik aspek berbeza dalam karangan mereka. Dengan kata lain,penskoran analitik bermaksud menjumlahkan kesemua markah setiap satu bahagian. Penskoran analitik mempunyai dua tujuan. Pertamanya, ia membimbing guru untuk menumpukan perhatian ke atas perkara-perkara yang relevan. Keduanya ialah untuk menyediakan maklum balas yang spesifik kepada pelajar untuk membantu mereka dalam membuat persediaan.

Apakah langkah-langkah untuk memastikan penskoran dibuat secara objektif? Isikan carta alir di bawah bagi menunjukkan secara ringkas langkah-langkah untuk memastikan penskoran dibuat secara objektif, sama ada seseorang guru menggunakan penskoran holistik maupun analitik.

Rajah 5.2 Carta alir menunjukkan langkah-langkah utama penskoran secara objektif

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |4

Selepas mengetahui bahawa terdapat dua kaedah penskoran iaitu holistik dan analitik, mari kita melihat jenis-jenis skor yang ada. Dua jenis skor yang dikenalpasti ialah skor mentah dan skor terbitan. Mungkin anda pernah dengar kedua-dua istilah ini. Oleh itu,tuliskan satu atau dua ayat sendiri, apakah yang dimaksudkan dengan skor mentah dan skor terbitan
___________________________________________________________________________

____________________________________________________________________________

__________________________________________________________________________________

Perhati semula jawapan yang anda telah tulis, adakah sama dengan huraian di bawah.

Skor mentah ialah jumlah poin yang diperolehi pelajar atau bilangan jawapan yang betul. Contohnya: 1. Dua puluh huruf abjad dapat dinamakan dengan betul. 2. Empat puluh poin diperolehi dalam ujian pengetahuan am. Skor mentah dan skor peratusan adalah sangat serupa. Contohnya: 1. Sembilan puluh peratus daripada100 soalan telah dijawab dengan betul. 2. Tujuh puluh lapan peratus daripada soalan sains itu dijawab dengan betul. Jikalau anda menyatakan skor mentah adalah sama dengan skor peratusan, ia adalah benar bila bahan dikenalpasti dengan jelas. Contohnya, Sam dapat menamakan semua huruf abjad dengan betul atau Nora menjawab 80% daripada soalan matematik dengan betul. Bagaimanapun, apabila tugasan yang perlu dilakukan dikenalpasti dengan eksplisit, skor mentah mempunyai makna yang jelas tetapi tidak selalunya jelas bagi skor peratusan. Contohnya, Rohani menamatkan larian 200 meter dalam 12 saat. Skor terbitan ialah skor yang dimodifikasi atau ditukar daripada skor mentah. Kedua-dua skor mentah dan skor peratusan tidak menunjukkan status rujukan norma. Supaya prestasi calon boleh dibandingkan dengan kumpulan atau orang lain, skor mentah perlu ditukar kepada skor terbitan.

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |5

Skor terbitan mutlak dan skor terbitan relatif (norma) adalah dua jenis skor terbitan. Bagi skor terbitan mutlak, lazimnya skor diberikan sebagai perbandingan prestasi murid berasaskan satu standard yang telah ditentukan lebih awal, iaitu selalunya menggunakan sistem 100-poin. Manakala skor terbitan relatif ialah skor yang membandingkan prestasi murid berdasarkan prestasi ahli kumpulan. Apabila anda sudah memahami apakah itu penskoran, langkah seterusnya anda perlu memahami apakah penggredan. Cuba anda huraikan apakah yang ada tahu mengenai penggredan dengan menulisnya di ruangan yang disediakan. ____________________________________________________________________________ _________________________________________________________________________ __________________________________________________________________________________

Apa itu penggredan?

agi menjawab soalan tersebut, mari kita mendefinisikan istilah penggredan. Penggredan ialah proses memberi gred ke atas jawapan atau skor murid dan biasanya gred diberi dalam bentuk abjad. Gred yang akan diberikan kepada murid sepatutnya melambangkan sejauh mana objektif pengajaran dan pembelajaran telah dicapai, dan sepatutnya selari dengan polisi sekolah atau negara. Jika penaksiran yang dijalankan mengandungi pelbagai kaedah seperti penaksiran konvensional dan penaksiran autentik, maka masalah untuk menggred ialah bagaimana untuk merumuskan koleksi maklumat-maklumat yang berbeza ini hanya dengan menggunakan satu gred huruf atau laporan ringkas sahaja. Tahukah anda bahawa terdapat dua jenis penggredan? Iaitu penggredan rujukan norma dan penggredan rujukan kriteria. Penggredan rujukan kriteria menyatakan prestasi seseorang yang dibandingkan dengan kriteria piawai yang telah ditetapkan terlebih dahulu. Misalnya, menaip pada kadar 37 perkataan seminit . melakukan CPR, menggunakan peralatan yang disediakan, dengan cara yang telah dihuraikan. Supaya penggredan jenis ini berguna, kriteria yang bermaksud asas perbandingan atau pemerolehan satu kontinum ilmu, daripada tiada kecekapan langsung kepada satu prestasi yang sempurna (Glaser, 1963, dalam Hanna & Dettmer, 2004). Ia bukan bermaksud aras pencapaian yang diperlukan. Kriteria itu mestilah bidang kandungan atau kemahiran yang boleh dikenalpasti secara eksplisit. Bidang itu mestilah

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |6

boleh diperhalusi dan dapat ditunjukkan dengan jelas perlakuan yang bagaimana termasuk dalam bidang tersebut dan bahagian mana yang tidak termasuk. Penggredan rujukan norma menyatakan prestasi seseorang yang dibandingkan dengan prestasi sekumpulan orang lain. Misalnya, memperoleh gred ekuivalen 4.7 daripada kumpulan kebangsaan dalam ujian pemahaman. memenangi peraduan menaip laju. Supaya penggredan jenis ini berguna, ia mesti lah membandingkan prestasi seseorang itu dengan prestasi kumpulan yang relevan dan betul. Kumpulan rujukan atau norma mestilah dihuraikan dengan jelas, barulah perbandingan yang bermakna boleh dilakukan. Jadi, apabila kumpulan rujukan itu dihuraikan dengan secukupnya dan relevan bagi tujuan pemberian makna, maka ia dapat menghuraikan status calon secara perbandingan yang bermakna di antaranya dengan orang lain. Bagaimanakah kedudukan murid ditentukan? Mari kita tentukannya berdasarkan penggredan rujukan kriteria dan penggredan rujukan norma.

B S

erdasarkan penggredan rujukan kriteria , kedudukan murid dapat ditentukan melalui berbagai cara. Salah satunya ialah dengan mencampurkan semua skor mentah tanpa wajaran. Jikalau pemberian gred yang lazimnya melibatkan gabungan keputusan daripada berlainan jenis penaksiran, termasuk ujian, projek, laporan, dan kerja makmal, maka jika setiap elemen hendak dimasukkan dalam gred berasaskan kepentingan relatif setiap elemen itu, data mestilah digabungkan dengan cara membuat wajaran yang betul. Begitu juga skor-skor mentah dicampurkan dengan wajaran mengikut mata pelajaran apabila melibatkan lebih daripada satu mata pelajaran. Akhirnya kita akan memperoleh skor komposit. Rubrik iaitu panduan penskoran juga boleh digunakan. Apabila semua skor komposit bagi setiap murid telah diperolehi, kedudukan murid akan dapat ditentukan dengan tepat. ebelum penggredan rujukan norma digunakan untuk menentukan kedudukan murid, skor mentah perlu ditukarkan ke skor terbitan. Untuk membandingkan prestasi di kalangan murid, semua ujian yang diambil mereka mestilah berada pada skala yang sama. Skor-skor mentah tidak boleh digunakan kerana ujian-ujian itu mungkin berbeza dari segi bilangan item ujian ataupun darjah kesukaran item.

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |7

Apakah kategori skor terbitan yang utama dan selalu digunakan di sekolah?

Isikan tiga kategori utama skor terbitan ke dalam Rajah 5.4 di bawah

B
Rajah 5.3 Tiga kategori utama skor terbitan

angkat persentil (Percentile Rank) ialah suatu peratusan daripada satu kumpulan rujukan. Ia dapat menunjukkan kedudukan relatif seseorang murid dalam satu kumpulan berasaskan peratusan ahli-ahli kumpulan itu yang memperoleh skor pada atau di bawah skor mentah murid tersebut. Sebagai contoh, jika skor mentah 30 bersamaan dengan persentil rank 60, itu bermakna 60 % daripada ahli kumpulan tersebut memperoleh skor mentah sama dengan atau lebih rendah daripada 30. Dengan menukarkan skor mentah kepada pangkat persentil , skor-skor mentah itu telah berada di atas skala yang mempunyai makna yang sama dengan kumpulan-kumpulan yang berbeza saiz dan tempoh masa ujian yang berbeza. Supaya lebih jelas, mari kita kira dan bentukkan satu jadual sebaran kekerapan dan pangkat persentil untuk satu ujian objektif yang terdiri daripada 40 item. Ikut langkah-langkah berikut: Skor mentah disusun dari tinggi ke rendah (kolum 1). Bilangan murid yang memperoleh setiap skor itu disenaraikan ke dalam kolum frekuensi (kolum 2). Skor frekuensi ditambah dari bawah ke atas (iaitu dengan menambah setiap skor frekuensi kepada jumlah frekuensi dari semua skor di bawahnya untuk memperoleh frekuensi kumulatif (CF)(kolum 3). Untuk memperoleh pangkat persentil (kolum 4), gunakan formula berikut:

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |8

Di mana PR = pangkat persentil CF = frekuensi kumulatif Untuk menunjukkan bagaimana mengira pangkat persentil, mari kira dua skor mentah berikut:

Jadual 5.1 Taburan frekuensi dan pangkat persentil untuk satu ujian objektif terdiri daripada 40 item _____________________________________________________________________________________ 1 2 3 4 Skor Ujian Frekuensi Frekuensi Kumulatif Pangkat Persentil * _____________________________________________________________________________________ 37 1 30 98 36 1 29 95 35 0 28 93 34 2 28 90 33 2 26 83 32 3 24 75 31 2 21 67 30 2 19 60 29 4 17 50 28 2 13 40 27 2 11 33 26 2 9 27 25 4 7 17 24 2 3 7 23 1 1 2 ________________ N = 30 _________________________________________________________________________________ * Dibundarkan kepada nombor bulat yang terdekat. Bila mentafsir pangkat persentil, pelajar hendaklah berhati-hati, kerana pangkat persentil menghuraikan prestasi ujian berdasarkan peratusan murid-murid yang memperoleh skor yang lebih rendah dan bukan

Penskoran, Penggredan, Pentafsiran Dan Pelaporan |9

peratusan item yang dijawab dengan betul. Peratusan skor betul ialah tafsiran rujukan kriteria manakala pangkat persentil adalah tafsiran rujukan norma kerana ia menunjukkan satu kedudukan relatif. Keduanya pangkat persentil sentiasa spesifik kepada sesuatu kumpulan tertentu. Sebagai contoh, pangkat persentil 95 dalam kumpulan murid cerdik mewakili prestasi ujian yang lebih tinggi daripada pangkat persentil 90 dalam kumpulan murid sederhana. Jadi pelajar perlu mengetahui sifat semulajadi sesuatu kumpulan bila hendak menghuraikan kedudukan relatif seseorang murid. Ketiganya, pangkat persentil tidak tersusun pada jarak yang sama di atas skala. Perbezaan 5 pangkat persentil di tengah-tengah taburan skor mewakili prestasi ujian yang lebih kecil berbanding perbezaan 5 pangkat persentil di hujung-hujung taburan. Ini adalah kerana persentil rank adalah didasarkan kepada peratus murid yang dilangkau atau dapat ditandingi. Dan terdapat peratusan murid yang lebih besar di tengah-tengah taburan skor untuk dilangkau berbanding di hujung-hujung taburan. Misalnya, di hujung taburan, perbezaan beberapa poin skor mentah tidak banyak mengubah pangkat persentil disebabkan terdapat hanya sedikit sahaja skor tinggi.

kor gred ekuivalen selalu digunakan di tahap sekolah rendah. Skor mentah seorang murid daripada satu ujian ditukarkan ke tahap gred yang sepadan dengan skor mentah purata murid-murid di dalam kumpulan norma. Jadual di dalam manual ujian menunjukkan kolum-kolum yang selari di antara skor mentah dengan gred ekuivalen. Pelajar hanya perlu merujuk jadual dalam manual itu dan mendapatkan gred ekuivalen untuk mana-mana skor mentah yang diingini. Dikatakan skor gred ekuivalen berkemungkinan merupakan skor yang paling kerap disalah tafsir. Mari kita lihat apakah yang dimaksudkan dengan skor gred ekuivalen dan yang mana tidak. Katalah kita memperoleh skor gred ekuivalen berikut daripada suatu ujian bateri untuk Liam, yang berada dalam pertengahan tahun di darjah empat. Membaca Bahasa Matematik 4.5 6.5 7.8

Perhatikan bahawa skor gred ekuivalen dipersembahkan berdasarkan tahap gred dan bulan dalam tahun pengajian. Dilihat di sini bahawa skor Liam dalam membaca bersamaan dengan skor purata yang diperoleh oleh murid-murid (daripada kumpulan norma) yang berada di pertengahan tahun di darjah empat. Jadi dari aspek membaca, Liam ditafsirkan sebagai sederhana. Dari aspek bahasa, Liam ditafsirkan ke hadapan dua tahun, dan dari aspek matematik, dia ditafsirkan ke hadapan lebih dari tiga tahun. Adakah itu bermakna Liam boleh membuat kerja dan tugasan pada tahap-tahap ini? Tidak, sebaliknya besar kemungkinan itu bermaksud yang Liam boleh melakukan tugasan gred empat lebih cepat dan lebih cekap daripada murid darjah empat yang lain. Dalam ujian-ujian tersebut

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 10

berkemungkinan besar tiada soalan-soalan pada tahap enam dan tujuh dimasukkan. Demikian juga jika gred ekuivalen yang rendah diperolehi, misalnya jika Sara, murid darjah empat, memperoleh skor matemaik 3.0, itu bukan bermaksud Sara hanya dapat selesaikan tugasan matematik darjah tiga. Lebih tepat ialah itu bermaksud sara menyelesaikan tugasan matematik darjah empat dengan lebih lambat dan melakukan lebih banyak kesalahan berbanding murid darjah empat yang lain. Oleh kerana itu, pelajar perlu ingat bahawa skor gred ekuivalen bukanlah satu standard yang hendak dicapai tetapi hanyalah skor purata murid-murid dalam kumpulan norma. Juga,skor gred ekuivalen yang terlalu tinggi atau rendah bukan indikator prestasi ujian yang boleh disandarkan sebagaimana skor gred ujian yang berdekatan dengan tahap gred murid itu. Ini adalah kerana skor ekuivalen yang tinggi dan rendah lazimnya diperolehi melalui proses ekstrapolasi dan tidak mewakili skor purata yang diperoleh oleh kumpulan-kumpulan tersebut.

kor piawaian dapat menghuraikan prestasi ujian berdasarkan berapa jauh suatu skor mentah itu di atas atau di bawah purata. Ianya dinyatakan dalam unit yang dihitung daripada min dan sisihan piawai suatu set skor. Sebagai mana pelajar tahu min digunakan sebagai suatu purata. Iaitu dengan menjumlahkan semua skor dan kemudian dibahagi dengan bilangan skor. Sisihan piawai menunjukkan sebaran semua skor dalam satu set skor. Formula untuk menghitung sisihan piawai ialah

Di mana

= jumlah X = satu skor ujian N = bilangan skor M = min = punca ganda dua

Sisihan piawai sangat penting dan digunakan dengan meluas dalam pengujian. Supaya pelajar lebih memahami min dan sisihan piawai, elok kita menggunakan keluk norma supaya lebih jelas. Rajah 5.4 menunjukkan satu contoh keluk norma. Ianya berbentuk loceng yang simetrikal. Taburan skor tertumpu berdekatan dengan min yang berada di titik tengah dalam taburan norma. Frekuensi skor berkurangan apabila semakin jauh daripada min. Apabila keluk norma dibahagikan ke dalam unit sisihan piawai yang sama jaraknya sepanjang garisan dasar keluk itu, setiap bahagian di bawah keluk mengandungi peratusan kes yang tetap. Jadi, 34 peratus daripada kes, jatuh di antara min dan +1 SD, 14 peratus di antara +1 SD dan +2 SD, dan 2 peratus di antara +2 SD dan +3 SD. Oleh kerana hanya 0.13 peratus sahaja kes jatuh di

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 11

atas dan di bawah tiga sisihan piawai dari min, rata-rata skor taburan norma jatuh di antara -3 dan +3 sisihan piawai dari min. Untuk membantu pemahaman maksud sisihan piawai, satu set skor mentah yang mempunyai min 40 dan sisihan piawai 5 diletakkan di bawah garisan dasar keluk. Perhatikan bahawa min skor mentah 40 diletakkan di titik sifar dan jarak satu sisihan piawai ialah 5 poin skor mentah di merata garisan dasar lekuk. Jadi, titik satu sisihan piawai di atas min bersamaan 45 (40 + 5) dan titik satu sisihan piawai di bawah min bersamaan 35 (40 5). Bagi set skor ini, dianggarkan 68 peratus skornya (lebih kurang dua per tiga) jatuh di antara 35 dan 45, dan 99.7 peratus jatuh di antara 25 dan 55. Apabila kita mengira sisihan piawai bagi satu set skor yang bertaburan norma, kita sebenarnya menentukan sejauh mana kita perlu pergi di atas (atau di bawah) min dalam poin skor mentah untuk memasukkan 34 peratus dari semua kes.

Rajah 5.4 Keluk norma dengan anggaran peratus kes di dalam setiap sela (peratusan telah dibundarkan)

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 12

Apakah skor-z, skor-T, skor NCE, skor abiliti, dan stanine?

Adakah pelajar tahu yang semua skor berkenaan adalah skor piawaian? Ya, semuanya adalah skor piawaian yang berasaskan unit sisihan piawai. Mari kita lihat satu demi satu.

kor-z ini menunjukkan berapa jauhkah suatu skor mentah berada di atas atau di bawah min, dalam unit sisihan piawai. Skor mentah 45 dalam Rajah 5.4 yang dibincangkan tadi akan dinyatakan sebagai satu skor-z 1.0 sebab ianya satu sisihan piawai di atas min. Skor mentah 30 pula akan dinyatakan sebagai satu skor-z -2.0 sebab ianya dua sisihan piawai di bawah min. Formula untuk mengira skor-z ialah:

Contohnya, skor-z untuk 47 dalam Rajah 5.4 dikira begini:

Oleh itu, skor mentah 47 ialah 1.4 sisihan piawai di atas min. Oleh kerana skor-z didapati menggunakan titik perpuluhan dan adakalanya bertanda negatif, untuk mengelakkan kekeliruan, skor-z jarang digunakan secara terus. Sebaliknya skor-z ditukar kepada jenis skor piawaian yang lain yang menggunakan nombor bulat dan bernilai positif.

kor-T memiliki min 50 dan sisihan piawai 10. menggunakan formula: Skor- T = 50 + 10 (skor-z )

Skor-T diperolehi daripada skor-z dengan

Misalnya bila skor-z ialah 1.4, maka skor-T = 50 + 10 (1.4) = 64

Skor- T adalah mudah untuk ditafsirkan sebab skor-T sentiasa mempunyai min dan sisihan piawai yang sama. Suatu skor-T 60 sentiasa bermaksud satu sisihan piawai di atas min dan suatu skor-T 30 sentiasa bermaksud dua sisihan piawai di bawah min. Jadi, dengan menggunakan skor-T, prestasi seseorang individu daripada pelbagai ujian boleh dibandingkan secara terus, dan skor-skor boleh digabung atau

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 13

dipuratakan tanpa berlakunya perubahan pada saiz sisihan piawai, tidak seperti bila menggunakan skor mentah. Bilamana taburan norma boleh djangkakan, skor-T boleh ditafsirkan berdasarkan persentil rank kerana keduanya saling berhubungan seperti yang ditunjukkan dalam Rajah 5.5. Perhatikan bahawa skor-T 30 adalah bersamaan dengan persentil rank 2, skor-T 40 bersamaan dengan persentil rank 16, dan begitulah seterusnya. Supaya pelajar tidak keliru, perlu diingatkan bahawa walaupun kedua-dua skor-T dan persentil rank menggunakan 50 sebagai min dan nombor dua digit, persentil rank merujuk kepada peratus individu yang jatuh pada atau di bawah sesuatu skor, manakala skor-T merujuk kepada berapa unit sisihan piawai sesuatu skor di atas atau di bawah min. Perhatikan juga bahawa walaupun kedua-duanya mempunyai min yang sama, di bawah min persentil rank bernilai lebih kecil daripada skor-T dan di atas min persentil rank lebih besar daripada skor-T. Ini adalah kerana seperti pelajar sudah tahu persentil rank bertumpu di tengah-tengah taburan dan tersebar keluar di hujung-hujung, manakala skor-T bertabur pada unit yang sekata di seluruh taburan skor.

kor ekuivalen keluk-norma (Normal-curve equivalent score,NCE) merupakan satu lagi skor piawaian yang dibimbangi mengelirukan pelajar. Ini adalah kerana skor NCE juga menggunakan 50 sebagai min, tetapi sisihan piawai ialah 21.06. Ini membolehkan terbentuknya satu set skor yang memiliki unit yang sekata, seperti skor-T, tetapi julat skornya ialah dari 1 ke 99. Julat persentil rank juga dari 1 ke 99, tetapi persentil rank tidak berada dalam unit yang sekata. Jadi bila pelajar mentafsirkan skor NCE, jangan keliru dengan skor-T, yang selalunya mempunyai julat yang terhad (lazimnya 20 ke 80).

Baiklah, kita akan lihat apakah pula skor abiliti dan skor stanine.

S S

kor abiliti dahulunya dipanggil sisihan IQ. Ia selalu melibatkan penerbit ujian bateri yang melaksanakan ujian abiliti pembelajaran, kognitif, atau kecerdasan ke atas kumpulan norma. Skor yang diperolehi daripada ujian-ujian ini dilaporkan sebagai skor piawaian dengan minnya 100 dan sisihan piawainya 16 atau 15. Skor ini ditafsirkan sama seperti mana-mana skor piawaian yang lain. Skor 116 bermaksud satu sisihan piawai di atas min, (Rajah 5.5).

kor stanine merupakan skor ujian yang dipersembahkan dalam bentuk satu digit. Iaitu skala stanine menaburkan skor mentah kepada sembilan bahagian. Skor stanine yang tertinggi ialah 9, yang terendah ialah 1, dan stanine 5 terletak di tengah tengah taburan. Setiap satu stanine, kecuali 9 dan 1, merangkum satu band skor mentah, separuh dari kelebaran satu sisihan piawai. Jadi stanine

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 14

adalah skor piawaian yang mempunyai minnya 5 dan sisihan piawainya 2. Taburan stanine dan peratusan kes dalam setiap stanine ditunjukkan dalam Rajah 5.5.

Rajah 5.5 Hubungan persentil rank, skor-z, skor-T, skor NCE, skor abiliti, dan stanine.

Sewaktu pelajar membandingkan skor murid daripada dua ujian yang berlainan dalam satu ujian bateri, perbezaan dua stanine lazimnya adalah signifikan. Jadi bila mentafsirkan skor-skor berikut bagi murid ini, kita merumuskan pencapaian murid ini adalah tinggi dalam matematik tetapi tidak ada perbezaan di antara membaca dan bahasa. Stanine membaca = 5

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 15

Stanine bahasa

= 4

Stanine matematik = 7 Menukarkan skor mentah kepada stanine meletakkan skor daripada ujian berlainan ke atas satu skala piawaian yang sama, dengan unit-unit yang setara. Jadi perbezaan di antara stanine 5 dan stanine 7 adalah sama seperti perbezaan antara stanine 4 dan stanine 6.

Bolehkah pelajar fikirkan apakah tujuan dan peranan penggredan? Adakah penggredan memberikan munafaat kepada murid dan ibu bapa mereka? Adakah penggredan memberi faedah kepada guru, sekolah dan masyarakat? Bagaimana?

Mengapa penggredan diperlukan?

agi menjawab soalan di atas, kita perlu memikirkan apakah tujuan penggredan dijalankan di sekolah. Pada amnya penggredan adalah perlu untuk memberi gambaran atau petunjuk sejauh mana murid-murid telah mencapai matlamat pengajaran dan pembelajaran. Namun tujuan penggredan juga telah menjadi pelbagai disebabkan oleh tuntutan keperluan hidup. Mungkin tujuan dan peranan penggredan boleh dikategorikan kepada tiga: Boleh memberi faedah kepada setiap murid dan ibu bapa mereka. Membimbing tugas guru dan sekolah. Memenuhi keperluan masyarakat. Adakah anda bersetuju dengan hujah ini? Mengapa?

embantu murid dan ibu bapa adalah salah satu tujuan penggredan yang utama. Markah merupakan maklumbalas kepada murid dan ibu bapa mengenai pencapaian murid. Ibu bapa boleh memantau usaha murid, memberi semangat dan galakan, menawarkan bantuan, serta dapat maklumat mengenai perkembangan murid. Maklumbalas mengenai pencapaian membolehkan murid mengetahui tentang dirinya. Gred dapat memberikan petunjuk akan kekuatan dan kelemahan relatif intraindividu dan mengenai kebolehan dan batasan dirinya berbanding murid lain. Maklumat ini akan membimbing murid untuk membuat keputusankeputusan penting seperti memilih bidang, pendidikan di masa depan, dan memilih karier. Dapat mengenali konsep diri yang realistik adalah amat penting semasa murid membesar. Maklumbalas daripada gred bagaimanapun sepatutnya disampaikan kepada murid dengan cara yang tidak menggambarkan penilaian harga diri seseorang murid.

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 16

embantu guru dan sekolah adalah tujuan penggredan yang seterusnya. Gred membantu guru memantau kemajuan murid. Kepada murid secara individu, guru dapat memberi arahan yang spesifik kepada individu berkenaan. Jadi pengajaran berpusatkan individu boleh dilaksanakan. Manakala bagi kedua-dua peringkat individu dan kumpulan, guru boleh merencana dan melaksanakan pelbagai strategi pengajaran. Strategi seperti mengumpul murid-murid kepada kumpulan yang homogeneous berdasarkan kelemahan atau kekuatan mereka dalam sesuatu mata pelajaran atau satu bahagian daripada mata pelajaran membolehkan guru memberi peneguhan dan tumpuan kepada subjek berkenaan. Gred juga digunakan di sekolah sebagai syarat kemasukan murid ke dalam kursus atau bidang yang memerlukan prasyarat. Misalnya, untuk mengambil mata pelajaran fizik, murid berkenaan perlulah mendapat sekurang-kurangnya gred C untuk algebra.

emenuhi keperluan masyarakat tidak dapat dielakkan, di mana gred digunakan oleh institusi di luar sekolah seperti kolej, universiti, matrikulasi dan seumpamanya. Sama ada sebagai rujukan untuk syarat menerima murid di institusi berkenaan, atau menentukan kursus dan bidang yang paling sesuai diikuti. Gred juga selalu dijadikan sebagai asas untuk menghulurkan bantuan biasiswa atau anugerah. Gred juga digunakan oleh bidang perniagaan, industri, dan kerajaan. Markah daripada sekolah dan kolej yang diterima oleh murid dan pelajar memberikan kepada prospektif majikan maklumat yang sangat berguna. Akhirnya markah terlibat dalam pemberian lesen untuk menjalankan tugas ataupun merupakan sijil kecekapan. Ini untuk memastikan masyarakat dan orang ramai mendapat khidmat daripada petugas dan pekerja yang sah dan berkelulusan dalam bidang pekerjaan yang dijalankannya.

Bagaimanakah pelaporan patut dilakukan?

Bagaimanakah anda akan laporkan prestasi murid anda kepada ibu bapa mereka? Bolehkah anda namakan beberapa cara yang boleh dilakukan? Sila tuliskan idea anda di sini:
__________________________________________________________________________ __________________________________________________________________________

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 17

dakah anda telah menulis kaedah seperti menggunakan gred abjad, penilaian bertulis, dan konferen? Jika itu yang anda tulis saya ucapkan syabas! Tidak boleh dipertikaikan bahawa pelaporan yakni proses memberi maklumbalas kepada ibu bapa tentang prestasi murid mestilah bersifat objektif, berterusan, dan ada kebolehpercayaan. Kita boleh merangkumkan kaedah menggunakan gred abjad dan penilaian bertulis dalam kaedah konferen. Iaitu pertemuan dengan ibu bapa murid untuk melaporkan prestasi murid. Adakah anda perlukan sebarang kemahiran untuk konferen yang berkesan? Sudah tentu. Mana-mana komunikasi memerlukan tiga elemen: penghantar, mesej, dan penerima. Kordinasi di antara ketiga-tiga elemen ini adalah penting untuk memastikan kejayaan sesuatu konferen dan memerlukan langkah-langkah asas yang berikut: Menyediakan bahan dan maklumat untuk konferen. Menyusun kemudahan dan aturcara. Membentuk hubungan baik dengan ibu bapa dan menghormati kepelbagaian. Mendengar dengan teliti dan responsif kepada ahli keluarga dan murid. Menyampaikan maklumat secara professional dan prihatin. Mengenalpasti masalah dan perkara yang perlu diberikan perhatian. Menyelesaikan masalah secara berpasukan. Menunjukkan keikhlasan dan komited terhadap perkembangan murid. Membuat tindak ikut dan susur ikut hasil konferen. Membuat penilaian konferen untuk penambahbaikan perjumpaan di masa akan datang.

ersediaan untuk konferen melibatkan proses memaklumkan kepada ibu bapa tujuan dan perkara yang akan dibincangkan. Guru perlu mengumpul sampel kerja-kerja murid, yang baik dan juga yang kurang baik untuk dilihat oleh ibu bapa dan untuk dibincangkan. Sampel sepatutnya daripada pelbagai pemerhatian dan merupakan asas kepada markah yang murid perolehi. Ini akan meningkatkan kebolehpercayaan pentafsiran. Kesahan akan meningkat jika penaksiran dibuat berasaskan ciri-ciri murid yang relevan. Untuk memastikan ibu bapa dapat memahami bahan murid , masa yang cukup perlu diperuntukkan kepada ibu bapa. Semasa mereka membaca dan meneliti bahan murid, komunikasi tidak patut berlangsung. Adalah penting untuk sekolah merancang aturcara dan masa yang sesuai untuk konferen ini supaya ibu bapa dapat datang dan guru tidak terlalu penat kerana perjumpaan yang padat. Ibu bapa juga sepatutnya berjumpa dengan guru dalam suasana yang ada privasi dan perbincangan ibu bapa dengan guru tidak didengari oleh ibu bapa yang lain.

enjalankan konferen sebenar dengan lancar adalah penting. Dua peraturan perlu dipegang untuk menjayakan sesuatu konferen, iaitu memulakan konferen dalam nada positif dan menamatkannya mengikut masa yang telah ditetapkan. Mulakan dengan menceritakan apa yang murid telah capai dan kemajuan yang telah dilakukannya. Komunikasi yang sesuai ialah mendengar

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 18

dengan responsif. Bila ibu bapa telah menjelaskan apa yang hendak dijelaskan dan menyoal soalan, guru barulah boleh berkongsi maklumat dan memulakan proses penyelesaian masalah. Guru hendaklah jujur, objektif dan melengkapkan diri dengan evidens kerja murid. Guru yang bijak tidak bercakap tentang guru lain, murid lain dan ibu bapa lain.

indak ikut dan susur ikut hasil konferen adalah penting tetapi selalu diabaikan. Di penghujung konferen, guru sepatutnya dapat melihat dengan jelas apakah rancangan yang akan dibuat di masa akan datang. Siapa yang bertanggungjawab untuk apa? Bila? Di mana? Bagaimana keputusan itu nanti hendak disampaikan kepada semua yang terlibat? Jadi terpulanglah kepada guru untuk menjadikan dirinya mudah untuk dihubungi dan selalu menghubungi keluarga murid-muridnya.

enilai konferen sangat sesuai ditegaskan di sini. Guru mungkin bertanya secara tidak formal soalan-soalan seperti, Adakah ini satu pengalaman yang baik? Adakah semua orang pulang dengan rasa puas hati? Adakah semua orang telah mengetahui kekuatan, kelemahan, dan keperluan murid? dan sebagainya. Namun adalah lebih baik lagi jika guru-guru mengisi rubrik atau senarai semak yang sesuai untuk menilai konferen. Terkandung dalam rubrik itu mungkin mengenai persiapan (agenda, portfolio, kemudahan), tujuan dan peranan setiap orang, rancangan tindakan yang sesuai untuk akan datang, dan sebagainya. Ibu bapa juga boleh diberikan borang untuk menilai konferen. Jika diberikan borang maka sediakan tempat untuk mengisi (misalnya di perpustakaan) dan ibu bapa memasukkannya ke dalam kotak yang disediakan.

RINGKASAN
1. Penskoran ialah proses memberi skor kepada jawapan murid. Dua kaedah penskoran ialah

penskoran holistik dan analitik. Skor biasanya berbentuk numerik. Jenis-jenis skor ialah skor mentah dan skor terbitan. Skor terbitan pula terbahagi dua iaitu skor terbitan mutlak dan skor terbitan relatif.
2. Penggredan ialah proses memberi gred ke atas jawapan atau skor murid. Gred biasanya dalam

bentuk abjad. Terdapat dua jenis penggredan iaitu penggredan rujukan norma dan penggredan rujukan kriteria. Kedudukan pelajar boleh ditentukan berdasarkan penggredan rujukan kriteria dan juga berdasarkan rujukan norma.
3. Pelaporan ialah proses memberi maklumbalas kepada ibu bapa tentang prestasi murid.

Pelaporan gred dan pencapaian murid mestilah objektif, ada kebolehpercayaan dan berterusan.

PENILAIAN KENDIRI
1. Dengan menggunakan perkataan sendiri, huraikan apa yang membezakan penskoran holistik daripada penskoran analitik?

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 19

2. Huraikan dengan terperinci langkah-langkah yang perlu dilakukan untuk memastikan penskoran soalan subjektif dibuat secara objektif. 3. Apakah perbezaan utama antara pensentil rank daripada skor NCE? 4. Bagaimanakah anda akan menerangkan kedudukan murid anda kepada ibu bapanya berdasarkan persentil rank? 5. Kenapakah min dan sisihan piawai itu penting dan perlu difahami? Bagaimanakah anda akan terangkan maksud min dan sisihan piawai? Berikan beberapa contoh kegunaan min dan sisihan piawai.

RUJUKAN
Airasian, P. W. (2001). Classroom assessment concepts and applications. 4th Edition. New York: Mc-Graw Hill. Hanna, G. S. & Dettmer, P. A. (2004). Assessment for effective teaching: using context-adaptive planning. Mexico City: Allyn and Bacon. Gronlund, N. E. (1998). Assessment of student achievement. 6th Edition. Boston: Allyn and Bacon

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 20

JAWAPAN SERTA MAKLUM BALAS

Selain di atas ada lagi langkah-langkah yang lain yang boleh dikenalpasti. Masa perlu disediakan untuk menanda jawapan subjektif secara objektif.

P e n s k o r a n , P e n g g r e d a n , P e n t a f s i r a n D a n P e l a p o r a n | 21

You might also like