P. 1
Kesesuaian Item Ujian

Kesesuaian Item Ujian

|Views: 120|Likes:
Published by Hashimah Hassan

More info:

Published by: Hashimah Hassan on Mar 31, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

03/08/2013

pdf

text

original

BAB 5 KESESUAIAN ITEM UJIAN

Pengenalan

Selepas sesuatu pembinaan dijalankan , satu pencerapan haruslah dijalankan bagi memastikan samada item atau soalan tersebut sesuai untuk digunakan. Biasanya prosedur yang dijalankan termasuklah menganalisa setiap item tersebut. Ini adalah untuk membolehkan kita mengasing atau menggunakan item-item tersebut untuk tujuan ujian seterusnya. Seperkara lagi ialah untuk memastikan samada pengguna tahu atau tidak tahu akan ujian yang akan diambil. Dalam memastikan bahawa item tersebut boleh digunapakai adalah membuat pengukuran perbezaan bagi setiap item yang dijalankan. Sebagai contoh, jika ujian yang dibina adalah bertujuan mengukur pencapaian sekolah maka ujian yang hendak dijalankan hendaklah akur akan pencapaian yang ditetapkan.

Kesahan item bagi tujuan meramal pengukuran criteria boleh di tentukan dengan membuat pengiraan korelasi diantara skoran tehadap item dengan skoran pengukuran tersedia. Pengukuran korelasi koefisien yang sering digunakan adalah koefisien titik-biserial ( pointbiserial coffecient).

Namun bagi tujuan pengukuran bilik darjah, kebiasaannya posedur yang disering digunakan adalah melibatkan penentuan peratus pengambil ujian yang lulus setiap item denga korelasi setiap criteria item. Dalam hal ini, criteria yang dimaksudkan adalah skor keseluruhan ujian tersebut. Item yang berkualiti harus mempunyai ciri-ciri keakuran dari aspek kurikulum, spesisfikasi dan peluang. Item juga hendaklah tepat dalam konstruknya, tepat akan tajuk atau konteksnya dan hendaklah jelas dari segi stimulus, tugasan dan arahan. Oleh itu item atau soalan yang dibina juga hendaklah sesuai dengan kehendak serta ketetapan.

Objektif

Diakhir bab ini, anda seharusnya dapat :

i) menilai ujian berdasarkan tahap kebolehpercayaan dan kesahanujian ii) membina item ujian agar lebih dipercayai dan sah

5.1.1 Indeks Kesukaran

Yang pertama adalah indeks kesukaran (item-difficulty index) (p). Indeks ini ditentukan dengan nisbah calon yang mendapat jawapan betul bagi sesuatu item dan dinyatakan dalam persamaan berikut

Bilangan calon yang menyatakan jawapan yang betul bagi item x P= Bilangan calon yang menjawab item x

Nilai bagi p ialah diantara 0.00 hingga 1.00. item yang mudah mempunyai p yang besar dan sebaliknya sesuatu item yang sukar nilai p adalah kecil. Walau bagaimanapun, dikatakan bahawa item yang terlalu mudah ( apabila nilai p adalah lebih dari 0.85 ) atau item itu terlalu sukar ( apabila p kurang daripada 0.15 )tidak akan memberikan maklumat psikometrik yang berguna.

Aras kesukaran item boleh ditentukan dengan nilai p, seperti berikut ;

Mahathir ? Kita tidak boleh menyatakan item mana yang sukar selepas membaca soalan ini. Contoh yang lain. manakala item yang dijawab betul oleh 50% pelajar akan mempunyai nilai indeks kesukaran p yang rendah iaitu 0.85. . Namun untuk menyatakan soalan mana yang ditanya itu sukar hanya boleh ditentukan dengan membuat ujian kesukaran item. Berikan definisi indeks kesukaran. 2. Nilai p akan membolehkan kita membuat pengukuran indek kesukaran di situasi atau ditempat berbeza. item ujian Bahasa Inggeris yang sukar bagi pelajar sekolah rendah akan ternyata lebih mudah bagi pelajar sekolah menengah kebangsaan. Definisi lain bagi terma kesukaran dalam ciri intrinsik.20 hingga 0.36 hingga 0. bagi kita menentukan samada menjawab soalan sejarah melibatkan pengetahuan yang lebih mantap.60 0. Siapakah Tunku Abdul Rahman Putra Al-Haj ? Siapakah Tun Dr. Item yang dijawab betul oleh 85% pelajar akan mempunyai nilai p 0. 1991).35 Aras kesukaran Item mudah Item sederhana Item sukar Indeks kesukaran juga boleh ditakrifkan sebagai peratusan pelajar yang menjawab ujian dengan betul. Nilai p hanyalah satu ukuran sikap. Lagi tinggi peratusan item kesukaran lagi mudahlah item tersebut (Wood.50.Nilai p 0. Sebagai contoh. Lagi besar peratusan jawapan betul yang diperolehi lagi mudahlah sesuatu item.80 0. kesukaran boleh didefinisikan dalam bentuk kekerapan relatif pengambil ujian memilih respon jawapan yang betul (Thorndike et al. Seseorang akan hanya mengenali nama bagi kedua-dua tokoh tersebut. 1960). kompleks atau khusus dari yang diperlukan untuk menjawab soalan matematik.61 hingga 0. item manakah dikatakan sukar ? 1. Adalah sukar.

Dan jika semua item adalah mudah.Apabila nilai p digunakan untuk menentukan indek kesukaran. ini menunjukkan bahawa 65 peratus pelajar yang mengambil ujian tersebut . dalam sesuatu ujian didapati . Oleh itu.3. Pengiraan di atas menunjukkan : Item A lebih mudah daripada item B. Apabila kita memilih jawapan yang tidak ditetapkan ( p=0 ). Contoh: Item A yang direspons betul oleh 80 daripada 100 orang murid. 1. adalah lebih mudah bagi menentukan samada item ujian sejarah adalah lebih sukar dari item matematik khusus bagi ujian yang diambil oleh pelajar yang sama. indeks kesukarannya ditentukan dengan mencari peratus skor min (skor purata) atau kadar skor min. Aras kesukaran item lebih tinggi daripada item A. nilai p akan terus menghalang kepelbagaian ujian skoran. indeks kesukarannya ialah 30% atau 0. kita lihat beberapa lagi contoh berikut. Sebagai contoh. Bagi item objektif yang skornya berbentuk dikotomus. …atau tidak dikotomus. Untuk lebih memahami keadaan ini. kebanyakan ujian skoran adalah agak tinggi. Apabila semua item didapati sukar. 2. indeks kesukarannya ialah 80% atau 0. majoriti ujian skoran adalah rendah. aras kesukaran item ditakrifkan sebagai peratus atau kadar bilangan murid yang memberi respons dengan betul. Bagi item subjektif yang skornya boleh bernilai 0. 3. dan tidak ada perbezaan individu didalam skoran bagi item tersebut. Indeks kesukaran item (K) = Skor Purata Skor Maksimum Indeks kesukaran bagi item ujian menerangkan bilangan pelajar yang menjawab dengan betul sesuatu soalan yang diberikan. indek kesukaran item adalah 65. kadaran tersebut dipanggil indeks kesukaran item. Item B yang direspons betul oleh 30 daripada 100 orang murid.8.

Lagi tinggi indeks kesukaran. Anggaran hendaklah dibuat secara berhati-hati jika bilangan pelajar yang mengambil ujian tidak menyempurnakan ujian dalam masa yang ditetapkan. lebih mudah item ujian tersebut. Koefisien korelasi titik-biserial mengukur hubungan diantara skor item dengan skor ujian.Bincangkan. namun. Adalah harus untuk mengekal item ujian yang mempunyai koefisien korelasi titik biserial yang tinggi dan membuangkan item ujian yang hampir bernilai sifar atau bernilai negatif. Nilai anggaram julat Kuder-Richardson ini adalah diantara 0.000 menunjukkan ujian tersebut mempunyai tahap kebolehpercayaan yang tinggi. Begitu juga jika sesuatu item ujian dijangka akan menjadi terlalu mudah maka ianya juga harus tidak disertakan.000 dan 1.menjawab dengan dengan betul. Nilai hampir sifar akan menunjukkan terdapat hubungan yang sedikit diantara skoran pada item dan skoran ujian. Memanjangkan masa ujian (apabila terdapat ujian amali) boleh meningkatkan tahap kebolehpercayaan. Ujian yang mengandungi 2 alternatif (betul-salah) seharusnya mengandungi tahap kesukararan diantara 50 hingga 100. sesuatu ujian hendaklah yang mengandungi tahap kesukaran diantara julat 60 hingga 85 dan selebihnya pada sekitaran 25 dan 100. Nilai julat statistik ini adalah diantara -100 dan + 100. Kebolehpercayaan boleh ditingkatkan melalui ujian ulangan berdasarkan analisis data yang dijalankan. jika terdapat peluang atau petunjuk bahawasanya akan ada indeks atau tahap dibawah 25 .000. Sebagai panduan. Korelasi kebolehpercayaan jenis ini akan menentukan dan memberikan tahap indikasi individu yang mengambil ujian akan memperolehi skoran yang sama dalam ujian. maka seharusnya item tersebut tidak dimasukkan. Dalam keadaan biasa. Nilai positif tinggi menunjukkan sesesorang yang menjawab item dengan betul akan menerima skoran yang tinggi dalam ujian berbanding dengan menjawab dengan tidak betul. . terutama bagi ujian pendek. Nilai yang hampir dengan +1. Ujian kebolehpercayaan dan kesahan akan dimaksimakan jika kebanyakkan kesukaran item adalah agak mudah yakni diantara tahap peluang dan 100.75 adalah sesuai. Lagi tinggi peratusan item kesukaran lagi mudahlah item tersebut. Satu ujian yang merangkumi bahan subjek berkaitan hendaklah mengandungi item yang merangkumi pelbagai nilai julat kesukaran. . koefisi kebolehpercayaan pada tahap 0. adalah dicadangkan item korelasi yang bernilai negatif atau hampir sifar ( 10 atau kurang) dibuang atau dikajisemula dan item ujian yang bernilai kolerasi positif rendah dikaji semula bagi menentukan bagaimana untuk memperbaiki keadaan item tersebut. Untuk ujian biasa selama 50 minit. Rumusan konsisten dalam Kuder-Richardson 20 digunakan dalam pengiraan komputer bagi menentukan anggaran kebolehpercayaan item ujian.

Aplikasi terusan ini kepada skoran menjadikan pengukuran ralat rawak amat penting bagi menilai perbezaan diantara pelajar dan menentukan markah dan gred. lagi kecil lah nilai ralat tawak.Pengukuran ralat rawak adalah anggaran bagi ralat kemungkinan skoran ujian. rbis digunakan untuk menentukan darjah keupayaan sesuatu item bagi membezakan antara calon daripada kumpulan yang mempunyai market keseluruhan ujian yang tinggi dengan yang rendah. seseorang akan menganggap mereka yang boleh menjawab dalam ujian tersebut akan menjawab dengan baik atau betul bagi item tersebut dan jika mereka yang gagal menjawab ujian tersebut akan turut gagal alam menjawab item tersebut. Ia diinterpretasikan sebagai mana dijalankan keatas sisihan piawai.500. Lagi tinggi kebolehpercayaan dan lagi bebas kesalahan ujian tersebut. Pekali korelasi “point-biserial”. kemungkinannya adalah 2 : 1. menunjukkan bagi mana-mana satu skoran ujian. yang mana skoran sebenar pelajar ( purata skoran bagi setiap ujian ) tidak akan terpencong dari lebih 3.1. Item yang baik akan mendiskriminasikan diantara mereka yang baik dengan mereka yang kurang baik.500 sebagai contoh.2 Indeks Diskriminasi ( rbis ) Jika sesuatu ujian dan sesuatu item mengukur perkara yang sama. Pengukuran ralat rawak pada tahap 3. 1 jika memilih dan 0 jika tidak memilih opsyen bagi sesuatu item berkenaan. ditentukan dengan menggunakan persamaan berikut : . Indek diskriminasi ialah pekali korelasi yang mengaitkan skor ujian ( data selanjar ) dengan skor setiap opsyen ( data dikotomous . Indek kesukaran boleh digunakan untuk:     Mengenalpasti konsep yang akan diajar semula Menyediakan atau memaklumkan kemungkinan kelemahan dan kekuatan kurikulum Memberi maklumbalas kepada pelajar Memberi atau memaklumkan mengenai kemungkinan item bias 5.

rpbis yang bernilai positif menunjukkan calon yang mendapat skor ujian yang tinggi menyatakan jawapan yang betul.00. manakala calon yang mendapat skor ujian yang rendah memilih opsyen yang salah (distraktor). manakala calon yang mendapat skor ujian yang rendah menyatakan jawapan yang betul.dimana : x ialah min skor ujian calon yang menjawab betul µ ialah min skor ujian σ ialah sisihan piawai ujian p ialah nisbah calon yang menjawab betul (indeks kesukaran) q=(1–p) Nilai indeks diskriminasi adalah antara – 1. Bagi item yang . rpbis akan bernilai negative. Jika sebaliknya berlaku. dimana calon yang mendapat skor ujian yang tinggi memilih opsyen yang salah (distraktor).00 hingga 1.

399 0.20 hingga 0. Sama ada ujian itu akan diperiksa dan diberi markah oleh beberapa orang guru sebagai pemeriksa yang berasingan atau oleh seorang guru.199 Kurang daripada 0.30 hingga 0.10 hingga 0.1. Pengelasan kebolehan item mendiskriminasi berdasarkan rpbis rpbis 0.10 Pengelasan Sangat baik Baik Sederhana Kurang baik Tidak baik Apakah yang dimaksudkan dengan indeks diskriminasi. bermakna item ini tidak dapat mendiskriminasikan antara pelajar dari kumpulan yang mendapat skor tinggi dengan kumpulan calon yang mendapat skor ujian yang rendah.3 Pemarkahan Item dan Tahap Masa Ujian Menjawab persoalan sama ada sesuatu ujian boleh menjamin ketekalan dalam pemeriksaan dan pemarkahannya. Sesuatu ujian . Bincangkan 5.menunjukkan nilai rpbis adalah 0.40 dan keatas 0.299 0.

Bagi kemahiran bahasa pula. Dalam kemahiran menulis pula. misalnya jenis rasmi seperti memohon pekerjaan atau menulis karangan mengikut tajuk yang bercorak perbincangan sahaja. Sekiranya guru telah menguji bacaan dan kefahaman keratan pelbagai jenis prosa dalam bulan Januari. Ketekalan jenis ini tidak mencukupi untuk menjamin kebolehpercayaan sesuatu ujian secara keseluruhannya. Ini amat penting bagi ujian jenis subjektif. Perkiraan sama ada hendak menjalankan sesuatu ujian pada hujung bulan. Dengan kata lain. ujian bulanan atau ujian pertengahan penggal eloklah bercorak formatif dan diagnostik yang bertujuan untuk menguji kemajuan murid dalam mempelajari satu atau dua kemahiran atau aspek bahasa dari semasa ke semasa. Faktor penting ialah skim pemarkahan bagi ujian tersebut. ujian lisan yang dinilai oleh pemeriksa secara bersendirian. Contohnya. Dalam pendidikan bahasa. ketekalan pemarkahan antara pemeriksa yang biasanya terkawal ketat dalam ujian yang menggunakan soalan-soalan aneka pilihan. sama ada ujian formatif atau sumatif. Tujuan skim ini untuk mengurangkan ciri subjektiviti kepada peringkat yang paling minimum dan meningkatkan ciri objektiviti kepada peringkat yang paling maksimum dan mengawal ketekalan pemarkahan dan pengukuran melalui satu skim pemarkahan yang standard atau serupa. persoalan subjektiviti dalam pemarkahan mungkin tidak timbul. seperti ujian mengarang. Kita perlu melihat kebolehpercayaan item tersebut. Setiap item perlu dinilai dari aspek kebolehpercayaan atau ketekalannya menjalankan sesuatu tugas. mungkin dalam bulan lain guru tersebut boleh menguji bacaan dan kefahaman puisi. Jenis ujian kecil ini bertujuan untuk melihat kemajuan murid dalam mempelajari sesuatu kemahiran atau aspek bahasa yang tertentu sebelum guru melanjutkan pengajarannya dengan perkara baru. pertengahan bulan. Skim ini bertujuan untuk menyelaraskan prosedur pemarkahan atara pemeriksa dan menjaga ketekalan dalam pengagihan markah. Ujian ini mungkin tentang satu atau dua kemahiran bahasa ataupun tertumpu kepada satu atau dua aspek bahasa seperti tatabahasa atau perbendaharaan kata. pertengahan tahun atau pada hujung tahun akan membawa implikasi terhadap penentuan skop dan kandungan ujian tersebut. Bagi ujian bahasa yang bercorak objektif seperti ujian kefahaman bacaan atau aspek bahasa yang lain menggunakan soalan dalam bentuk aneka pilihan. Bagaimanapun. Dalam pendidikan bahasa. ujian bacaan dan kefahaman juga ada pelbagai jenis.dikatakan mempunyai kebolehpercayaan (ketekalan) antara beberapa orang pemarkah sekiranya keputusan pemarkahan mereka sama atau hampir sama. Sesuatu ujian yang berbentu aneka pilihan biasanya terdiri daripada beberapa item. ini akan menentukan jenis ujian yang akan dibina oleh guru. hujung penggal. kadang kala ujian ini tertumpu pada kefahaman mendengar sahaja ataupun bacaan dan kefahaman sahaja. . ujian formatif mempunyai skop dan kandungan yang terhad. ujian yang bercorak formatif mungkin hanya menguji kemahiran murid menulis surat kiriman.

Kebolehpercayaan ujian boleh disebut sebagai darjah ketekalan antara dua pengukuran terhadap sesuatu bahan atau benda. skop dan isi kemahiran atau aspek bahasa yang akan diuji menjadi lebih luas. Kebolehpercayaan skor berkait rapat dengan instrumen pentaksiran yang digunakan. Hal ini perlu sekiranya subkemahiran yang telah diajar itu banyak dan luas. pertengahan tahun atau di hujung tahun.Sekiranya ujian yang hendak dijalankan itu pada tahap pengajaran yang lebih panjang seperti di hujung penggal. contohnya aspek tatabahasa dan peribahasa. Tetapi dalam ujian penggal atau hujung tahun itu. adalah stabil.2 Kebolehpercayaan Ujian Kebolehpercayaan boleh merujuk kepada ciri skor berhubung dengan ketepatan dan ketekalan skoran bagi mengambarkan prsetasi calon dalam perkara yang diuji. adakah tempoh mengadakan ujian memberikan kesan ketas ujianyang dijalankan. Begitu juga jika kita mempercayai seseorang insan atau kawan yang sudah semestinya mempunyai sifat-sifat yang dinyatakan. Kebolehpercayaan atau reliabiliti yang berkaitan dengan konsep ujian hendaklah boleh diharapkan. Ujian yang bercorak sumatif memerlukan guru memilih satu sampel subkemahiran yang hendak diuji. guru boleh membina hanya beberapa soalan atau ujian tentang tatabahasa atau peribahasa. ujian yang tidak sesuai. Mungkin dalam tempoh sepanjang penggal atau sepanjang tahun guru telah mengajar pelbagai jenis tatabahasa dan peribahasa. ianya mestilah boleh dipercayai dan bermakna. Ini mungkin memerlukan guru membina ujian yang lebih menyeluruh dan bercorak sumatif bagi tahap tersebut. Bincangkan. Kita harus bertanya samada ujian yang diberi dapat memberi ukuran yang konsisten kepada seseorang pelajar jika pelajar tersebut mengambilnya berulangkali. Pada pendapat anda. 5. tidak berubah dan tetap sama. . Skoran yang tidak konsisten yang disebabkan pembolehubah seperti kandungan yang tidak berkaitan. Begitu juga dengan sesuatu ujian yang dijalankan dan dihasilkan. kohort dan sebagainya. boleh di agak atau dijangka dan tepat.

Sebuah jam sebagai alat pengukur masa yang sah perlu boleh dipercayai dari segi ketekalan waktu yang ditunjukkannya.20 walaupun waktu yang sepatutnya pukul 8.15 atau pukul 8. seorang guru biasanya mengharapkan untuk memperoleh pengukuran yang sama keatas sesuatu benda yang yang diukur. kita katakan pengukurannya tidak tepat dan tidak boleh dipercayai. Perkara yang hendak dinilai ialah ketekalan pengukurannya sebagai alat penguji. kita setuju bahawa jam adalah alat yang sah untuk mengukur masa. mendapatkan pertimbangan yang sama apabila mengunakan penimbang yang berbeza dalam masa yang berbeza. Dalam mengukur pencapaian pelajar pula. Dalam memilih dan membina ujian bahasa di bilik darjah amatlah penting bagi guru bahasa memikirkan tentang kebolehpercayaan sesuatu ujian yang hendak digunakan. Dengan kata lain. Dalam ujian bahasa kita boleh katakan bahawa kebolehpercayaan sesuatu ujian sebagai ketekalan. Sekiranya jam itu menunjukkan pukul 8. Contohnya. Konsep asas teori pengujian menyatakan bahawa skoran yang dicerap atau diperhatikan (observed score) iaitu skor yang didapati oleh seseorang pelajar didalam sesuatu ujian mempunyai dua komponen : i) ii) skor sebenar ( true score iaitu ukuran sebenar kebolehan pelajar ) dan skor ralat ( error score iaitu ukuran yang disebabkan oleh alat dan kaedah pengukuran ) Oleh itu kita boleh membuat anggapan bahawa tiada skor yang menjadi ukuran sebenar bagi kebolehan seseorang. iaitu kesahan. Alat ini mempunyai syarat terpenting sebagai alat penguji. guru mengharapkan keputusan ujian dakan tekal bagi gua ujian yang sama bentuk yang dijalankan kepada kumpulan yang sama pada dua masa yang berbeza. atau. iaitu ketekalan (kebolehpercayaan) pengukurannya. Misalnya.00 tepat. sekiranya ujian digunakan pada pelajar yang . ukuran waktu yang ditunjukkan tidak tekal. Selain itu kita persoalkan syarat kedua.Dalam bilik darjah atau makmal. Jam yang baik akan menunjukkan waktu pukul lapan setiap hari apabila berita TV3 dibacakan. iaitu mengukur sesuatu kemahiran atau aspek bahasa yang hendak diukur. Kebolehpercayaan ujian tersebut ialah mengenai ketekalannya mengukur sesuatu kemahiran atau aspek bahasa yang diukurnya.

ujian ejaan yang mengandungi 25 atau 50 item ejaan. Guru janganlah menggunakan item soalan yang terlampau susah. Guru bahasa boleh membina ujiannya sendiri atau memilih dan menggunakan ujian yang sedia ada. Kaedah Bentuk Selari dan Kaedah Belah Dua. Setiap satunya merujuk kepada ketekalan pengukuran yang boleh dihasilkan sesuatu ujian. Sebaliknya berlaku. Oleh yang demikian item-item tersebut tidak dapat berfungsi dalam membezakan antara kedua-dua golongan pelajar tersebut. Kebolehpercayaan item bermaksud ketekalan sesuatu item ujian itu membezakan murid yang lemah dalam sesuatu kemahiran atau aspek bahasa. Contohnya. Ada tiga kaedah yang dikemukakan untuk menghitung kebolehpercayaan sesuatu ujian iaitu Kaedah Test-Retest. Oleh yang demikian item tersebut tidak dapat membezakan antara murid yang lemah dengan murid pandai. Sepatutnya item yang digunakan oleh guru adalah item soalan yang bercorak susah. bolehkah menunjukkan keputusan yang sama walaupun ujian itu digunakan dua kali pada waktu yang berlainan. guru perlu jangkakan bahawa terdapat ejaan yang hanya boleh dieja dengan betul oleh murid yang pandai dan kerap dieja salah oleh murid yang lemah dalam ejaannya. Selain itu. Sekiranya ini berlaku. kita katakan item tersebut tidak boleh dipercayai. terdapat tiga jenis kebolehpercayaan. sederhana dan senang dan bukan yang terlampau susah atau terlampau senang. kita katakan item ejaan yang susah mempunyai kebolehpercayaan item yang tinggi kerana ketekalannya (kebolehpercayaan) membezakan antara murid yang pandai dan murid yang lemah dalam ujian. guru janganlah menggunakan item yang terlampau senang. Kebolehpercayaan item kadang kala disebut sebagai ketekalan dalam sesuatu ujian kerana setiap item dalam ujian berfungsi dalam kebolehpercayaan atau ketekalannya membezakan murid yang pandai dengan murid yang lemah tentang kemahiran atau aspek bahasa yang diukur ujian tersebut Sehubungan itu. mengetahui faktor yang boleh mempengaruhi kebolehpercayaan sesuatu ujian dan menggunakan pengetahuan ini bagi membina atau memilih ujian. item yang kabur atau yang mempunyai dua pilihan jawapan yang boleh dianggap betul hendaklah digugurkan daripada ujian tersebut. Ini kerana murid yang pandai dan lemah pun boleh menjawabnya. Hal ini kerana murid yang lemah dan pandai tidak dapat menjawabnya. . iaitu ejaan yang susah kebanyakannya boleh dieja dengan betul oleh murid yang lemah dan tidak boleh dieja oleh murid yang pandai. Menurut teori ujian dan pengukuran.sama. Pekali kebolehpercayaan selalunya diwakili oleh nombor yang bernilai diantara 0 hingga 1 yang menunjukkan kestabilan sesuatu ujian.

Keadaan ini adalah satu perhatian khusus yang perlu diambil kira berkaitan dengan ujian semula .Bincangkan mengenai kebolehpercayaan ujian Kaedah Test-Retest         Dengan mengunakan kaedah test-retest . sekali lagi di nilai dengan korelasi. Adakah aktiviti semula dan kesan latihan dihapuskan atau hilang terus ? adakah cara lain bagi kaedah alternative ini ? Kaedah Belah-Dua  Kaedah belah-dua ini mengukur konsistensi dalam ujian. Salah satu kembimbangan yang dijangkakan adalah dikatakan sebagai latihan atau kesan tanggungan . Skoran yang diperolehi pada tadbiran ujian pertama dibandingkan pada skoran tadbiran ujian ke dua dengan menggunakan korelasi ( r ) Kaedah ini menguji pencapaian keatas waktu dan memberi kestabilan anggaran Kebanyakkan penyelidik menganggap kaedah ini amat sesuai untuk membuat pengukuran sementara. Bolehkah anda memikirkan satu contoh lain ? Kaedah Bentuk Selari    Bagi mengantikan kaedah latihan dan lain-lain masalah dengan kaedah test-retest. Ingat lagi pada pita pengukur. Sesetengah penyelidik memberi pandangan berbeza mengenai kesan latihan ini kerana kesan ini dianggap sebagai unsure kestabilan dan ketidak-stabilan dalam pengukuran sementara sesetengah yang lain menganggapnya sebagai unsure bagi pengukuran ralat rawak. dan ciri statistic. Kebolehpercayaan. Latihan atau latih-tubi adalah kelebihan kepada calon yang telah mengambil ujian tersebut. Pembina ujian biasanya memberik ujian yang selari kepada calon yang sama tetapi berlainan masa. ia mempunyai konsistensi dalaman yang tinggi. Ukuran kaki yang pertama adalah sama dengan . Apa yang berkaitan atau yang dikorelasi ? Kunci aspek kebolehpercayaan ini adalah untuk membentuk alternative yang hamper sama dengan terma kandungan. proses respons. Pembina ujianakan memberi ujian yang sama kepada calon di situasi yang berbeza. calon-calon yang sama mengambil ujian semula tidak akan berubah dari segi sikap dan tahap kebolehan mereka walaupun pada dan waktu yang berbeza. ini akan membolehkan mereka menyelesaikan atau memperbetulkan sebarang kesilapan keatas ujian yang pernah mereka ambil. dalam hal ini. kaedah dan cara. kenapa ? Anggapan yang boleh dibuat adalah. Bolehkah anda fikirkan sebarang factor yang boleh menukarkan respons seseorang dengan cepat. yang merujuk kepada konsistensi skoran ujian berbanding dengan kebolehpercayaan sebenar yang didefiniskan sebagai nisbah diantara varians sebenar dengan varians pemerhaatin Pentadbiran ujian diantara kedua-dua ujian boleh dijalankan dalam masa yang terdekat maupun masa yang berlainan Apakah yang anda dapat agak jika masa pentadbiran ujian dijalankan agak lama ? tentulah tahap kebolehpercayaan adalah meingkat.

ukuran kaki ke dua dan ketiga dan begitu juga dengan setiap ukuran sentimeternya . perubahan dalam kaedah ini adalah diperlukan dan rumusan Spearman-Brown boleh digunakan apabila membuat anggaran kebolehpercayaan dengan menggunakan kaedah belah-dua. Rumusan yang digunakan adalah : Kebolehpercayaan Ujian Penuh = 2 X kebolehpercayaan ujian separuh 1 + kebolehpercayaan ujian separuh Jika nilai kebolehpercayaan diantara kedua-belah didapati +0. d. kemahiran dan pengetahuan untuk calon. b. Untuk itu . makluman spesifik ini akan memberikan makluman kepada calon dan membolehkan variasi kepada skoran ujian yang akan meningkatkan kebolehpercayan. kita juga turut mengurangkan kadar kebolehpercayaannya. Mengapa ? Soalan yang sama jenis akan terserlah dan akan memberi makluman terhadap trait. kebolehpercayaan ujian sepenuhnya akan didapati bernilai berikut : Kebolehpercayaan ujian penuh = 2 X 0.   jalankan ujian keatas sekumpulan individu tertentu sahaja jalankan secara rawak atau kaedah penentuan yang telah ditetapkan hubungkaitkan sebahagian skoran awal dengan skoran baru korelasi ini boleh digunakan untuk membuat anggaran kebolehpercayaan ujian Kesan sabpingan kaedah ini adalah konsistensi dalamannua yang melibatkan masa ujian yang singkat. dan membahagikan soalan kepada dua . Namun begitu.80 = 0. ianya adalah uniform. c.80.  Kaedah belah dua juga turut mengurangkan atau menghapuskan beberapa masalaah seperti : keperluan menjalankan dua ujian kesukaran membina ujian semula kesan tanggungan dan pengaktifan semula perubahan sesesorang calon melalui masa Kaedah yang mudah untuk menjalan kaedah belah-dua adalah dengan :      a.89 1 + 0. Apabila kita menjalankan ujian yang agak lama.80 Satu lagi rumusan yang boleh dibuat perkiraan adalah dengan mengunakan rumus berikut : rxx = k r / (1 + (k – 1))r .

. r = adalah korelasi diantara pecahan asal    Kekurangan kepada kaedah belah-dua adalah beberapa kaedah ujian di pecahkan. mengukur hanya satu ciri) or heterogeneous (mengukur banyak ciri). Dalam erti kata yang lain. Salah satu cara bagi mengukur konsistensi dalaman adalah membandingkan skoran setiap calon dan membahagikan kepada dua bahagian. iaitu bilangan soalan ujian yang asal dari kaedah belah-dua dibahagikan dengan bilangan soalan ujian yang digunakan didalam korelasi belah-dua. yang kerapkali digunakan dalam menganggarkah kebolehpercayaan ketekalan-dalaman.2. Oleh itu. Sebagai contoh. Cronbach alpha adalah pekali alpha.1 Faktor Yang Mempengaruhi Kebolehpercayaan . Ini akan mengurangkan keslilapan sebarang ralat yang timbul akibat pecahan ujian kepada dua.<Σpq) σT2 KR21 = k k–1 ( 1 . Penyelesaian disini adalah menentukan kebolehpercayaan ujian bagi setiap komponen heterogeneous dan membandingkan dengan mengunakan korelasi komponen. Kaedah ini digunakan bagi soalan ujian yang skorannya adalah 2 atau lebih. Ini membuat pecahan memberi nilai korelasi yang tinggi. masalah yang berkemungkinan timbul adalah samada ujain belahan adalah homogeneous (i.Digunakan untuk item yang diskor secara dikotomi (betul-salah) seperti dalam ujian objektif perlbagai pilihan KR20 = k k–1 ( 1 ..<m(k-m)) ks2  Coefficicent alpha (Cronbach. Sekarang anda inginkan kebolehpercayaan ujian anda dipinda kerana bilangan soalan ujian adalah 80. Nota: Rumusan Spearman-Brown adalah digunakan untuk membuat anggaran berapakah ujian kebolehpercayaan akan meningkat apabila ujian ditingkatkan dengan memasukkan item selari. katakan ujian anda mempunyai 80 soalan. Kaedah ini digunakan bagi soalan ujian yang skorannya adalah 0 or 1. 1939). Formula Kudder Richardson 20 dan 21 dibuat berdasarkan penskoran yang dibuat secara diskrit atau dikotomi. 5. bilangan atau kadar tempoh masa ujian akan menjadi lebih lama.8 adalah berdasarkan jumlah 40 item.Σσi2) σT2   Selain dari itu. KR-20 (Kuder & Richardson.e. 1951). Nilai r = 0.8. Digunakan untuk item yang diskor secara dikotomi (betul-salah) atau politomi α = k k–1 ( 1 . Anda menjalankan kaedah kebolehpercayaan belah-dua dan mendapati r = 0. α. k = 80/40 = 2. Bilangan 40 item tersebut adalah bilangan soalan dari item asal dalam kaedah sebelumnya. Bilangan 80 adalah merupakan tempoh atau bilangan ujian yang baru. 1937.Dimana k = bilangan item dalam ujian kaedah-belah dua (baru).

Akibatnya skor ujian itu tidak boleh dipercayai. Tempoh Ujian Pada amnya semakin panjang atau lama tempoh ujian semakin tinggi kebolehpercayaan skor ujian itu. Ralat Rawak Prestasi seseorang adalah berubah-ubah mengikut keadaan sekelilingnya. penat.Antara yang dipercayai mempengaruhi kebolehpercayaan ujian ialah :- Kemohogenan Item Item ujian yang homogen ialah item-item yang mempunyai kesamaan dari segi prestasi atau peluang untuk dipilih. Ini bermakna tiap-tiap opsyen mestilah berkaitan antara satu sama lain dan ada daya tarikan untuk dipilih oleh pelajar. malahan skor kurang dinganggu oleh tekaan. Misalnya semasa ujian tiba-tiba bunyi bising di sekeliling calon atau bunyi loceng amaran berbunyi. Bagi ujian berbentuk objektif aneka pilihan. Opsyen yang tidak ada persamaan boleh menjejaskan kebolehpercayaan skor ujian. Lain-lain contoh ralat rawak adalah seperti sakit. ketegangan emosi. Jika pemilihan itu tidak tepat. Oleh itu item tersebut adalah semata-mata sample bagi mewakili keseluruhan trait mengenai kebolehan seseorang. ia menyumbangkan kepada varians ralat pengukuran. Ini akan menyebabkan tumpuan dan konsentrasi calon dan varians skor ralat akan masuk ke dalam varians skor yang dicerap. pilihan jawapan mestilah homogen. Pihak pentadbir yang mengendalikan ujian hendaklah menyediakan keadaan dan persekitaran tempat yang sesuai dan peraturan pentadbiran ujian yang sempurna. Ini adalah kerana tempoh ujian dapat memberikan persampelan yang baik dari segi tingkah laku yang ingin diukur. Pensampelan Item Item-item yang dogunakan dalam sesuatu ujian adalah untuk menguji sebahagian trait yang menjadi pentunjuk kepada kebolehan seseorang. Sebarang perubahan yang berlaku di sekeliling menyebabkan prestasi berubah. Jawapan atau distraktor seharusnya tidak bias sehingga pelajar yang diuji terlalu mudah mengenal pasti jawapan atau bukan jawapan. . risau dan lain-lain.

dan bagi kebanyakkan orang perbezaan pada kadaran 0.7 ) = 25. pengukuran ralat piawai akan memaklumkan keberkesanan skoran individu pelajar atau calon. Nilai julat indeks kebolehpercayan adalah diantara -1.5. Oleh kerana perkara sebegini tidak akan berlaku. alpha akan mengukur kebarangkalian kebolehpercayaan dengan mengunakan ketekalan hasilan keputusan ujian.2.7 = 33 atau 30 – 2. adalah lebih mudah untuk mencapai tahap kebolehpercayaan yang diperlukan. terdapat satu lagi indeks penting yang dipanggil indeks kebolehpercayaan atau “ alpha ( α ) “.00.3 Mempertingkatkan Kebolehpercayaan Bagi mempertingkatkan kebolehpercayaan. jika calon memperolehi skoran 30 pada ujian pertama. calon dijangka akan memperolehi skoran 30 + (2 x 2. Namun. Perhatian hendaklah diberi terhadap tahap kebolehpercayaan yang berdasarkan ketekalan sample ujian dan percambahan ujian tersebut. ianya akan berada pada tahap 2. Ini bermaksud .7) = 35 dan 30 – ( 2 x 2. ujian yang lebih lama adalah dipercayai lebih reliable dari ujian yang pendek.2. ini akan meningkatkan tahap kebolehpercayaan keseluruhan dan nilai 0. 5. Jika sasaran populasi adalah pelbagai. Tahap yang dimaksudkan adalah jika 68% ketentuan maka ia akan ada pada tahap purata 1 atau pun jika pada tahap 96% . beliau dijangka akan memperolehi purata skoran diantara 30 + 2.2 Indeks Kebolehpercayaan Selain dari nilai purata p ( indeks kesukaran ). Sebagaimana larian marathon memberi lebih jarak atau ruang diantara pelumba lari dari pelumba acara pecut 100 meter dan membolehkan pelumba ruang untuk menyusun langkah larian atau merapatkan larian. Dan apabila sesuatu ujian atau peperiksaan diambil kira. Oleh itu.65 bagi setiap kertas ujian adalah memadai. kita boleh mengenalpasti pada tahap 68%.3 Kesahan Ujian . 5.7 = 27 dan pada tahap 96% pula. nilai indeks kebolehpercayaan mestilah nilai positif. pendapat menyatakan agar tempoh masa ujian di panjangkan dan bilangan soalan ujian ditambah atau dibanyakkan.00 hingga + 1.85 adalah diperlukan. Indeks kebolehpercayaan akan menunjukkan pada tahap manakah hasilan keputusan ujian adalah sama jika semua pelajar mengambil atau mengulang semula ujian yang telah diambil ( dengan anggapan pelajar tersebut tidak ingat atau lupa akan ujian yang lepas ). dan jika calon mengulang ujian yang sama. Ia akan mengenalpasti ditahap manakah skoran akan dikenalpasti ketepatannya. yang memerlukan perbezaan besar dalam mengukur kebolehan dan pengetahuan.

Adakah ujian bertutur benar-benar dapat menguji dan mengukur kemahiran murid bertutur?. Dalam bidang pengujian bahasa. Jika guru tidak diawasi. Konsep kesahan sesuatu ujian bahasa sebagai alat untuk mengukur dan mengkuantitikan sesuatu kemahiran atau aspek bahasa tidak berbeza dengan konsep kesahan alat pengukur yang lain. Kadang kala sesuatu ujian mungkin tidak tepat mengukur perkara yang hendak diukur tetapi hanya mengukur sedikit sahaja atau sipi-sipi. Bincangkan . sesuatu ujian merupakan alat untuk mengukur sesuatu kemahiran atau aspek bahasa. Oleh sebab sesuatu ujian yang tidak sah adalah dianggap tidak berguna maka seseorang itu hendaklah membentangkan bukti yang boleh memberi keyakinan bahawa ujian yang digunakannya mengukur tepat cirri-ciri ujian yang berkenaan direka bentuk untuk diukur. Dalam menilai kesahan ujian sesuatu ujian untuk tujuan tertentu kita hendaklah memeriksa satu atau lebih dari jenis kesahan berikut. Contohnya. ujian tatabahasa yang dibina guru tidak menguji pengetahuan tatabahasa sebaliknya menguji kosa kata. Sesuatu alat pengukur tidak memiliki kesahan untuk “semua tujuan”. Adakah ujian yang dibina benar-benar dapat menguji dan mengukur kemahiran murid mendengar?. Tinggi atau rendah kesahan sesuatu ujian bergantung pada ketepatannya mengukur sesuatu kemahiran atau aspek bahasa yang perlu diukur berdasarkan tujuan atau fungsi pengujian. kosa kata dan sebagainya amatlah penting bagi guru mempersoalkan kesahan ujian yang dibina. Dalam ujian bahasa timbul persoalan sama ada kesahan sesuatu ujian dianggap tinggi atau rendah menurut ketepatan mengukur sesuatu kemahiran atau aspek bahasa yang hendak diukur. Adakah ujian kosa kata yang dibina guru benar-benar menguji perbendaharaan kata pelajar atau hakikatnya menguji tatabahasa? Atau berlaku sebaliknya. Berikan definisi kesahan ujian. bertutur. menulis atau aspek bahasa lain seperti tatabahasa. Seterusnya kita melihat jenis kesahan yang terdapat dalam ujian yang baik. Sesuatu ujian mungkin sangat sah untuk sesuatu tujuan atau untuk sesuatu tahap umur ataupun untuk jenis subjek tertentu tetapi ia tidak mungkin sah dalam situasi lain. Perkara lain yang hendak diukur tidak terukur dan perkara lain pula yang terukur. Setiap kali guru membina ujian bahasa. Contoh-contoh ini perlu ditanyakan kepada diri sendiri apabila membina sesuatu alat ujian bahasa untuk menjaga darjah kesahan atau kesahihannya.Alat taksiran yang mengukur apa yang ia ukur adalah sah. ujian ejaan dianggap sah sekiranya benar-benar dapat mengukur kebolehan pelajar mengeja. membaca. kadang kala alat ujian yang dibina tidak menepati tujuan ujian. sama ada menguji kemahiran mendengar.

2 Kesahan Gagasan Kesahan gagasan adalah satu unsure yang dihipotesiskan untuk menerangkan beberapa aspek tingkahlaku manusia seperti kebolehan mekanik. Untuk menentukan kesahan kandungan. tatabahasa. Bahagian yang mengisi konstrak mengenai sesuatu kemahiran bahasa sebenarnya adalah subkemahiran yang membina sesuatu kemahiran bahasa. apakah konstruk (konsep) sebuah kereta? Sebuah kereta terdiri daripada enjin. Kesahan konstruk ialah satu konsep atau gagasan tentang sesuatu perkara atau benda sama ada yang abstrak atau maujud. Contohnya. menulis karangan. peribahasa. Ujian bahasa yang dibina bagi menilai kemajuan murid pada tahap tersebut mungkin mengandungi ujian tentang kemahiran lisan.3. ujian bulan Februari guru hendaklah menguji beberapa aspek tatabahasa yang telah diajarnya dalam bulan tersebut. Dalam bidang pendidikan bahasa. cermin. apakah subkemahiran yang membina kemahiran bertutur? . Bagaimanapun. membaca. Ujian bahasa yang bersifat sumatif seperti ujian akhir penggal. pembina ujian hendaklah menganalisiskan kandungan sesuatu bidang ujian yang dinilai dan sterusnya menstruktur satu alat yang representative untuk mengukur pelbagai apsek kandungan berkenaan. meringkaskan karangan. pertengahan tahun dan ujian tahunan biasanya memerlukan guru membuat persampelan yang lebih luas tentang kemahiran dan aspek bahasa yang perlu diuji. kesahan persampelan. skop ujian hendaklah mewakili pengajaran dan pembelajaran yang telah berlaku dalam tempoh tersebut.3. gear. roda dan sebagainya. Perkara penting dalam kesahan ini guru perlu merujuk semula rekod pengajaran seperti buku rekod mengajar dan sukatan pelajaran.5. kosa kata dan sebagainya. Kesahan ini mempersoalkan sama ada sesuatu ujian mengandungi satu sampel yang seimbang tentang perkara yang telah diajar seperti yang terdapat dalam sukatan pelajaran atau program pengajaran. Juga dikenali dengan panggilan kesahan konstruk. roda.1 Kesahan Kandungan Kesahan ini juga dikenali sebagai kesahan logic. kecedersan atau sifat pendiam. Kesahan ujian isi tinggi sekiranya item ujian yang dibina mewakili semua aspek tatabahasa yang telah diajar dalam bulan itu. atau kesahan kurikulum dan digunakan meluas dalam ujian pencapaian. Hal ini penting bagi ujian yang berbentuk sumatif atau formatif. 5. Contohnya. Contohnya. setiap kemahiran bahasa seperti kemahiran mendengar. bertutur dan membaca adalah konstrak atau konsep yang agak abstrak.

Oleh yang demikian. Bagi Hearon (1979). dan sama ada ujian itu menguji subkemahiran yang dianggap penting dalam sesuatu kemahiran bahasa yang hendak diuji. tatabahasa. Menurut Savignon (1983). Mengandungi dua sub-kelas iaitu kesahan permala dan kesahan serentak. perlulah disemak semula setiap item atau soalan supaya tidak terkeluar daripada batasan atau tujuan ujian dibina. kesahan ujian itu dari segi konstraknya boleh dipertikaikan. menyusun isi. Sekali pandang ujian ini mungkin mempunyai kesahan muka yang benar-benar menguji kefahaman bacaan. Sebelum guru boleh menguji kemahiran muridnya dalam kemahiran membaca. Subkemahiran yang terlibat dalam sesuatu kemahiran asas bahasa sebenarnya pengisi konstrak tersebut. 5. guru telah membina satu ujian untuk menguji kefahaman bacaan pelajar dengan menggunakan soalan berbentuk aneka pilihan. Contohnya. Sebaiknya sebelum ujian dicetak atau ditadbir. Selepas diteliti. kita persoalkan sama ada ujian tersebut benarbenar menguji konstrak kita mengenai kemahiran tersebut. kosa kata dan aspek mekanis dalam penulisan. Dalam menguji sesuatu kemahiran bahasa. guru ingin melihat subkemahiran penting seperti memilih isi. Selepas guru membina ujian yang bertujuan menguji sesuatu kemahiran atau aspek bahasa. guru seharusnya faham dengan konstrak kemahiran membaca. antonim dan dan penggunaan imbuhan. Item yang dimaksudkan bukanlah menguji kefahaman bacaan murid dalam erti kata sebenarnya. Tanpa mengenali konstrak mengenai sesuatu kemahiran atau aspek bahasa.3. ujian mesti kelihatan mengukur apa yang sepatutnya hendak diukur. didapati terdapat beberapa item soalannya menguji kefahaman murid mengenai sinonim. tidak mungkin kita boleh membina ujian yang sah dan menepati konstrak tersebut. kesahan konstrak mengenai sesuatu kemahiran yang hendak diuji sangat penting. kesahan muka saja tidak mencukupi. sebab kadang kala ujian bercorak „superficial‟ sahaja.3 Kesahan Kriteria Kesahan yang ditunjukkan melalui perbandingan skor ujian dengan satu lebih pembolehubah luaran atau criteria yang dianggap berupaya menyediakan pengukuran secara terus terhadap tingkahlaku atau sifat tertentu dibawah kajian. . dapatkan pandangan guru lain mengenai kesesuaian item dengan kemahiran atau aspek yang hendak diuji. Sebelum guru boleh menguji dan menilai kemahiran muridnya menulis karangan. Contohnya. kita akan mengukur dan menilai subkemahiran yang tidak berkaitan.Apabila kita hendak menilai sama ada ujian mengenai sesuatu kemahiran bahasa itu mengandungi kesahan konstrak atau tidak. dalam menguji kemahiran murid menulis karangan. dia seharusnya faham dengan konstrak kemahiran mengarang dalam bahagian penting yang terdapat dalam sesuatu karangan yang baik. Sekiranya konstrak kita mengenai sesuatu kemahiran itu salah.

Bezanya ialah hasil yang diramal diukur pada masa yang agak sama dengan ujian peramal dibuat. akan dikaitkan dengan penilaian guru mereka ataupun dikaitkan dengan skor-skor yang didapati melalui ujian yang serupa yang telah disahkan. Bandingkan kesahan peramal dan kesahan serentak. Kesahan serentak menyediakan bukti dengan agak cepat tentang keraguan sesuatu ujian. dan iii) lakukan korelasi diantara skor ujian tersebut dengan prestasi sebenar ujian yang dibentuk untuk diramal. Sesuatu ujian yang meramal dengan tepat tingkahlaku pada masa hadapan yang kerananya dibentuk. Semakin tinggi korelasi yang diperolehi semakin berkesanlah ujian berkenaan sebagai satu peramal. kita boleh mengaitkan skor yang diperolehi dalam ujian orang-orang yang berjaya dalam sesuatu pekerjaan dengan skor yang diperolehi dalam ujian pekerjaan lain untuk menentukan samada ujian berkenaan membezakan dua kumpulan tersebut. Daripada menunggu beberapa tahu samada sesuatu ujian minat vokasional berupaya meramal kejayaan dalam sesuatu pekerjaan. Contohnya sekiranya sesuatu ujian baru di struktur. Masalah yang dikaitkan dengan kesahan peramal adalah ianya hanya boleh diterima hanya dalam situasi dimana ia telah disahkan atau dalam situasi yang sama. ii) tunggu hingga prestatsi yang diramalkan oleh ujian berkenaan berlaku. Prosedur asas untuk menentukan kesahan peramal ialah i) mentadirkan ujian berkenaan. tetapi hakikatnya bahawa ujian yang memeliki kesahan serentak tidaklah menjamin yang ia memiliki kesahan peramal. ii) Kesahan Serentak Prosedur yang digunakan untuk menentukan kesahan serentak adalah sama dengan prosedur yang digunakan untuk menentukan kesahan peramal. yang mungkin lebi mahal dan lebih sukar untuk ditadbiekan.i) Kesahan Peramal Pendidik biasanya berminat menggunakan sesuatu ujian untuk meramal sesuatu pada masa hadapan seperti kejayaan dalam persekolahan atau pekerjaan. skor yang diperolehi para pelajar dalam ujian ini boleh dikaitkan dengan markah yang didapati dalam ujian sebelumnya untuk subjek yang sama. Apakah perbezaan ketara diantara kedua kesahan ini. dikatakan memiliki kesahan peramal.? .

Indek diskriminasi ialah pekali korelasi yang mengaitkan skor ujian ( data selanjar ) dengan skor setiap opsyen ( data dikotomous .Rumusan Sesetengah ahli bijak pandai mempertikaikan mengenai pandangan amalan tradisi bahawa “ kebolehpercayaan adalah satu kemestian tetapi kesahan tidak diperlukan” dan kenyataan ini adalah disangkal. Boleh ditakrifkan sebagai peratusan pelajar yang menjawab ujian dengan betul. Lagi besar peratusan jawapan betul yang diperolehi lagi mudahlah sesuatu item. Kesahan. . Satu cara untuk mencari ketakalan dalaman atau keseragaman soalan Indeks Kesukaran. sesuatu ujian itu dikatakan sah. Lagi tinggi peratusan item kesukaran lagi mudahlah item tersebut Indeks Diskriminasi. Pandangan berikutnya menyatakan satu pengukuran boleh menjadi tidak boleh dipercayai tetapi hendaklah mempunyai tahap kesahan yang tinggi. 1 jika memilih dan 0 jika tidak memilih opsyen bagi sesuatu item berkenaan. Glosari Cronbach Alpha. Dengan perkataan lain. Indeks kebolehpercayaan akan menunjukkan pada tahap manakah hasilan keputusan ujian adalah sama jika semua pelajar mengambil atau mengulang semula ujian yang telah diambil ( dengan anggapan pelajar tersebut tidak ingat atau lupa akan ujian yang lepas ). sekiranya ujian berkenaan boleh mengukur sesuatu yang sebenarnya hendak diukur atau sepatutnya diukur. Satu kaedah statistic mungkin mendapatkan satu nilai keatas persamaan sample yang bersamaan dengan parameter populasi tetapi akan mempunyai kadar variance yang tinggi ketas sample yang kecil. Kesahan sesuatu ujian merujuk kepada sejauh mana ujian berkenaan dapat mengumpul maklumat berkaitan bidang yang ditetapkan. rbis digunakan untuk menentukan darjah keupayaan sesuatu item bagi membezakan antara calon daripada kumpulan yang mempunyai market keseluruhan ujian yang tinggi dengan yang rendah Indeks Kebolehpercayaan. Institusi pemikir memberikan konsep bahawa kebolehpercayaan sebagai invariance dan kesahan adalah unbiasedness. ujian yang terlibat ialah praujian dan pascaujian. Dalam konteks Pembelajaran Masteri.

Inc. ketepatan. Test Construction. 1937. Measurement and Evaluation in Psychology and Education. tepat seperti yang sepatutnya serta boleh diterima pakai tanpa keraguan.A. Barbara et al (2002). Al (1991). New York : Macmillan Wood. Konstruk ialah satu konsep atau gagasan tentang sesuatu perkara atau benda sama ada yang abstrak atau maujud Kesahan Kandungan. (1960).<m(k-m)) ks2 Rujukan Moskal. Kebolehpercayaan. Journal of Engineering Education Thorndike. Merill Books. Kaedah ini digunakan bagi soalan ujian yang skorannya adalah 0 or 1. (5th Edition).  KR-20 (Kuder & Richardson. et. Ini bermaksud sesuatu ujian yang boleh dipercayai akan menghasilkan maklumat yang tekal (merujuk kepada beberapa pentadbiran ujian yang telah dijalankan). Formula Kudder Richardson 20 dan 21 dibuat berdasarkan penskoran yang dibuat secara diskrit atau dikotomi. Menurut Savignon (1983).Digunakan untuk item yang diskor secara dikotomi (betul-salah) seperti dalam ujian objektif perlbagai pilihan KR20 = k k–1 KR21 = k k–1 ( 1 . dan kebolehbergantungan ujian berkenaan. reliability and the assessment of engineering education. ujian mesti kelihatan mengukur apa yang sepatutnya hendak diukur. 1939). . Kesahan ini mempersoalkan sama ada sesuatu ujian mengandungi satu sampel yang seimbang tentang perkara yang telah diajar seperti yang terdapat dalam sukatan pelajaran atau program pengajaran Kesahan Kriteria. Kebolehpercayaan sesuatu ujian merujuk kepada ketekalan. Validity. Charles E.<Σpq) σT2 ( 1 . D.Kesahan Gagasan. Columbus. OH.

Understanding Educational Research. (Dr. CITO.Inc .McGraw-Hill. 4th Edition. D.Van Krieken. Writing and Administring Examinations.P.. Van Dalen. (1979). R.) (1995).

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->