P. 1
51713785 Aplikasi Irt Pada Konversi Nilai Uan 2004

51713785 Aplikasi Irt Pada Konversi Nilai Uan 2004

|Views: 53|Likes:
Published by Simiati Nurwakhidin

More info:

Published by: Simiati Nurwakhidin on Apr 25, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

01/09/2013

pdf

text

original

APLIKASI IRT PADA KONVERSI NILAI UAN 2004

[Diposting: 18 Januari 2005|2746 Pembaca]

[Cetak Tulisan ini] APLIKASI IRT PADA KONVERSI NILAI UAN 2004 Daryono, Guru SMA 8 Tangerang

Abstrak Metode Item Response Theory (IRT) saat ini dianggap lebih mampu memberikan rasa keadilan (test fairness) pada peserta UAN karena tingkat kecermatannya sangat tinggi yang mampu memberikan penghargaan pada prestasi setiap individu siswa sesuai dengan tingkat kesulitan soal yang dihadapi. Keunggulan utama IRT adalah statistik soal seperti tingkat kesukaran soal, daya pembeda soal, dan sebagainya terletak dalam skala yang sama dengan kemampuan siswa yang diukur. Model IRT yang banyak digunakan adalah unidimensionality dan local independence. Unidimensionality ada tiga model yaitu : satu parameter model (Rasch model), dua parameter model, dan tiga parameter model. Dari ketiga model tersebut yang menjadi dasar Tabel Konversi adalah Rasch model, karena memiliki keunggulan di dalam menentukan tingkat kesukaran butir soal. Tingkat kesukaran butir soal tidak berubah sekalipun dijawab oleh kelompok berkemampuan tinggi atau kelompok berkemampuan rendah. Selain itu Tabel Konversi yang digunakan pada UAN sebenarnya merupakan salah satu penerapan sistem ujian pada norma kelompok (normreferenced measurement). Tujuan dari adanya Tabel Konversi adalah membuat skala yang sama untuk membuat perbandingan atau pemetaan kualitas pencapaian (educational attainment) antardaerah di negara kita. Jadi Tabel Konversi bukan untuk menolong siswa yang kurang siap mengikuti UAN. Pendahuluan. Evaluasi dalam sistem pendidikan merupakan salah satu kegiatan yang sangat penting untuk dilakukan dalam periode-periode tertentu dengan tujuan untuk memonitor kualitas pendidikandan dan membantu kegiatan belajar mengajar dikelas. Dalam berbagai referensi akademik ujian (examination) berbeda dengan evaluasi (evaluation). Ujian digunakan untuk mengetahui sejauh mana seseorang mencapai standar mutu yang ditentukan, sedangkan evaluasi digunakan untuk mengetahui sejauh mana proses pencapaian tujuan telah dilaksanakan. Ujian lebih berkaitan dengan kinerja individu (individual performance), sedangkan evaluasi berkaitan dengan kinerja lembaga (institusional performance). Ujian bisa dilakukan siapa saja, baik yang terkait maupun tidak terkait proses pembelajaran, sedangkan evaluasi hanya dilaksanakan oleh pihak yang terkait proses pembelajaran. Dengan kata lain, ujian bisa dilakukan pihak eksternal, sedangkan evaluasi hanya dilakukan oleh pihak internal. Maka UAN yang dilaksanakan Depdiknas berbeda dengan ebtanas. UAN adalah ujian, sedangkan ebtanas adalah evaluasi. Resistensi sekelompok masyarakat pada UAN yang memberikan landasan

Skor murni adalah nilai rata-rata skor perolehan teoritis sekiranya dilakukan pengukuran berulang-ulang terhadap seseorang dengan menggunakan alat ukur yang sama. Batas kelulusan harus menunjukkan seberapa jauh nilai UAN yang dicapai siswa terhadap kriteria standar kelulusan yang ditetapkan secara nasional. kemudian melakukan upaya-upaya sistematis dalam memperbaiki sekolah dan proses pembelajaran untuk mencapai keunggulan. sebagai sarana untuk meningkatkan mutu pendidikan. Teori Tes Klasik ( Classical Test Theory).argumentasinya pada Pasal 58 Ayat (1) UU Sisdiknas yang berbunyi : Evaluasi hasil belajar peserta didik dilakukan oleh pendidik untuk memantau proses. Teori tes klasik disebut demikian. dan perbaikan hasil belajar peserta didik secara berkesinambunganµ. Hasil ujian harus dapat digunakan sebagai umpan balik (feedback) perbaikan proses pendidikan. Artinya makin tinggi rata-rata nilai ujian. Asumsi 4 : Skor-skor kesalahan pada dua tes (yang dimaksud untuk mengukur hal yang sama ) tidak saling berkorelasi. didukung Pasal 35 UU Sisdiknas tentang pentingnya standar nasional pendidikan. Ujian sekolah juga berfungsi mengendalikan mutu pendidikan. Asumsi 3 : Skor murni dan skor kesalahan yang dicapai oleh suatu populasi subyek pada suatu tes tidak berkorelasi satu sama lain. Masalahnya. Sejalan dengan wewenangnya dalam pengendalian mutu (quality control). namun tetap bertahan. pemerintah melaksanakan jenis ujian seperti ini sebagai bahan pemetaan. serta latar belakangnya untuk dianalisis pengaruhnya terhadap tinggi rendahnya nilai ujian seorang siswa. Jadi tidak ada hubungan sistematik antara skor murni dan skor kesalahan. perlu digunakan satu standar kelulusan dengan perangkat tes yang mempunyi tingkat kesulitan sama untuk seluruh wilayah. Hal ini sangat penting di era desentralisasi. kemajuan. Berangkat dari paradigma di atas. Secara yuridis penyelenggaraan UAN oleh Depdiknas. Masalahnya apakah sudah tepat Depdiknas memasang angka 4. Asumsi 5 : Jika ada . Inti dari teori tes klasik berupa asumsi-asumsi yang dirumuskan secara matematis. Sehingga dengan menggunakan hasil UAN dapat dimonitor kapasitas guru-guru. karena unsur-unsur teori tes itu sudah dikembangkan dan diaplikasikan sejak lama. Skor perolehan pada umumnya meleset dari menampilkan secara tepat besaran atribut yang diukur. Sesuai fungsinya dalam penjaminan mutu. makin tinggi mutu pendidikan. dan seberapa sering?. terutama kalau dilihat dari arah penerapannya di bberbagai bidang kehidupan. Untuk menghindari insiden diskriminasi terhadap provinsi tertentu. Jadi skor yang diperoleh dari sesuatu pengukuran pada umumnya tidak menunjukkan keadaan yang sebenarnya. Ujian siswa juga mengukur data sekolah. data siswa.01 sebagai kriteria kelulusan?. menunjukkan kelompok masyarakat itu tidak memahami bahwa UAN adalah salah satu bentuk ujian bukan evaluasi. untuk mengelola pendidikan di tiap daerah menyangkut faktor-faktor apa saja yang perlu diperbaiki agar mutu pendidikan meningkat. Asumsi 1: Skor perolehan terdiri dari skor murni dan skor kesalahan pengukuran. ujian dapat dilakukan oleh lembaga independen dalam rangka memberi umpan balik berupa saran-saran. Fungsi ujian sekolah lainnya adalah penjaminan mutu pendidikan. Asumsi 2 : Nilai harapan skor perolehan sama dengan skor murni. tinggi rendahnya diukur dengan apa. fasilitas pendidikan dan proses pembelajaran. Syarat pokok dalam pengukuran ulang itu adalah hasil pengukuran yang satu harus bebas dari hasil pengukuran yang lain. dari mana. pada makalah ini bertujuan untuk sebuah pemikiran dasar tentang apa dan bagaimana konsep IRT itu apabila diaplikasikan pada konversi nilai UAN yang pada gilirannya dapat memberikan pemetaan mutu pendidikan.

terutama dalam kehidupan praktis. Tetapi kalau soal-soal tersebut diberikan kepada orang-orang yang kurang pandai. Secara konsep dalam teori tes klasik tidak ada hubungan antara tingkat kesukaran soal dengan kemampuan siswa. Kuadrat korelasi antara skor-skor perolehan dengan skor-skor murni sama dengan satu dikurangi nisbah antara varians skorskor kesalahan dengan varians skor-skor perolehan1[1] Dapat dikatakan bahwa kelemahan utama teori tes klasik adalah bahwa alat ukur yang disusun berdasarkan tes klasik itu terikat kepada sampel (sample bound). varians skor-skor perolehan sama dengan varians skor-skor murni ditambah varians skor-skor kesalahan. karena kemungkinan sebagian besar orang-orang dalam kelompok tersebut tidak dapat menjawab dengan benar.dua tes yang dimaksudkan untuk mengukur atribut yang sama. Nilai harapan hasil skor-skor kesalahan dan skor-skor murni sama dengan nol. maka skor-skor kesalahan pada tes pertama tidak berkorelasi dengan skor-skor murni pada tes kedua. Jadi dalam teori tes klasik tingkat kesukaran soal tidak tetap tergantung kepada tingkat kemampuan sampel siswa yang menempuh tes tersebut. Karena itu jika seperangkat tes diberikan kepada kelompok subyek yang rendah kemampuannya akan merupakan tes yang sukar. Nilai harapan skor-skor kesalahan seseorang subyek sama dengan nol. dan akan terlihat berkemampuan rendah apabila mereka mengerjakan tes yang sulit. Kuadrat korelasi antara skorskor perolehan dan skor-skor murni sama dengan nisbah antara varians skor-skor murni dan varians skor-skor perolehan. namun dalam kenyataannya teori ini masih bertahan 1 2 3 . tingkat kesukaran soal tersebut akan terlihat mudah. Kesimpulan 2. Selain itu dalam teori tes klasik juga sulit untuk menyeleksi soal-soal yang tingkat kesukarannya sesuai dengan kemampuan siswa yang akan diukur. maka soal tersebut akan terlihat sukar. bila menggunakan teori tes klasik tidak menjamin akan memperoleh keputusan yang terbaik bagi validitas pengambilan keputusan (validity of classifactory decisions). Sebagai ilustrasi bahwa dalam teori tes klasik tingkat kesukaran soal-soal memang sulit untuk mengestimasi kemampuan siswa akan dijelaskan sebagai berikut 3[3]: misalkan suatu soal diberikan kepada kelompok orang-orang yang pandai. Jika seorang dites dengan suatu tes yang sama berulang-ulang maka rata-rata skor-skor kesalahannya sama dengan nol. Kesimpulan ini kemudian sangat penting dalam hubungannya dengan reliabilitas tes. dan apabila diberikan kelompok subyek yang tinggi kemampuannya akan merupakan tes yang mudah2[2]. Kesimpulan 4. Demikian pula kelompok subyek yang dikenai tes guna menyusun tes tersebut juga hanya sampel dari populasi subyek yang sangat besar jumlahnya. Sekelompok subyek akan terlihat mempunyai kemampuan tinggi kalau mereka mengerjakan tes yang mudah. Kesimpulan 5. maka berdasarkan teori tes klasik. Hal-hal seperti di atas akan menimbulkan kesukaran-kesukaran. Dari kelima asumsi tersebut maka dapat dikemukakan kesimpulan-kesimpulan berikut : Kesimpulan 1. Demikian pula kalau dilihat dari arah subyek. Sehingga apabila soalsoal diseleksi untuk merakit sebuah perangkat tes berdasarkan tingkat kesukaran soalsoalnya untuk mengikuti standar kelulusan yang ditetapkan. Kesimpulan 3. Butir-butir soal yang dirakit menjadi suatu perangkat alat ukur atau tes hanyalah sampel dari populasi butir soal yang sangat besar jumlahnya. Walaupun banyak kelemahan. karena sebagian besar akan menjawab dengan benar.

ETS (Educational Testing Service). Ujian Masuk Perguruan Tinggi Negeri (UMPTN).sebagai dasar pengembangan tes di mana-mana. misalnya alat ukur panjang. Evaluasi Belajar Tahap Akhir Nasional (Ebtanas). jadi model itu mungkin tidak secara baik meramalkan atau menjelaskan data tersebut5[5]. Walaupun keberlakuan asumsi-asumsi itu tidak dapat ditentukan secara langsung. dan mendasari kinerja (performance) atau respons subyek terhadap butir soal tertentu. atau sifatsifat laten. atau kemampuan (ability). Artinya suatu model respons butir soal dapat sesuai atau cocok dengan suatu perangkat tes data tertentu. dan keseuaian model dengan data juga dapat dinilai. dapat pula tidak. ACER (Australian Foundations for Educational Research). Ada banyak model respon butir soal yang dapat disusun. Oleh karena itu upaya-upaya yang dilakukan oleh para ahli adalah upaya untuk membebaskan alat ukur tersebut dari keterikatannya kepada sample. 2. namun sementara bukti tidak langsung dapat dikumpulkan dan dinilai. Kinerja (performance) seorang subyek pada suatu butir soal dapat diprediksikan atau dijelaskan dari suatu perangkat faktor-faktor yang disebut sifat-sifat. Konsep IRT berlandaskan dua postulat. Fungsi ini menyatakan bahwa apabila taraf sifat (kemampuan) meningkat. Hubungan kinerja subyek pada suatu butir soal dan perangkat sifat-sifat yang mendasari kinerja dapat dideskripsikan dengan fungsi meningkat secara monoton yang disebut fungsi karakteristik butir soal (Item Characteristic Function) atau kurva karakteristik butir soal = KKS (Item Characteristic Curve = ICC). alat ukur berat. masih memakai teori tes klasik. Konsep IRT sangat berguna untuk memecahkan masalah-masalah dalam penyeleksian soal-soal untuk mendesain suatu perangkat tes tertentu. tergantung bentuk matematis fungsi karakteristik butir soal dan atau banyaknya parameter yang terlibat dalam model itu. Suatu hal yang perlu diingat adalah bahwa perbedaan dengan teori skor murni klasik model-model butir soal itu dapat palsu. Model-model IRT meliputi seperangkat asumsiasumsi yang dikenai model itu. NFER (National Foundations for Educational Research). seperti Tes Potensi Akademik (TPA). Demikian juga beberapa tes yang digunakan di Indonesia. Teori Tes Modern Teori tes modern mendasarkan diri pada sifat-sifat atau kemampuan yang laten. ACT (American College Testing Program). yaitu4[4] : 1. Oleh karena itu setiap dalam setiap penerapan IRT adalah esensial untuk menguji keseuaian modelnya dengan datanya. Ujian Akhir Semester (UAS). Nama yang lebih populer adalah teori respons butir atau Item Respon Teori (IRT). dan lain sebagainya. Langkah pertama dalam setiap aplikasi ICC adalah mengestimasi parameter-parameter itu. Oleh karena itu teori ini menggunakan model sifat laten (latent traits model). Berbagai tes yang dikeluarkan lembagalembaga testing yang terkenal seperti. seperti diketahui alat-alat ukur fisik. maka probabilitas suatu respons yang benar terhadap suatu butir soal juga naik. Semua model ICC berisi satu parameter atau lebih yang mendeskripsikan butir soal dan satu atau lebih yang mendeskripsikan subyek. Suatu asumsi umum yang digunakan secara luas dalam model-model IRT adalah bahwa hanya satu kemampuan yang 4 5 . Model matematis yang digunakan IRT menyatakan bahwa probabilitas subyek menjawab benar terhadap butir soal tertentu tergantung kepada kemampuan subyek dan karakteristik butir soal yang bersangkutan. semuanya tidak terikat kepada sampel.

Oleh karena itu. namun dalam praktek hanya tiga model yang populer. Hal ini sama saja seperti kita ingin menimbang 1 kg kentang dan 1 kg emas. Ada tiga hal yang bisa digunakan untuk mempertimbangkan model mana yang akan digunakan apakah satu parameter model. Mengingat pentingnya Uan sebagai kegiatan penilaian prestasi belajar akhir jenjang pendidikan. setiap skor yang diperoleh siswa dari hasil UAN harus dapat dikonversikan ke dalam suatu skala baku yang bersifat nasional.01. Jadi sampel peserta ujian yang diperlukan untuk mengestimasi tiga parameter model lebih banyak daripada untuk mengestimasi satu parameter model. diperlukan tabel konversi yang disusun berdasarkan bobot butir soal yang dikembangkan melalui bank soal dan telah dikalibrasi secara nasional. Untuk memenuhi kebutuhan tersebut. Artinya alat ukur yang digunakan untuk mengukur kemampuan akademik siswasiswa Jakarta atau di kota-kota besar lainnya tentunya tidak adil jika alat serupa dipergunakan untuk melakukan hal serupa terhadap anak-anak di wilayah pelosok atau kepulauan. yaitu respons terhadap butir soal. Asumsi juga dapat mengenai karakteristik butir soal yang relevan bagi kinerja subyek pada suatu butir soal. Dari ketiga model tersebut. (3) kemampuan program komputer untuk mengestimasi parameter IRT. Pemerintah menyadari bahwa tingkat intelektualitas di tiap daerah di negara kita berbeda. yang diukur adalah prestasi atau kemampuan akademik peserta didik untuk menentukan layak-tidaknya meraih predikat lulus dari satuan dan jenjang pendidikan tertentu. namun tetap menggunakan standar-standar penilaian nasional. Mengingat ujian diadakan secara nasional maka dilakukan pembedaan tingkat kesulitan soal. yaitu (a) model logistik satu parameter. Suatu konsep lain yang langsung berkaitan dengan unidimensionalitas adalah ketidak-tergantungan lokal (local independence). Walaupun secara teori dapat disusun model-model IRT yang sangat besar jumlahnya. Secara umum dapat dikatakan bahwa semakin banyak parameter yang digunakan semakin banyak pula sampel peserta ujian yang diperlukan untuk mengestimasi parameter-parameter tersebut. (c) model logistik tiga parameter6[6]. obyektivitas dan perbandingannya nilai UAN.diukur oleh butir-butir soal yang merupakan seperangkat tes. Rasch Model dan Konversi Skor UAN Dalam konteks ujian akhir nasional (UAN). untuk menguji tingkat intelektualitasnya memerlukan adanya alat ukur yang berbeda dengan skala yang sama. Maka kita harus menggunakan timbangan yang berbeda tetapi dengan skala yang tetap sama. (2) keadaan distribusi sampel dari peserta ujian. Standar yang dimaksud adalah patokan nilai 4. Hal ini disebut asumsi unidimensionalitas (unidimensionality). atau tiga parameter model tergantung dari (1) banyaknya sampel peserta tes. (b) model logistik dua parameter. Untuk itu. model satu parameter atau Rasch model sekarang ini adalah yang paling banyak digunakan. dua parameter model. Keuntungan dari cara tersebut adalah terbentuknya skala baku nasional 6 . Suatu fungsi karakteristik butir soal atau kurva karakteristik butir soal adalah suatu rumusan matematik yang menghubungkan probabilitas keberhasilan (yaitu menjawab dengan benar) pada suatu butir soal dengan kemampuan yang diukur dengan tes itu dan karakteristik butir soal bersangkutan. Asumsi lain yang dibuat dalam semua model IRT adalah bahwa fungsi karakteristik butir soal tertentu merefleksikan hubungan sebenarnya (true relationship) antara variabelvariabel yang tidak dapat diobservasi yaitu kemampuan dengan variabel-variebel yang dapat diobservasi. baik antardaerah dan antarsekolah pada waktu yang sama sangat diperlukan.

Misalnya bila ada dua orang siswa yang berhasil menyelesaikan 30 soal Matematika dengan benar. mereka menganggap tabel konversi mempunyai dampak sebagai berikut 7[7] : 1. Hampir semua instansi mengharuskan minimal nilai rata-rata tertentu. Sistem konversi yang digunakan di Indonesia berasal dari Amerika. Sebaliknya siswa B berhasil menjawab dengan benar soal-soal yang sukar dan mudah sehingga skor akhir yang diperoleh siswa B setelah dkonversi akan lebih tinggi dari siswa A. Bagi pihak yang kontra. misalnya STAN. Konversi dianggap memudahkan dalam menafsirkan hasil UAN. Tabel Konversi di dapat sebagai hasil kegiatan transfer skor mentah (raw score) menjadi skor yang memiliki skala sama. Depdiknas secara sistematis mengkhianati tujuan dan fungsi ujian nasional yang mereka tetapkan sendiri. Sementara skor mentah dan skor relatif hanya bersifat ordinal atau berfungsi mengurutkan kedudukan siswa dari skor tertinggi ke terendah. Karena bisa jadi siswa A berhasil menyelesaikan soal-soal yang mudah dengan bobot yang rendah. 5. Skala baku nasional memungkinkan dilakukannya analisis perbandingan mutu antar sekolah dan antar daerah. Nilai ujian bukan lagi merupakan cermin kemampuan atau kompetensi siswa. tidak harus diberi angka yang sama dengan menggunakan raw score sebagaimana yang diusulkan oleh pendapat yang kontra terhadap Tabel Konversi. Pertimbangan perlunya tabel konversi antara lain selama ini penilaian dengan menggunakan skor mentah (jumlah jawaban benar) dan skor relatif (jumlah jawaban benar dibagi jumlah soal dikalikan 10) memiliki beberapa kelemahan. Dengan tabel konversi ini. Akademi Militer. Semua siswa diasumsikan mengerjakan soal yang sama walaupun dalam prakteknya paket-paket soal memiliki derajat kesulitan yang berbeda. Selain itu akan memungkinkan pula dilakukannya pemantauan mutu pendidikan secara berkesinambungan dari tahun ke tahun. Dan di negara asalnya sistem ini tidak pernah dikritik karena sudah menerapkan azas keadilan. 7 . misalnya tiap soal dianggap mempunyai tingkat bobot yang sama. nilai UAN dapat memberikan informasi tentang materi apa yang dikuasai dan yang tidak dikuasai sesuai kompetensi dan tujuan pembelajaran setiap bidang sesuai kurikulum yang berlaku. tetapi hanyalah sebagai alat permainan untuk menentukan kelulusan siswa. Sebaiknya skala pengukuran bersifat kontinum dalam skala interval atau rasio yang dapat digunakan untuk perhitungan statistik.untuk semua paket tes yang digunakan dalam UAN melalui proses penyetaraan antarpaket tes. Siswa kurang mampu dianugerahi penghargaan besar-besaran hanya demi mencapai target. Selisih nilai mentah atau skor relatif tidak menggambarkan selisih kemampuan sebenarnya. rata-rata NUN sekolah unggul turun drastis. ATT Telkom. 4. Depdiknas berada di barisan paling depan dalam pemerkosaan arti nilai ujian. Peluang lulusan SMA/MA untuk mengikuti berbagai tes atau seleksi di berbagai instansi kedinasan menjadi sirna. sehingga tidak memenuhi kaidah pengukuran yang baik. 2. Jadi bisa diartikan bahwa penerapan konversi ini tidak ada pihak yang dirugikan. Depdiknas dengan sengaja merusak citra sekolah-sekolah favorit atau unggul. Dua atau lebih paket tes pararel yang terdiri dari butir soal berbeda dianggap memiliki rata-rata tingkat kesukaran sama. Dengan penafsiran tersebut. 3.01. Dengan dalih meningkatkan motivasi siswa belajar dan meningkatkan mutu lulusan dengan menetapkan minimal nilai lulus 4. Selama ini masyarakat menggunakan rata-rata NUN sebagai salah satu ukuran keberhasilan sekolah.

dan persentase dari peserta tes yang dapat mengerjakan 75 % dari soal-soal dalam tes. Pada waktu pelaksanaan tes. Karena paket-paket tes yang digunakandalam UAN disetarakan dan disatuskalakan ke dalam nilai (skala) baku nasional. apabila hampir semua peserta tes gagal untuk menyelesaikan semua soal-soal dalam tes. dan apabila angkanya jauh berbeda. 4. yaitu kesamaan pada semua daya pembeda soal (item discrimination). Untuk satu-parameter (Rasch model) dan dua-parameter model adalah faktor menebak atau guessing sangat minim atau kemungkinan menebak sedikit sekali. Ada tiga cara untuk mengecek asumsi ini.6. Asumsi terakhir hanya berlaku pada satu parameter IRT model. 2. dan antarwilayah dapat diperbandingkan sehingga dapat digunakan dalam rangka mengendalikan mutu pendidikan itu sendiri dan sekaligus merumuskan kebijakan dalam rangka peningkatan mutu pendidikan secara nasional. Berarti gurunya tidak bisa mengajar. Dipihak lain Depdiknas menjelaskan keuntungan penggunaan Tebel Konversi berikut : 1. karena tes yang digunakan sifatnya power test bukan speeded test. Meningkatkan kecermatan dalam penggunaan data hasil UAN untuk kepentingan perencanaan di tingkat makro. Bagaimana kita menjelaskan semua ini kepada masyarakat?. maupun antarwilayah. skor mentah (jumlah butir soal yang dijawab benar) siswa yang memperoleh paket-paket tes yang berbeda tingkat kesukarannya. maka speeded tes juga dapat dicurigai. Salah satu cara untuk mengeceknya adalah dengan menggunakan analisis soal klasik (classical item analysis). Menjaga keadilan bagi siswa. Informasi hasil UAN antartahun. hanya Rasch model yang menjadi . Salah satu cara mengeceknya adalah dengan melihat skor kelompok peserta tes kemampuan bawah pada soal-soal yang paling sukar. juga persentase dari jumlah peserta tes yang dapat mengerjakan semua soal. di mana paket tes yang digunakan berbeda. maka kita tidak kuatir adanya guessing atau faktor menebak. Terlepas dari paradigma tersebut mari kita kaji secara ilmiah konversi nilai tersebut. (c) dilihat pertama-tama banyaknya soal yang dapat diselesaikan oleh 80 % peserta tes. waktu yang tersedia untuk mengerjakan tes cukup. 3. maka bisa dicurigai adanya speeded test. Terbentuknya skala baku nasional untuk semua paket tes yang digunakan dalam UAN melalui proses penyetaraan antarpaket tes. Skala baku nasional memungkinkan dilakukan analisis perbandingan kemampuan (mutu outcome) antarsekolah. Memungkinkan dilakukannya pemantauan mutu pendidikan dari tahun ke tahun. Artinya peserta tes harus disediakan waktu yang cukup untuk menyelesaikan soalsoal dalam tes. yaitu : (a) variance dari banyaknya soal yang tidak dikerjakan oleh peserta tes dibandingkan dengan variance banyaknya soal yang dijawab salah oleh peserta tes. Siswa dan orang tua siswa hanya mengetahui bahwa nilai tidak baik. (b) total skor hasil dari waktu yang telah dibatasi dibandingkan dengan total skor hasil dari waktu yang tidak dibatasi. antarsekolah. maka asumsi ini terpenuhi. dan apabila skornya nol. Telah disebutkan bahwa ada tiga model dalam unidimensional IRT dengan asumsi sebagai berikut : 1. Guru dikecewakan oleh Depdiknas. Dari ketiga model dan asumsi dari IRT tersebut. 3. dan apabilka asumsi ini dipenuhi maka rasionya mendekati nol. bila distribusi biserial hampir homogen . telah dilakukan penyesuaian sehingga tabel konversi untuk masing-masing paket tes adalah setara. antardaerah. 2.

8 9 .

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->