Analisis soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal.

Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitative control) dan analisis kuantitatif (quantitative control). Analisis kualitatif sering pula dinamakan sebagai validitas logis (logical validity) yang dilakukan sebelum soal digunakan. Gunanya untuk melihat berfungsi tidaknya sebuah soal. Analisis soal secara kuantitatif sering pula dinamakan sebagai validitas empiris (empirical validity) yang dilakukan untuk melihat lebih berfungsi tidaknya sebuah soal setelah soal itu diujicobakan kepada sampel yang representatif. Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal (1) dapat diterima karena telah didukung oleh data statistic yang memadai, (2) diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3) tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.

Analisis Kuantitatif. Digunakan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta tes yang kemampuannya rendah (melalui analisis statistik). Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal dengan benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternatif jawaban dari subyek-subyek yang dites.
Analisis soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitative control) dan analisis kuantitatif (quantitative control). Analisis kualitatif sering pula dinamakan sebagai validitas logis (logical validity) yang dilakukan sebelum soal digunakan. Gunanya untuk melihat berfungsi tidaknya sebuah soal. Analisis soal secara kuantitatif sering pula dinamakan sebagai validitas empiris (empirical validity) yang dilakukan untuk melihat lebih berfungsi tidaknya sebuah soal setelah soal itu diujicobakan kepada sampel yang representatif. Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal (1) dapat diterima karena telah didukung oleh data statistic yang memadai, (2) diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3) tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.

Analisis Kuantitatif. Digunakan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta tes yang kemampuannya rendah (melalui analisis statistik). Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal dengan benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternatif jawaban dari subyek-subyek yang dites. Tingkat Kesukaran. Ada beberapa alasan untuk menyatakan tingkat kesukaran soal. Bisa saja tingkat kesukaran soal ditentukan oleh kedalaman soal, kompleksitas, atau hal-hal lain yang berkaitan dengan kemampuan yang diukur oleh soal. Namun demikian, ketika kita mengkaji lebih mendalam terhadap tingkat kesukaran soal, akan sulit menentukan mengapa sebuah soal lebih sukar dibandingkan dengan soal yang lain.

dsb. tingkat kesukaran dapat dinyatakan melalui beberapa cara diantaranya (1) proporsi menjawab benar. Angka yang dapat memberikan petunjuk mengenai tingkat kesulitan item itu dikenal dengan istilah difficulty index (angka indeks kesukaran item). 3. apakah petunjuk cara mengerjakan solnya sulit dipahami. dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee.7 P > 0. apakah kalimat soalnya kurang jelas. apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat kesukaran item itu adalah sedang atau cukup. Tindak Lanjut butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang 2. Setelah dilakukan perbaikan. ataukah dalam soal tersebut terdapat istilah-istilah yang tidak jelas. butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang. Butir-butir item tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik. diteliti ulang. Kategori Tingkat Kesukaran Nilai p P < 0. dan (4) skala bivariat. 3. butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang.3 ≤ p ≤ 0.Secara umum. ataukah dalam soal tersebut terdapat istilah-istilah yang tidak jelas. dsb. butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama tes seleksi) yang sifatnya longgar. Sukar Sedang Mudah . dilacak. Butir item ini dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang 1. dilacak. bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat kesukaran atau taraf kesukaran yang dimiliki oleh masing-masing butir item tersebut. yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P. butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang 2.7 Sukar Sedang Mudah Kategori Tindak Lanjut Hasil Analisis Interpretasi Item 1. apakah petunjuk cara mengerjakan soalnya sulit dipahami. (2) skala kesukaran linear. Proporsi jawaban benar (p). diteliti ulang. (3) indeks Davis. dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee. Intinya. apakah kalimat soalnya kurang jelas. yaitu singkatan dari kata proportion (proporsi = proporsa).3 0. Setelah dilakukan perbaikan. butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama tes seleksi) yang sifatnya sangat ketat. yaitu jumlah peserta tes yang menjawab benar pada butir soal yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya merupakan tingkat kesukaran yang paling umum digunakan. menurut teori klasik.

Daya Pembeda.20 Poor pembedanya yang baik lemah sekali (jelek). Indeks daya pembeda soal-soal yang ditetapkan dari selisih proporsi yang menjawab dari masing-masing kelompok.20 – 0. Tanda negatif menunjukkan bahwa peserta tes yang kemampuannya rendah dapat menjawab benar sedangkan peserta tes yang kemampuannya tinggi menjawab salah. Angka yang menunjukkan besarnya daya pembeda berkisar antara -1 sampai dengan +1. Dengan demikian soal indeks daya pembedanya negatif menunjukkan terbaliknya kualitas peserta.70 0. Indeks yang digunakan dalam membedakan antara peserta tes yang berkemampuan rendah adalah indeks daya pembeda (item discrimination).00 Bertanda negatif (-) Good Excellent - . dianggap tidak memiliki daya pembeda Butir item yang bersangkutan telah 0.40 Satisfactory memiliki daya pembeda yang cukup (sedang) Butir item yang bersangkutan telah memiliki daya pembeda yang baik Butir item yang bersangkutan telah memiliki daya pembeda yang baik sekali Butir item yang bersangkutan daya pembedanya negative sekali (jelek sekali) 0. Indeks diskriminasi item umumnya diberi lambang dengan huruf D (singkatan dari discriminatory power). Indeks Dsikriminasi Item (D) Klasifikasi Interpretasi Butir item yang bersangkutan daya < 0. Salah satu tujuan analisis kuantitatif soal adalah untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Dengan demikian validitas soal ini sama dengan daya pembeda soal yaitu daya dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Indeks ini menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan.70 – 1.40 – 0.

Faktor yang Mempengaruhi Reliabilitas Skor Karakteristik umum yang permanen peserta tes 1 a. salah satu diantaranya adalah merupakan jawaban betul (kunci jawaban). Dengan kata lain. keajegan respon peserta didik terhadap pilihan jawaban (misalnya mereka cenderung memberi jawaban A dari 4 alternatif yang disediakan atau cenderung memilih B dari soal benar salah yang disajikan) Khusus yang berkaitan dengan soal a. kelelahan b. pengetahuan dan kemampuan khusus yang berkaitan dengan soal 2 c. a. Pernyataan blangko ini sering dikenal dengan istilah omiet dan biasa diberi lambang dengan huruf O. sedangkan sisanya adalah merupakan jawaban salah. kemampuan umum dan teknik yang digunakan ketika mengambil tes Karakteristik khusus yang permanent peserta tes . Berikut adalah faktor yang mempengaruhi perolehan skor peserta didik (Thorndike) yang berakibat pada ketidakajegan terhadap skor. Adapun yang dimaksud dengan pola penyebaran jawaban item adalah suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap kemungkinankemungkinan jawab yang telah dipasangkan pada setiap butir item.Fungsi Distraktor Pada saat membicarakan tes objektif bentuk multiple choice item tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawab. dan dari kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item itu. yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item tertentu. Keajegan dan ketidakajegan skor tes merupakan fokus dari pengkajian tentang reliabilitas. atau yang sering dikenal dengan istilah option atau alternatif. Menganalisis fungsi distraktor sering dikenal dengan istilah lain. Reliabilitas. pengetahuan khusus yang berkaitan dengan fakta atau konsep khusus b. kemampuan yang dimiliki peserta didik dalam menghadapi tes kemampuan umum untuk memahami petunjuk tes kemampuan peserta didik yang berkaitan dengan atribut yang diukur dalam sebuah tes b. testee menyatakan “blangko”. Suatu kemungkinan dapat terjadi. Option atau alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah. sedangkan distraktor yang belum dapat berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor yang lain. yaitu : menganalisis pola penyebaran jawaban item. sama sekali tidak dipilih oleh testee. pengetahuan dan kemampuan khusus yang berkaitan dengan soal Karakteristik umum yang temporer seperti : 3 a. c. kesehatan b. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes yang akan datang. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distractor (pengecoh). Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5 % dari seluruh peserta tes.

pengawasan Faktor yang tidak pernah diperhitungkan b. hal-hal yang berkaitan dengan perhatian dan keakuratan Faktor penyelenggaraan 5 a. c. kebiasaan menghadapi sebuah tes Khusus yang berkaitan dengan soal a. mengingat soal yang telah dilihatnya . waktu.c. cahaya. 6 a. ventilasi. fluktuasi ingatan yang dimiliki peserta didik b. dan lain sebagainya d. trik atau teknik-teknik mengatasi tes d. dan petunjuk yang jelas penskoran keberuntungan karena faktor menebak b. motivasi kemampuan umum dan teknik yang digunakan ketika mengambil tes pemahaman mekanisme tes faktor panas. gangguan emosi Karakteristik khusus yang temporer seperti : Khusus yang berkaitan dengan tes secara keseluruhan a. g. pemahaman terhadap petunjuk tes pengalaman/latihan menghadapi tes terlebih lagi dalam tes psikomotor b. 4 c. f. bebas dari gangguan. e.

Sign up to vote on this title
UsefulNot useful