PENGERTIAN TES, JENIS-JENIS TES

,
DAN KRITERIA SUATU INSTRUMEN TES YANG BAIK Penilaian pendidikan bukanlah semata-mata penilaian hasil belajar, tetapi mencangkup aspek yang lebih luas yaitu input/komponen, proses, produk dan program pendidikan. Untuk dapat menilai aspek-aspek tersebut dengan komponen-komponen yang menyertainya, maka instrumen-instrumen penilaian pendidikan yang digunakan harus terkait dengan aspek yang dinilai dan tujuan pada masing-masing aspek tersebut. Secara garis besar instrumen evaluasi dapat diklasifikasikan atas dua bagian yaitu tes dan non tes. Perbedaan yang prinsip antara tes dan non tes, terletak pada jawaban yang diberikan. Dalam suatu tes hanya ada kemungkinan benar atau salah, sedangkan untuk non tes tidak ada jawaban benar atau salah, semuanya tergantung kepada keadaan seseorang. Selanjutnya akan diuraikan lebih rinci mengenai tes sebagai sebagai alat evaluasi hasil belajar. A. Pengertian Tes Tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Tes hasil belajar adalah sekelompok pertanyaan atau tugas-tugas yang harus dijawab atau diselesaikan oleh siswa dengan tujuan untuk mengukur kemajuan belajar siswa. B. Jenis-Jenis Tes 1. a. Dari segi bentuk pelaksanaannya Tes Tertulis ( paper and pencil test)

Tes tertulis dalam pelaksanaannya lebih menekankan pada penggunaan kertas dan pencil sebagai instrumen utamanya, sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian secara tertulis, baik dengan tulisan tangan maupun menggunakan komputer. b. Tes Lisan ( oral test)

Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid. c. Tes Perbuatan (performance test)

Tes perbuatan mengacu pada proses penampilan seseorang dalam melakukan sesuatu unit kerja. Tes perbuatan mengutamakan pelaksanaan perbuatan peserta didik. 2. a. Dari segi bentuk soal dan kemungkinan jawabannya Tes Essay (uraian)

Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri. b. Tes Objektif

Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya. Tes ini terdiri dariberbagai macam bentuk, antara lain ;

3.Tes Betul-Salah (TrueFalse) Tes Pilihan Ganda (Multiple Choice) Tes Menjodohkan (Matching) Tes Analisa Hubungan (Relationship Analysis) 3. Tes memiliki sifat kepraktisan artinya praktis dari segi perencanaan. a. Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap unit pembelajaran. Tes ini diberikankan dalam tiap satuan unit pembelajaran. Merupakan penguatan bagi peserta didik. fisik dan lain-lain yang mengganggu kegiatan belajarnya. Tes Diagnostik Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang dihadapi seseorang baik dari segi intelektual. emosi. Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya. C. pelaksanaan tes dan memiliki nilai ekonomi tetapi harus tetap mempertimbangkan kerahasiaan tes. yaitu tes yang diberikan untuk memonitor kemajuan belajar selama proses pembelajaran berlangsung. atau memiliki reliabelitas yang baik. Tes sumatif dilaksanakan pada tengah atau akhir semester. Tes Summatif Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian peserta didik dalam bidang tertentu. . Dari segi fungsi tes di sekolah Tes Formatif Tes Formatif. karena dengan tes formatif peserta didik mengetahui kelemahan-kelemahan yang dimilikinya. c. Reliabelitas sering diartikan dengan keterandalan. Bersifat valid atau memiliki validitas yang cukup tinggi. Manfaat tes formatif bagi peserta didik adalah :     b. artinya alat ukur yang digunakan tepat 2. Suatu tes dikatakan relliabel jika tes itu diberikan berulang-ulang memberikan hasil yang sama. Bersifat praktis atau memiliki kepraktisan. Merupakan usaha perbaikan bagi siswa. Ciri-ciri Tes Yang Baik Sebuah tes dikatakan baik jika memenuhi persyaratan: 1. d. Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan reliable. Bersifat reliable. Suatu tes dikatakan valid bila tes itu isinya dapat mengukur apa yang seharusnya di ukur. Tes Penempatan Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang akan dimasuki peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki peserta didik dalam belajar.

dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe soal dengan materi. Sebuah instrument dikatakan baik jika memenuhi syarat validitas. harus dapat menggambarkan hasil belajar yang di ukur Macam-macam validitas 1). serta ketersediaan dana dan kepraktisan. Validitas Tes Suatu tes dikatakan valid jika tes itu dapat mengukur apa yang seharusnya diukur. mengandung kata kerja yang jelas (kata kerja operasional). kegiatan ini sangat penting jika soal yang dibuat akan dibakukan. Valid disebut juga sahih. reliabelitas dan bersifat praktis. Hal yang perlu diperhatikan adalah : a) Menentukan tujuan. Menganalisis Tes Menganalisis instrument (alat evaluasi) bertujuan untuk mengetahui apakah alat ukur yang digunakan atau yang akan digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang baik. tujuan pembelajaran yang baik hendaklah berorientasi kepada peserta didik. serta dapat diamati dan dapat di ukur. ditinjau dari segi isi/materi. Pengadministrasian soal E. d) Merencanakan tingkat kesukaran soal. terandalkan atau tepat. b) Menyusun kisi-kisi soal. penyelenggaraan tes. tujuan evaluasi. yaitu menguji validitas soal yang bertujuan untuk mencermati apakah butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah dirumuskan. 5) 6) Penganalisisan hasil uji coba.D. penyusunan kisi-kisi soal bertujuan untuk merumuskan setepat mungkin ruang lingkup.yaitu: 1) Pengembangan spesifikasi tes Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri yang harus dimiliki oleh tes yang akan dikembangkan. Tes hasil belajar yang valid. tepat mengukur sesuatu sesuai tujuan yang telah dirumuskan. untuk soal objektif dapat diketahui melalui uji coba atau dapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal tersebut e) Merencanakan banyak soal f) Merencanakan jadwal penerbitan soal 2) Penulisan soal 3) Penelaahan soal. c) Memilih tipe soal. skoring. Langkah-langkah Pengembangan Tes Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik. kriteria dan psikologis. harus jelas dan dapat dimengerti. pengelolaan hasil evaluasi. tekanan dan bagian-bagian tes sehingga perumusan tersebut dapat menjadi petunjuk yang efektif bagi penyusun tes. Validitas isi (content validity) . 4) Pengujian butir-butir soal secara empiris. bersifat menguraikan hasil belajar. 1.

dalam periode terakhir validitas dianggap sebagai suatu konsep utuh. Apabila data yang digunakan adalah data interval maka dapat digunakan rumus Product Moment Korelasi. Jika terdapat korelasi yang positif antara kedua tes tersbut. 4). berarti soal tes yang dibuat mempunyai validitas concurrent. membandingkan hasil tes dari soal yang sedang dicari validitasnya dengan hasil tes dari soal standar. dengan bantuan kisi-kisi tes dan pedoman penelaahan butir soal. Aspek materi 2. Aspek konstruksi 2). apabila hasil pengukuran yang dilakukan dengan tes itu dapat digunakan untuk meramalkan.kriteria hasil validitas : Antara sangat tinggi . Validitas ramalan (predictive validity) Validitas isi dapat dianalisis Suatu tes dikatakan memiliki validitas ramalan.Validitas isi sering juga disebut validitas logis atau validitas rasional. Penganalisisan validitas ini dapat dilakukan dengan jalan melakukan pencocokan antara aspek berpikir yang dikehendaki diungkapkan oleh tujuan pembelajaran.  Cara menentukan validitas instrumen Validitas instrument dapat diketahui dengan mencari korelasi hasil instrument dengan dengan kriterium atau melakukan analisis butir. 3) Validitas bandingan (concurent validity) Suatu tes dikatakan memiliki validitas concurrent. Penelaahan butir soal secara umum ditinjau dari tiga aspek yaitu: 1. Misalnya. Meski terdapat beberapa jenis validitas. yaitu melalui penelaahan butir-butir soal.Construct validity (validitas konstruk) Validitas konstruk artinya butir-butir soal dalam tes tersebut membangun setiap aspek berpikir seperti yang tercantum dalam tujuan pembelajaran yang telah dirumuskan. 1. sebagai berikut : v Rumus Angka Kasar Keterangan : = Koefisien korelasi antara instrument X dan instrument Y v Rumus untuk skor deviasi Kriteria. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang memiliki validitas ramalan dapat dilakukan dengan mengkorelasikan tes hasil belajar yang sedang diuji dengan kriterium yang ada. atau tes itu mempunyai daya prediksi yang cukup kuat. tidak dipilah-pilah sebagai jenis validitas. apabila tes tersebut mempunyai kesesuaian dengan hasil pengukuran lain yang dilaksanakan saat itu. Aspek bahasa 3.

Cara membelah dua instrumen tersebut dapat dilakukan dengan cara nomor genap dan ganjil. d. c. sehingga tidak dapat mempunyai daya pembeda yang kuat. Teknik pengujian reliabilitas tes hasil belajar Bentuk objektif Metode Belah dua a. f. Langkah-langkah yang ditempuh sebagai berikut : 1.  a. konsisten. awal dan akhir. Validitas butir soal dapat dicari dalam hubungannya dengan skor total tiap individu yang ikut serta dalam evaluasi.  Cara menentukan validitas tiap butir soal Tinggi rendahnya validitas soal secara keseluruhan berhubungan dengan validitas tiap butir soal. 2. sehingga tidak ada pengaruh dari instrumen yang terdahulu. Koefisien reliabilitas akan menunjukkan internal konsistensi dari pada butir soal dalam keseluruhan instrumen. Jumlahkan skor total untuk tiap individu. 1) Dalam pelaksanaanya. Reliabilitas Suatu alat ukur dikatakan reliabel. 3. sedangkan yang salah diberi angka nol. Gunakan rumus product moment correlation atau korelasi biserial. e.Antara tinggi Antara cukup Antara rendah Antara sangat rendah (Yusuf. apabila alat ukur itu dicobakan kepada objek yang sama secara berulang-ulang maka hasilnya akan tetap sama. Jumlah butir soal yang diberikan harus genap sehingga dapat dibagi dua dan tiap kelompok mempunyai jumlah butir yang sama. Skor suatu instrument dengan baik dan teliti Untuk individu yang benar diberi angka 1. 2. b. Untuk menentukan reliabilitas kedua bagian instrumen tersebut dapat digunakan Product Moment Coorelation.  Faktor-faktor yang mempengaruhi reliabilitas Konstruksi item yang tidak tepat. sedangkan untuk mencari reliabilitas keseluruhan instrumen dapat digunakan rumus Spearman Brown. stabil atau relatif sama.seorang penilai hanya melakukan ujian satu kali terhadap sejumlah peserta. sebagai berikut : Keterangan : . 2005:75). Panjang/pendeknya suatu instrumen Evaluasi yang surjektif akan menurunkan reliabilitas Ketidaktepatan waktu yang diberikan Kemampuan yang ada dalam kelompok Luas/tidaknya sampel yang diambil.

20 < r11 £ 0. Tidak akan menunjukkan ekivalensi dalam kesukaran butir dan isi.60 < r11 £ 0.20 reliabilitas sangat tinggi reliabilitas tinggi reliabilitas sedang reliabilitas rendah reliabilitas sangat rendah Nilai r yang diperoleh dibandingkan dengan rtabel. Jika rhitung > rtabel maka dapat disimpulkan bahwa soal tes reliabel.40 0.00 0. Rumus yang digunakan untuk menentukan metode ulangan ini adalah Product Moment Correlation. Rumus yang dapat digunakan untuk menentukan reliabilitas instrumen dalam bentuk paralel ini adalah product moment correlation dan Rank order correlation. dalam waktu yang berbeda. b.40 < r11 £ 0. dengan kondisi dan perlengkapan yang sama/ hampir bersamaan. dengan memiliki tingkat kesukaran yang sama. Bentuk essay Rumus yang digunakan untuk mengukur reliabilitas tes berbentuk uraian dinamakan rumus Alpha. Reliabilitas metode ulangan ini untuk melihat bagaimana stabilnya skor setiap individu apabila dilakukan pengujian dalam waktu yang berbeda. Kedua bentuk instrumen yang diberikan mengukura hal yang sama. tetapi koefisien yang dihasilkan hanya menggambarkan ekivalensi antara kedua instrumen. pengetahuan dan keterangpilan yang sama dengan sistematika yang tidak berbeda antara kedua bentuk instrumen tersebut. tetapi dalam bentuk pertanyaan yang berbeda.: koefisien reliabilitas r : korelasi antara bagian instrumen 2) Metode Ulangan Pelaksanaannya dilakukan dua kali kepada sejumlah subjek yang sama.80 < r11 £ 1. 3) Metode Bentuk Paralel Bentuk ini dapat digunakan untuk memperkirakan reliabilitas dari semua tipe. yaitu : Dimana: : Koefisien reliabilitas tes n : banyaknya butir item yang dikeluarkan dalam tes : Jumlah variansi skor dari tiap-tiap butir item :Variansitotal Interpretasi terhadap koefisien reliabilitas tes pada umumnya digunakan patokan sebagai berikut: 0.60 0.00 < r11 £ 0.80 0. .

setiap soal harus diselidiki tingkat kesukarannya yaitu apakah soal tersebut termasuk soal yang mudah. Untuk menentukan daya pembeda soal dapat dilakukan seperti yang dikemukakan oleh Prawironegoro (1985:11): Terlebih dahulu dicari degress of freedom (df) dengan rumus: df = (nt – 1) + (nr – 1) dimana: nt = nr = 27% x N kemudian digunakan rumus: dimana: Ip = daya pembeda soal Mt = rata-rata skor dari kelompok tinggi Mr = rata-rata skor dari kelompok rendah = jumlah kuadrat deviasi skor kelompok tinggi = jumlah kuadrat deviasi skor kelompok rendah n N = 27% x N = banyak pengikut tes Soal mempunyai daya pembeda yang berarti (signifikan) jika Ip hitung ³ Ip tabel pada derajat kebebasan yang sudah ditentukan. maka dilakukan langkah-langkah sebagai berikut: 1) Daya pembeda Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai dengan siswa yang bodoh. sedang atau sukar.3. Analisis soal tes Untuk mendapatkan kualitas soal yang baik. Angka yang menunjukkan besarnya daya pembeda disebut indek diskriminan. Agar tes dapat digunakan secara luas. 2) Indek kesukaran. Untuk menentukan indek kesukaran digunakan rumus yang dikemukakan Prawironegoro (1985:14) yaitu: dimana: Ik = indeks kesukaran .

Soal diperbaiki jika: Ip signifikan dan Ik = 100% atau Ik = 0%. e.Dt = jumlah skor dari kelompok tinggi Dr = jumlah skor dari kelompok rendah m = skor setiap soal jika benar n = 27% x N N = banyak pengikut tes Soal dinyatakan sukar. d. jika 3) Penerimaan soal 27% £ Ik £ 73% Ik > 73% 0% £ Ik < 27% Setiap soal yang telah dianalisa perlu diklasifikasikan menjadi soal yang tetap dipakai. Soal diganti jika Ip tidak signifikan dan Ik = 100% atau Ik = 0%. . direvisi atau dibuang. jika mudah. Ip tidak signifikan dan 0% < Ik < 100%. b. c. jika sedang. Soal yang baik akan tetap dipakai jika Ip signifikan dan 0% < Ik £ 100%. Menurut Prawironegoro (1985:16) tentang klasifikasi soal: a.