P. 1
EVALUASI HASIL BELAJAR

EVALUASI HASIL BELAJAR

|Views: 317|Likes:
Published by Henry Ayouu

More info:

Published by: Henry Ayouu on Nov 05, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

04/13/2015

pdf

text

original

EVALUASI HASIL BELAJAR FISIKA

(Indrawati, Staf Pengajar P Fisika-PMIPA, FKIP Universitas Jember)

1. Evaluasi, Pengukuran, dan Tes Masih sering kita jumpai bahwa para guru fisika kurang benar dalam menafsirkan istilah evaluasi, pengukuran, dan tes. Ketiganya sering digunakan secara sinonim. Pada kenyataannya, ketiganya mempunyai hubungan dekat, tetapi berbeda dalam proses. Untuk menghindari kesalahtafsiran ketiga istilah tersebut, maka masing-masing istilah perlu didefinisikan. Evaluasi atau penilaian didefinisikan sebagai suatu proses untuk mengambilt keputusan terhadap kriteria yang dipilih sebagai nilai tentang benda-benda atau ide-ide, didasarkan pada data yang relevan (Farmer dan Farrell, 1979). Zainul dan Nasoetion (1996) mendefinisikan peilaian sebagai proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes maupun nontes. Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas (Zainul dan Nasoetion, 1996). Ketika kita mengukur kemampuan siswa kelas I SMU dalam menggunakan jangka sorong, yang kita ukur bukan siswa tetapi atribut atau karakteristik siswa, yaitu: kemampuannya menggunakan jangka sorong. Pengukuran pendidikan adalah salah satu pekerjaan profesional guru, instruktur, dan guru. Sehingga apabila ada guru yang tidak dapat melakukan pengukuran pendikan dapat dikatakan guru yang kurang atau tidak profesional. Tes yang dimaksud di sini didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut pendidikan atau psikologik yang setiap butir pertanyaan atau tugas mempunyai jawaban atau ketentuan yang dianggap benar (Zainul dan Nasoetion, 1996). Hasil belajar fisika merupakan salah satu contoh atribut pendidikan. Kematangan seseorang adalah salah satu contoh atribut psikologik. Pedoman wawancara dan observasi merupakan contoh-contoh dari instrumen nontes. Tugas 1: Dari definisi evaluasi, pengukuran, dan tes di atas jelaskan hubungan antara ketiganya dan berikan contohnya dalam pembelajaran fisika!

Dari uraian di atas dapat kita pahami bahwa tes atau non-tes merupakan instrumen atau alat untuk mengukur atribut pendidikan. Tes Hasil Belajar (THB) Siswa Kelas I SMU tentang

Besaran, Satuan, dan Angka Penting merupakan contoh alat atau instrumen untuk mengukur kemampuan konsep besaran, satuan, dan angka penting siswa. Di sini kita hanya akan belajar tentang tes, sedangkan instrumen non-tes akan kita pelajari pada bahasan berikutnya. Pembahasan tentang tes meliputi: bagaimana merencanakan tes, mengkonstruksi butir soal, mengolah hasil tes, dan menganalisis soal. 2. Merencanakan Tes Beberapa hal yang perlu dipikirkan dalam merencanakan tes adalah pengambilan sampel dan pemilihan butir soal, tipe tes yang digunakan, aspek yang akan diuji, format butir soal, jumlah butir soal, dan distribusi tingkat kesukaran butir soal. a. Pengambilan sampel dan pemilihan butir soal THB terdiri atas butir-butir soal yang terpilih, yang secara akademik dapat dipertanggungjawabkan sebagai sampel yang representatif dari ilmu atau bidang studi yang diuji dengan perangkat tes tersebut. Pemilihan sampel ini didasarkan pada pertimbangan pentingnya konsep, generalisasi, dalil, atau teori yang diuji dalam hubungannya dengan peranannya terhadap bidang studi tersebut secara keseluruhan. Untuk mendapatkan sampel yang representatif, biasanya bidang studi itu dipilah-pilah menjadi beberapa pokok bahasan dan sub pokok bahasan. Jumlah pokok bahasan atau sub pokok bahasan tidak ada batasan, yang penting adalah tingkat kontribusinya terhadap keluasan pokok dan atau sub pokok bahasan itu. b. Tipe-tipe Tes Menurut Ebel dan Frisbie (1986), tes dibagi menjadi tiga, yakni: obyektif, esai, dan problematika. Selain itu juga dikenal tes lisan dan tes penampilan. Anggapan bahwa tipe soal satu lebih baik dari yang lain adalah tidak benar. Pemilihan tipe tes tergantung pada kemampuan dan waktu yang tersedia pada penyusunan tes, bukan aspek yang akan diukur. c. Aspek kemampuan yang akan diukur/diuji Aspek yang akan diuji ini merupakan kemampuan apa yang ditargetkan dalam rumusan tujuan pembelajaran. Jika menggunakan taksonomi Bloom, kemampuan ini bisa pada ranah kognitif, psikomotor, atau afektif. Setiap kemampuan inipun masih dipilah dalam tingkattingkat. Misalnya untuk ranah kognitif pada tingkat c1, c2, c3, c4, c5, atau c6. Begitupula untuk ranah psikomotor dan afektif. d. Format butir soal Baik tipe soal obyektif maupun esai mengenal berbagai format biasa. Misalnya pada tes obyektif, format A untuk pilihan ganda biasa; format B untuk pilihan ganda nalisis hubungan antar hal, dan lain-lain.Perbedaan antar format tidak terletak pada efektivitasnya mengukur tingkat kemampuan, tetapi pada penerkaannya (peserta tes kurang menguasai materi yang diteskan). e. Jumlah butir soal

Jumlah butir soal berkaitan dengan reliabilitas dan representasi isi bidang studi yang diteskan.Tes yang baik adalah tes yang mampu membedakan antara siswa yang belajar dan yang tidak belajar. afektif. dan/atau psikomotor) dapat dibuat dalam bentuk kisi-kisi. maka kisi-kisi ini bisa dikembangkan dengan menambah kolom atau baris untuk Jenjang Kemampuan & Tingkat Kesukaran. g. Pertimbangan ini dimaksudkan agar siswa termotivasi untuk mengerjakan seluruh butir soal.5.Tidak ada ketentuan berapa jumlah butir soal yang harus dibuat dalam suatu perangkat tes. jumlah tiap kategori tingjat kesukaran. biaya yang tersedia. Para ahli berpendapat bahwa tes yang baik mempunyai tingkat kesukaran di sekitar 0. f. Kisi-kisi (tabel spesifikasi) tes memuat pokok/sub pokok bahasan/materi. KISI-KISI TES OBYEKTIF Mata Pelajaran Kelas Semester/Tahun Waktu Tipe Tes Jumlah Butir Tes No. dan kekpmpleksitasan yang dituntut dalam tes.5. kemampuan yang diuji. Walaupun tidak ada ketentuan tentang jumlah butir soal. Beikut ini diberikan contoh model membuat kisi-kisi untuk tes obyektif dan esai. yaitu: berapa jumlah keseluruhan. Kisi-kisi tes Untuk menggambarkan proporsi banyaknya butir soal pada setiap pokok/sub pokok bahasan dan setiap kategori untuk setiap ranah (kognitif. Pokok/Sub Pokok Bahasan (Materi) Md Sd Sk Md Sd Sk Md Sd Sk Md Sd Sk : : : : : : Fisika I SMA I/2008 Jenjang Kemampuan & Tingkat Kesukaran C1 C2 C3 C4. jumlah untuk setiap pokok/sub pokok bahasan. Ada pertimbangan bahwa butir soal yang tingkat kesukaran rendah sebaiknya diletakkan pada awal tes dan yang tingkat kesukarannya tinggi pada akhir perangkat tes. tetapi jumlahnya harus direncanakan. Distribusi tingkat kesukaran Tingkat kesukaran butir soal pertimbangannya ada pada penulis soal.6 ∑ butir soal % ∑ butir soal % Catatan: Jika perangkat tes memuat ranah afektif dan psikomotor. dan tingkat kesukaran butir soal (menurut petimbangan guru). jumlah setiap format. KISI-KISI TES ESAI . Selain itu juga perlu mempertimbangkan waktu. dan jumlah untuk setiap tingkat pada setiap ranah. baik untuk tipe tes obyektif maupun esai.

Kesukaran Terbatas Bebas ∑ butir soal % Tugas 2: Buatlah kisi-kisi THB dalam bentuk obyektif dan esai suatu Pokok/Sub Pokok Bahasan IPA/Fisika SLTP atau Fisika SMU untuk waktu 10-15 menit! 3. (c) THB hendaknya sesuai dengan penggunaan tes itu sendiri (untuk pre dan post-tes. 3. dan (e) THB hendaknya dapat digunakan untuk memperbaiki PBM. menentukan ketuntasan penguasaan materi. tetapi tergantung pada bagaimana butir soal itu dikonstruk oleh guru dengan baik.2 Cara Penulisan Butir Soal Esai . atau untuk tes sumatif). Mengkonstruksi Butir Soal Kualitas suatu butir soal tidak ditentukan oleh tipe atau bentuk tes. Tes semacam ini disebut tes hasil belajar karena berfungsi untuk mengukur keberhasilan belajar siswa atau mahasiswa. dan bagaimana cara menulis butir soal esai dan obyektif tersebut. I/TP/Materi ∑ butir soal % : : : : : : Fisika I SMA I/2008 Tipe soal Jenjang Kemapuan/ Tk. yaitu: (a) THB harus sesuai dengan indikator atau tujuan pembelajaran yang dirumuskan. Untuk mengkonstruk THB harus memahami dasar-dasar penyusunannya.. (b) THB harus mewakili bahan yang dipelajari.1 Dasar-dasar menyususn THB Ada beberapa dasar yang perlu diperhatikan dalam menyususn THB. Kemampuan guru untuk menyusun butir soal dengan baik tidak hanya dibutuhkan kemampuan yang bersifat pengetahuan dan pemahaman. tes formatif. Tipe dan bentuk tes apapun dapat digunakan untuk mengukur hasil belajar bila butir soal itu dikonstruk dengan baik dan sesuai dengan tujuan pembelajaran yang ingin dicapai. tetapi perlu keterampilan dan kiat. 3. diagnostik.Mata Pelajaran Kelas Cawu/Tahun Waktu Tipe Tes Jumlah Butir Tes SK/KD No. (d) THB disesuaikan dengan pendekatan pengukuran yang dianut. yaitu: PAP atau PAN. Agar mempunyai kemampuan mengkonstruksi soal pada taraf mahir diperlukan latihan secara terus menerus.

yaitu: (1) konstruksilah butir soal yang mengukur hasil belajar yang penting saja.1 Tes Uraian Bebas Ciri dari tes uraian bebas adalah hampir tidak ada pembatasan terhadap peserta tes dalam memberikan jawabannya. yaitu: E-35 Jelaskan secara singkat dan jelas bagamana cara menentukan ukuran suatu kertas (misalnya A4) yang meliputi pengukuran panjang. frasa. (3) konstruksilah butir soal yang mengharuskan peserta tes memberi jawaban yang secara faktual benar. 3. E-32 Gaya termasuk besaran ……. masing-masing adalah: E-31 Dalam fisika ada …… besaran pokok. dan jawaban tidak disediakan oleh orang yang mengkonstruk butir soal. sebaiknya nyatakan satuan tersebut dalam soal. (6) setiap butir soal sebaiknya hanya berisi satu jawaban. artinya harus dapat dijamin bahwa butir soal hanya dapat dijawab oleh peserta tes yang menguasai degan baik isi pelajaran. Ada beberapa petunjuk untuk mengkonstruksi butir soal melengkapi.Butir soal esai atau uraian adalah butir soal yang mengandung pertanyaan atau tugas yang jawaban atau pengerjaan soal tes tersebut harus dilakukan dengan cara mengekspresikan pikiran peserta tes. misalnya butir soal E-31 dan E-32. Jawaban peserta tes bersifat terbuka. atau satu formula. (4) gunakan bahasa yang jelas (tidak mendua arti). Soal tes uraian terbatas ini harus menentukan batas jawaban yang dikehendaki.2. dan tebalnya? 3. Butir soal ini dapat dicontohkan pada butir soal nomor E33 dan 34. Tes tipe ini secara umum dibagi menjadi dua jenis. lebar. keluasan uraian jawaban. Butir soal melengkapi adalah butir soal yang meminta atau memerintah peserta tes untuk melengkapi suatu kalimat (pernyataan) dengan satu frasa. yaitu: . Butir soal jawaban singkat adalah butir soal berbentuk pertanyaan yang dapat dijawab dengan satu kata. meliputi konteks jawaban yang diinginkan. luwes. misalnya luas bidang tanah yang panjangnya 12 m dan lebarnya 7 m adalah ……… m2. (2) butir soal harus spesifik. Keterbatasan itu mencakup format. dan ruang lingkup jawaban. (5) Bila yang ditanyakan menyangkut angka atau jumlah dari satu satuan tertentu. Butir soal melengkapi dapat kita lihat pada contoh butir soal nomor E-31 dan 32. angka. Contoh tes ini dapat kita pada butir soal nomor E-35. dan tidak terstruktur.2. yaitu: tes uraian bebas (extended response) dan tes uraian terbatas (restricted response). isi. Tes uraian terbatas ada beberapa ragam.2 Tes Uraian Terbatas Ciri tes uraian terbatas adalah jawaban peserta tes dibatasi dengan berbagai rambu-rambu yang ditentukan dalam butir soal. antara lain ragam tes melengkapi dan ragam tes jawaban singkat. atau formula. jumlah butir jawaban yang diharapkan.. satu angka. arah dan luas jawaban yang diminta.

harus ditentukan tingkat ketepatannya. Jika setiap konsep memiliki bobot sama maka diberi skor yang sama. biarkan sebagaimana adanya. yaitu: (1) gunakan kalimat tanya yang menuntut jawaban satu kata. maksud tes adalah untuk menguji materi pelajaran. Skor maksimum tidak perlu dikonverskan pada skor 10 atau 100. (4) untuk menanyakan definisi atau istilah sebaiknya digunakan kalimat tanya secara lansung. (2) hindari kalimat yang langsung diambil dari buku atau catatan. Penentuan skor pada setiap butir tidak tentu sama. misalnya: Apakah dimesi dari besaran pokok? adalah pertanyaan yang jawabannya bisa lebih dari satu simbol (bisa M. frasa. L. Konsep yang bobotnya lebih penting diberi bobot lebih besar. angka. terutama untuk agka desimal. 3. tergantung pada bobot konsep pada butir jawaban tersebut. atau simbol.E-33 Apakah dimensi dari kecepatan? E-32 Berapakah orde dari bilangan 2078605 J? Ada beberapa petunjuk untuk mengkonstruk bentuk tes jawaban singkat. (2) butir apa saja yang harus terdapat dalam jawaban pertanyaan esai. (3) pertanyaan jangan sampai menjadi tes bahasa. Soal E-31 E-32 E-33 E-34 Aspek/Kata Kunci 7 (tujuh) Turunan [LT-1] 10-6 Skor 1 1 2 2 . misalnya soal E-33 akan tidak tepat bila ditulis: Setiap besaran fisika yang bersatuan dapat dinyatakan dengan dimensi. Contoh pembuatan pedoman penskoran butir soal esai untuk butir-butir soal nomor E-31 sampai dengan E-35 dapat dilihat sebagai berikut: Butir soal E-31 sampai dengan E-35 (lihat Lampiran) Pedoman Penskoran No. hasil penilainnya cenderung subyektif. Dalam mengkonstruk tes penyusun tes sudah harus menyediakan jawaban tiga pertanyaan tersebut. Dengan kata lain penyusun tes ketika mengembangkan butir tes sekaligus juga harus menyusun jawabannya yang berpedoman pada tiga buah pertanyaan di atas.3 Pedoman Penskoran Butir Soal Esai Butir soal esai atau uraian memeriksanya tidak mudah dan lama karena jawabannya bervariasi. yakni: (1) apakah jawaban yang terbaik untuk satu butir pertanyaan esai. Dimensi besaran kecepatan itu apa? (5) untuk menanyakan masalah hitungan.2. atau T). (3) apakah ada butir yang leih penting di antara butir-butir jawaban yang diharapkan. Untuk mengurangi subyektivitas dan meningkatkan obyektivitas dalam penilain tes esai ada beberapa hal yang perlu diperhatikan. (6) sebaiknya hanya satu jawaban untuk satu pertanyaan. Jawaban yang ditulis tidak perlu dinarasikan tetapi cukup dengan mencantumkan butir-butir penting yang harus termuat pada jawaban peserta tes.

Hindari menggunakan pernyataan-pernyatan yang dapat menipu siswa. kompleks. Karena sifat obyektif ini. sehingga siswa yang mengetahui sedikit tentang bahan tidak dapat memperoleh skor tinggi dengan sederhana dengan berasumsi bahwa lebih banyak pertanyaan adalah benar (atau salah).1 Penulisan Tes Benar-Salah Jika ujian dibatasi pada pertanyaan-pertanyaan benar-salah. statistik menunjukkan bahwa 75 item atau lebih adalah perlu untuk mengatasi faktor menebak (guessing). Coba membuatnya agak baik rata dalam jumlah. grafik. Jadi jawaban telah disediakan atau dipasok oleh pembuat soal. Misalnya. dan pilihan ganda yang menggunakan diagram. jangan menulis. Hindari ketidak-seimbangan tes dengan cukup banyak pertanyaan benar-salah. Penulisan setiap tipe tes obyektif dapat diuraikan seperti berikut. mereka menghukum untuk menebak. Semua bentuk tes pilihan ganda tersebut mempunyai struktur (format) yang sama. “panjang bidang . yaitu ada pokok soal (stem) dan sejumlah pilihan (options). analisis hubungan antar hal. Hasil pegukuran panjang (p) = ……. menjodohkan (matching).. tetapi bisa dengan mesin. dan pilihan ganda (multiple choice). Hal ini juga tidak dapat diinginkan karena siswa dihukum untuk menebak. analisis kasus.E-35 Panjang dan lebar diukur dengan mistar. x …… cm.. Di antara pilihan itu ada satu pilihan yang benar disebut kunci (key) dan pilihan lainnya disebut pengecoh (distractors). yaitu pilihan ganda biasa. Prosedur ini tidak direkomendasi karena siswa biasanya berpikir bahwa instruktur mengunakan teknik ini secara dendam/dengki. Jangan menggunakan bahasa yang sama seperti dalam teks atau siswa cenderung untuk mengingat. Secara umum tes obyektif dibedakan menjadi tiga tipe. yakni tipe: benar-salah (truefalse). Hindari pernyataan-pernyataan yang mendua-arti. Dalam tes 100 pertanyaan benar-salah. dalam sains umumnya dan fisika khususnya kita ingin mempunyai siswa membuat hipotesis. ……gram Skor maksimum 6 3 15 3. Tes pilihan ganda dapat dimodifikasi dalam lima bentuk. cm Hasil pengukuran lebar (l) = ………cm Hasil pengukuran massa (m) = ……… gr Jadi ukuran kertas adalah …. Beberapa instruksi mengeliminasi masalah ini dengan mengurangi jumah jawabanjawaban salah dari jumlah jawaban benar untuk menentukan skor. tabel. siswa harus dapat menjawab sekitar 50 pertanyaan tepat dengan menebak. maka pemeriksaan tidak harus dilakukan oleh manusia. tebakan-tebakan yang baik. yaitu. Sehingga pemeriksaan atau penskoran jawaban peserta tes dapat dilakukan secara obyektif oleh pemeriksa.3.3 Cara Penulisan Butir Soal Obyektif Butir soal obyektif adalah butir soal yang telah mengandung kemungkinan jawaban yang harus dipilih atau dikerjakan oleh peserta tes. atau gambar. 3. Massa diukur dengan neraca.

Kolom pertama untuk pokok soal (stem) atau premis dan kolom kedua untuk kolom jawaban. dan angka penting. Vektor E. Tipe tes ini dapat dicontohkan sebagai berikut: Petunjuk: Pasangkan pernyataan pada kolom pertama dengan pilihan yang cocok pada kolom kedua dengan menulis huruf di muka nomor pernyataan kolom pertama! ……… ………. A. Hukum II Newton F. apakah semua soal telah memenuhi syarat untuk tipe soal benar-salah yang baik? Berikan penjelasan! 3. Dimensi percepatan adalah 3. misalnya. Tugas 4: Tulislah 5 butir soal tipe menjodohkan untuk suatu pokok bahasan fisika SLTP atau SMU dan lengkapi pula dengan kunci jawabannya! . [LT2] D. dan (2) jumlah pernyataan di bawah kolom kedua harus lebih banyak dari pernyataan di bawah kolom petama. Jangan menulis. Ambil blok/tempat jawaban ada dalam satu margin sehingga mereka dapat diperiksa dengan mudah dengan menggunakan suatu kunci. Hukum Hooke Dst. Perbandingan antara gaya tarik atau gaya tekan dan pemanjangan atau pemendekan pegas adalah konstan. ……… dst.2 Konstruksi Tes Menjodohkan Tipe soal menjodohkan ditulis dalam dua kolom. Tugas 3: Berdasarkan 10 butir soal benar-salah pada contoh THB besaran. Untuk menulis butir soal menjodohkan ada beberapa syarat. Susun pernyataan-pernyataan anda dalam 10 sampai dengan 20 pertanyaan. Prosedur ini menggantikan terlalu banyak ketegangan untuk siswa. [LT-2] B. yaitu: (1) pernyataan di bawah kolom pertama dan kolom kedua harus terdiri atas kelompok yang homogen.3. Jangan menggunakan bahasa kualitatif jika anda dapat memungkinkan menghindarinya. Skalar C. 1. Hindari menggunakan kalimat-kalimat kompleks dalam pernyataan-pernyataan anda. Tugas peserta tes adalah menjodohkan antara kolom pertama dan kolom kedua. logam-logam yang lebih baik menghantarkan listrik lebih cepat. Dst.diukur dengan pengukur panjang”. Besaran yang mempunyai besar dan arah 2. satuan.

a.3. (10) Hindari menggunakan pilihan yang berbunyi “semua yang di atas benar” atau “tidak satupun yang di atas benar”. Agar kedua pernyataan termasuk pilihan ganda maka harus Pokok soal diusahakan tidak menggunakan ungkapan atau kata-kata yang bermakna tidak tentu. kadang-kadang. (5) Susunan alternatif jawaban dibuat teratur dan sederhana. Tes pilihan ganda dapat berupa tes pilihan ganda biasa. (12) sejenis. Alternatif pilihan ini tidak boleh terlalu banyak. (13)Pokok soal sedikit mungkin dalam pernyataan atau pertanyaan negatif. (7) Semua pilihan jawaban harus homogen dan dimungkinkan sebagai jawaban yang benar. grafik. misalnya: kebanyakan. (11)Gunakan tiga atau lebih alternatif pilihan. dengan menggunakan diagram. (4) Jika pokok soal merupakan pernyataan yang belum lengkap. analisis hubungan antarhal. Untuk tes pilihan ganda yang lain diuraikan berikut ini. Jika terpaksa menggunakan pernyataan negatif maka kata negatif tersebut digaris-bawahi atau ditulis miring atau tebal. (8) Hindari keadaan dimana jawaban yang benar selalu ditulis lebih panjang dari jawaban yang salah. yaitu tes pilihan ganda yang setiap butir soal memuat pokok soal dan alternatif jawaban lebih dari dua (3-5 pilihan).3 Konstruksi Tes Pilihan Ganda Butir tes pilihan ganda (majemuk) adalah butir tes yang alternatif jawabannya lebih dari dua. Tes Pilihan Ganda Analisis Hubungan Antarhal Tes pilihan ganda analisis hubungan antarhal terdiri atas dua pernyataan yang kedua nya dihubungkan dengan kata “SEBAB”. (9) Hindari adanya petunjuk/indikator pada jawaban yang benar. seringkali. Trowbridge dan Bybee (1990) menyebutkan ada beberapa unsur yang perlu diperhatikan dalam mengkonstruksi tes pilihan-ganda. sebab selain menyulitkan peserta tes untuk menjawab juga kesulitan dalam mengkonstruknya. (2) Hindari pengulangan kata-kata yang sama dalam piliham. bukan di tengah-tengah kalimat. dan yang . kompleks. Jadi sifat hubungannya bisa berupa sebab akibat atau tidak ada hubungan sebab akibat. analisis kasus.3. maka kata atau kata-kata yang melengkapi harus diletakkan pada ujung peryataan. Pilihan ganda biasa dicontohkan pada contoh soal bagian B (lihat lampiran). pada umumnya berkisar antara 4 (empat) atau 5 (lima). (3) Hindari rumusan kata yang berlebihan. atau tabel. yaitu: (1) Inti permasalahan harus ditempatkan pada pokok soal (steam). (6) Hindari penggunaan kata-kata teknis atau ilmiah atau yang aneh atau mentereng.

atau grafik. b. peristiwa. Butir tes disusun mulai dari pokok bahasan yag dibahas paling awal ke yang dibahas paling akhir. dan media yang lain. keduanya merupakan hubungan sebab akibat. Mengadministrasi Tes Kegiatan mengadministrasi tes meliputi penyusunan perangkat tes dan pelaksanaan tes.. 4. Hubungan antar duapernyataan tersebut dapat dikembangkan lagi seperti yang dicontohkan pada contoh soal bagian C (lihat lampiran). d. yaitu proses penyuntingan naskah tes dan penggandaan tes. Variabel tersebut adalah kualitas pernyataan yaitu apakah pernyataan pertama benar atau salah dan sebaliknya. grafik. c. Ada beberapa hal yang perlu dipertimbangkan dalam penyuntingan tes. Setiap pertanyaan dibuat dalam bentuk melengkapi pilihan. yaitu: a. c. Struktur pertanyaan sama dengan pilihan ganda biasa. b. dan seterusnya. Tugas 5: Tulislah masing-masing dua butir soal fisika SLTP atau SMU untuk soal pilihan ganda analisis kasus dan pilihan ganda dengan menggunakan gambar. B: 1 dan 3 benar.1 Penyusunan Tes Ada dua hal yang perlu dipertimbangkan dalam menyusun tes. Tes Pilihan Ganda dengan Gambar. Kasus tersebut bisa diambil dari jurnal. . peserta tes disajikan kasus dalam bentuk cerita. gambar. Butir soal disusun mulai dari yang termudah ke yang paling sulit. majalah. surat kabar. tabel. tabel. B jika pernyataan benar dan alasan benar. dan sejenisnya dan disertai dengan beberapa pertanyaan. C: 2 dan 3 benar. atau D: jika semuanya benar. atau tabel mirip dengan analisis kasus baik struktur maupun pola pertanyaannya. gambar. mungkin bisa A jika 1 dan 2 benar . atau Tabel Tes pilihan ganda dengan diagram. Tes bentuk obyektif sebaiknya tidak dilaksanakan secara lisan. Kedua kegiatan tersebut dapat kita lakukan seperti berikut. Diagram. yaitu: A jika penyataan benar dan alasan benar. perbedaannya adalah. kalau pada pilihan ganda biasa hanya ada satu jawaban yang benar atau paling benar. Grafik. atau grafik. Perbedaannya pada tes ini tidak disajikan kasus dalam bentuk ceritera atau peristiwa tetapi kasus tersebut berupa diagram. Tes Pilihan Ganda Analisis Kasus Pada tes pilihan ganda analisis kasus. keduanya tidak ada hubungan sebab akibat. Tes Pilihan Ganda Kompleks Tes pilihan ganda kompleks biasa disebut Asosiasi pilihan ganda.dicari variabel lain yang dapat mengukur kemampuan siswa. 4. sedangkan untuk pilihan ganda kompleks jawabannya bisa lebih dari satu.

Jika peserta tes tidak diperkenankan menerka jawaban. 5. Stem dan options upayakan dalam satu halaman. Setelah naskah disunting. tes lisan atau tertulis.2 Pelaksanaan Tes Dalam a. h. artinya mereka yang menerka akan didenda. Sehingga mudah menempatkan jawabannya dan guru mudah dalam penskoran. sebaiknya lembaran tes dan lembaran jawaban dipisah. Dalam penggandaan. Letakkan wacana yang digunakan sebagai rujukan di atas butir tes yang bersangkutan. e. Setelah hasil tes diperiksa berikutnya adalah memberikan skor. 4. Prosedur penggandaan harus dapat menjamin kerahasiaan naskah tes. Butir tes yang setipe dijadikan dalam satu kelompok. langkah selanjutnya adalah digandakan (termasuk pengetikan). Untuk itu kerjakan tugas 6 berikut ini. Petunjuk pengerjaan harus jelas. pengadministrasian tes juga harus mempertimbangkan cara-cara pelaksanaannya. c. Cara pelaksanaan tersebut antara lain meliputi: tes catatan terbuka (open books) atau catatan tertutup (close books. Tugas 6: Jelaskan kelebihan dan kekurangan setiap pelaksanaan tes di atas! b. i. d. yaitu skor yang benar dikurangi skor yang salah.d. f. tes tindakan (praktek) 5. Setiap butir tes hendaknya disusun sedemikian rupa sehingga memudahkan peserta tes untuk membacanya. maka pada petunjuk umum mengerjakan soal harus mencantumkan: “Pikirkan dengan baik-baik sebelum menjawab. tes diumumkan atau tes dirahasiakan (mendadak). dan Setiap pelaksanaan tes tersebut ada kelebihan dan kekurangannya. karena . Mengolah tes bentuk tes obyektif lebih mudah dan cepat dibandingkan dengan bentuk tes esai.1 Pengolahan Hasil Tes Pengolahan hasil tes adalah kegiatan memeriksa hasil ujian dan mencocokkan jawaban peserta tes dengan kunci jawaban. Pengolahan dan Penilaian Hasil Tes Setelah pelaksanaan tes kegitan berikutnya adalah mengolah hasil tes tersebut dan melakukan penilaian. Hindari meletakkan kunci jawaban dalam suatu pola tertentu. g. sehingga tidak memungkinkan untuk dipertanyaan lagi cara pengerjaannya.

namun perlu . yaitu dengan menggunakan pendekatan Penilaian Acuan Norma (PAN) dan Penilaian Acuan Patokan.25 merupakan angka denda. maka dengan rumus tersebut Skor Badu = 25 – 5/(5-1) = 25 – 5/4 = 23. Berdasarkan pedoman penskoran yang telah dirancang untuk contoh soal pada lampiran. Jika pada tes esai skor Badu 10. Untuk soal esai baik terbatas maupun bebas pemberian skor didasarkan pada Pedoman Penskoran (Marking Scheme) yang telah dirancang. kemudian buatlah tabel yang memuat nomor. dan skor mahasiswa (sebagai siswa). skor maksimum untuk tes esai adalah 15. Setelah itu kerjakan tugas 7 berikut: Tugas 7: Kumpulkan semua skor teman-teman anda. urutkan skor dari skor tertinggi ke yang oaling rendah atau sebaliknya.75 (jika ada denda) skor total Badu = 25 + 10 = 35 (jika tidak ada denda) Dari contoh di atas.2 Pendekatan Penilaian Ada dua pendekatan untuk melakukan penilaian hasil belajar siswa. Di dalam proses pendidikan biasanya setiap pendekatan itu tidak dapat dilaksanakan secara murni.75 Jika tidak ada denda dalam menerka jawaban. Angka 5/4 atau 1. Pengurangan nilai ini dihiting dengan rumus: Skor = jumlah jawaban benar – jumlah kawaban salah/(n-1) (n adalah jumalternatif jawaban) Pada contoh soal (dalam lampiran) terdapat 30 butir soal obyektif. maka skor Badu adalah 25. Badu menjawab benar 25 nomor dan salah 5 nomor.75 + 10 = 33. maka skor total Badu = 23. 5.setiap jawaban yang salah akan mengurangi nilai anda”. nama. periksalah semua jawaban (soal pada lampiran) anda dan berikan skornya (anda bisa menggunakan aturan yang menggunakan denda atau yang tanpa denda). Kedua pendekatan itu digunakan sebagai acuan untuk memberikan nilai siswa.

maka jumlah peserta antara: X sampai dengan (X+1σ) adalah 34. 40.3 6 35 46. kurang. Jika jumlah kelompok tidak terlalu besar (<30). sedang. Misalnya ada sekelompok siswa memiliki skor rata-rata X.diadakan penyesuaian yang kadang-kadang merupakan kombinasi dari kedua pendekatan tersebut. Pertama. misalnya skor maksimum (semua jawaban benar) adalah 75. dengan cara skor tertinggi diberi nilai 10 dan skor di bawahnya ditetapkan secara proporsional. Persentase tertinggi ini diberi skor tertinggi. c. distribusi kemampuan anak dapat dimulai dari paling pandai.3 10 65 86. 60. 35.2.6 9 60 80 8 55 73.3 3 Apabila jumlah anggota kelompok besar (>30 orang) atau lebih dari satu kelas. Nilai mentah % yang benar Nilai 1-10 70 93.59% (X+2σ) sampai dengan (X+3σ) adalah 2. b. 30. 65. Cara yang kedua adalah dengan menghitung persentase jawaban benar yang dijawab oleh setiap anak.6 5 30 40 4 30 40 4 25 33. Dari contoh soal yang diberikan. pandai. 55. maka untuk menentukan skor setiap anak berdasarkan kelompoknya dapat dilakukan dengan dua cara.13% (X+1σ) sampai dengan (X+2σ) adalah 13. yaitu dengan menentukan skor rata-rata (X) dan simpangan baku (σ) kelompok. Kemudian persentase tertinggi diberi nilai tertinggi.14% X sampai dengan (X-1σ) adalah 34. Pengolahan kelompok nilai mentah menjadi skor 1-10 dapat ditabelkan sebagai berikut: Tabel 5-1: Pengolahan Nilai Mentah menjadi 1-10 a. Untuk anggota kelompok yang besar.13% (X+1σ) sampai dengan (X-2σ) adalah 13. dan 25. 30. dan sangat kurang. maka persentase yang benar adalah 70/75x100% atau 93.6 5 35 46.14% Harga rata-rata skor dapat dihitung dengan rumus: X = ∑ skor seluruh anggota kelompok/∑ seluruh anggota kelompok . maka anak yang mempunyai skor tetinggi 70. 5. 35. yaitu 10 untuk skala 1-10.3%.59% (X+2σ) sampai dengan (X-3σ) adalah 2. maka untuk memberi nilai setiap anggota kelompok dapat digunakan statistik sederhana. Misalnya sekelompok siswa ada 10 anak mendapat skor (nilai mentah): 70.1 Pendekatan Penilaian Acuan Norma (PAN) Yang dimaksud pendekatan PAN adalah pendekatan untuk memberikan nilai didasarkan pada perolehan kelompoknya. Distribusi (penyebaran) tersebut dapat digambarkan dengan kurve normal.3 7 40 53.

2 Pendekatan Penilaian Acuan Patokan (PAP) Pendekatan PAP adalah suatu pendekatan yang digunakan untuk menentukan keberhasilan atau kelulusan seseorang berdasarkan patokan atau kriteria yang telah ditentukan. penentuan nilai menggunakan konversi seperti pada tabel 5-2 berikut: Tabel 5-2: Konversi skor mentah ke dalam nilai 1-10 Skor Mentah Nilai 1-10 X-2 1/4σ X-1 3/4σ X-1 1/4σ X-1/4σ X+1/4σ X+3/4σ X+11/4σ X+3/4σ X+13/4σ X+21/4σ 1 2 3 4 5 6 7 8 9 10 Tugas 8: Berdasarkan data skor fisika dari 35 siswa SMU di atas hitungX dan σ kemudian tentukan skor ke-35 siswa tersebut dengan nilai 1-10. . Untuk mengetahui apakan kedua tujuan tersebut telah dikuasai oleh siswa. Jika siswa dapat mengerjakan dengan benar butir-butir soal tersebut maka dikatakan bahwa siswa telah menguasai tujuan tersebut dengan tuntas. Sehinga keberhasilan siswa dalam suatu mata pelajaran ditentukan oleh kemampuan siswa dalam mencapai tujuan pembelajaran yang telah dirumuskan. Jika belum dikuasai maka perlu ada pembelajaran remedial (perbaikan). Dalam Proses pembelajaran mengacu pada tujuan pembelajaran umum dan khusus. kriteria yang dikembangkan antara lain siswa dapat: (1) menulis dimensi besaran pokok dan (2) menulis dimensi beberapa dimensi besaran turunan. 5.∑ skor 1/6 dari anggota kelompok rendah = ½ ∑ seluruh anggota kelompok Apabila terdapat data skor fisika siswa SMU dari 35 anak yang telah diurutkan dari tertinggi sampai terrendah adalah sebagai berikut: 60 45 35 25 60 45 35 20 55 45 30 20 55 40 30 15 55 40 30 10 50 40 30 50 40 25 50 35 25 50 35 25 50 35 25 Dalam kurikulum 1975.Dan Simpangan Baku dirumuskan: σ ∑ skor 1/6 dari anggota kelompok tinggi . maka untuk setiap tujuan harus ada butir soalnya. PAP digunakan dalam sistem belajar tuntas. yaitu kelulusan atau keberhasilan siswa ditentukan oleh kelompoknya.2. Inilah yang membedakan dengan pendekatan PAN. Misalnya dalam rumusan tujuan pembelajaran khusus dirumuskan dengan “Siswa kelas 1 SMU dapat menulis dimensi besaran fisika”. Untuk penguasaan yang tuntas.

dan nilai A bisa ≥ 90% 6. dan < 80% nilai E (tidak lulus). Setiap guru harus memiliki kemampuan untuk menentukan mutu butir soal dan perangkat soal agar mereka dapat merancang soal yang baik. dan sukar. yaitu: anak yang lulus adalah anak yang mempunyi skor ≥ 80% dan yang tidak lulus adalah anak yang skornya <80%. 6. maka apakah semua siswa yang mendapat skor 80% ke atas akan mendapat nilai yang sama? Jawabnya tergantung pada sistem penilaian yang digunakan. harus Perbedaannya. Kedua hal ini akan diuraikan seperti berikut. (80-85)% nilai D. sehingga tingkat keseluruhn butir soal adalah sekitar 50%. 6. parameter kualitatif butir soal disebut dengan spesifikasi butir soal. kesukaran mengombinasikan butir soal yang mudah. dan E. tetapi melihat tingkat penguasaan seseorang terhadap materi atau tujuan pembelajaran. (85. Menganalisis Soal Kegiatan menganalisis soal merupakan kegiatan untuk menentukan mutu butir dan perangkat soal. Ynag dipentingkan dalam PAP adalah daya serap siswa. Penilaian mutu butir soal ditentukan oleh karakter dari butir soal itu sendiri. diperhatikan. misalnya batas kelulusan bisa > 80% atau < 80%. 6. dan berfungsi tidaknya pilihan untuk tipe soal pilihan ganda. yaitu keduanya menentukan lebih dahulu tujuan (TPK) atau hasil apa yang akan diukur dan bagaimana butir cara mengukurnya tingkat yang paling soal tepat. Penilaian mutu perangkat soal meliputi validitas dan reliabilitasnya. Seharusnya sumua tujuan pembelajaran dapat dikuasai siswa 100%.Perencanaan dan konstruksi butir soal baik untuk PAN maupun PAP kedua mempunyai kesamaan.1.5-95)% nilai B. pada harus pengembangan soal PAN. B. sehingga ada beberapa sekolah yang menetapkan ketuntasan ini 80%. Pada pengembangan butir soal PAP tingkat kesukaran dan daya beda tidak diperhatikan karena maksud soal bukan untuk membedakan siswa yang pintar dari siswa yang kurang pintar.1 Tingkat Kesukaran . daya beda (D).1 Karakteristik Butir Soal Karakteristik butir soal untuk tes hasil belajar dipertimbangkan berdasarkan tingkat kesukaran (p).1 Karakteristik dan Spesifikasi Butir Soal Yang dimaksud karakteristik butir soal adalah parameter kuantitatif dari butir soal. C. dan berfungsi atau tidaknya pilihan. Sebaliknya. Jika syarat ketuntasan adalah 80%.5-90)% nilai C. yang meliputi tingkat kesukaran. Ada pula yang menggunakan kategori A. sedang. Penguasaan 100% ini sulit dicapai. (90. daya beda. dengan rentangan: > 95% nilai A. D. Rentangan skor untuk mendapat nilai A-E tidak baku seperti dicontohkan. Ada penilaian yang menggunakan kriteria lulus dan tidak lulus.1. Spesifikasi butir soal ditentukan atas dasar penilaian ahli (expert judgment).1.

2 Daya Beda Dalam suatu kelompok peserta tes. dan mudah (25%).75 Sedang 0. 0. dan sukar. Butir soal ini dikatakan sukar.5/10 = 0.5+ 0.26 .76 . maka tingkat kesukaran butir soal nomor satu adalah 0.25 Sukar 0. sedang (50%). dengan tingkat kesukaran setiap butirnya berturut-turut 0. maka tingkat kesukaran perangkat soal (p naskah ujian) tersebut adalah: p naskah ujian = (0. 0.2 + 0. 0. sebab informasi kemampuan yang dihasilkan tidak berdistribusi normal. Jika komposisi butir soal tidak seimbang maka penggunaan PAN tidak tepat. Jika dalam suatu perangkat soal terdapat 10 butir soal.4. Indeks yang menunjukkan tingkat kemampuan butir soal yang dapat membedakan kelompok atas dan bawah disebut daya beda butir soal. sedang.8 + 1.45.8. Jadi ukuran butir soal atau perangkat soal yang baik tidak ditentukan oleh tiinggi atau rendahnya tingkat kesukaran tetapi pada komposisi tingkat kesukarannya.55 atau p naskah ujian = ∑b/∑butir soal Tingkat kesukaran butir soal atau perangkat soal biasanya dikategorikan mudah. Komposisi ini dapat diterapkan pada PAN dan PAP.0)/10 = 5.6.0.Tingkat kesukaran butir soal dimaknai sebagai proporsi peserta tes menjawab benar terhadap butir soal tersebut. 6. jumlah peserta tes yang menjawab benar 3 orang dan jumlah seluruh peserta tes 15 orang. Penentuan ketiga kategori tersebut dapat menggunakan pedoman: Tingkat kesukaran Kategori 0.2.1.35.35+ 0.0.7+ 0. 0. 0.7.45+ 0.5+ 0. dan 1. 0. Daya beda biasanya disimbolkan dengan D dan dirumuskan: D = (Ba – Bb)/1/2T .00 . Untuk menyusun suatu naskah ujian atau tes hasil belajar sebaiknya digunakan butir soal yang tingkat kesukarannya berimbang. 0.5. biasanya kita jumpai kelompok yang berprestasi tinggi (kelompok atas) dan kelompok yang berprestasi rendah (kelompok bawah).5.6 + 0.2.1. yang dirumuskan dengan: b = ∑ peserta yang menjawab benar/∑ peserta keseluruhan Misalnya soal nomor 1.00 Mudah Contoh perangkat soal tersebut termasuk kategori sedang. yaitu: sukar (25%).4+ 0.1. 0.0.

Andaikan jumlah seluruh peserta tes 10 orang.1. maka butir soal tersebut perlu dianalisis. Untuk soal nomor X misalnya. apabila jumlah peserta besar maka kelompok dibuat menjadi tiga.3 Berlaku Tidaknya Pilihan Dalam tipe soal obyektif. Untuk menganalisis setiap butir soal tersebut.8 – 0.6 atau dapat dihitung dengan rumus: D = (4 – 1)/5 = 0. dan sebaliknya makin rendah daya beda makin tidak baik butir soal tersebut. tengah dan bawah. Jadi. Daya beda berharga +1 berarti semua kelompok atas menjawab benar dan semua kelompok bawah menjawab salah terhadap suatu butir soal.8 dan proporsi kelompok bawah yang menjawab benar adalah 0. Sebaliknya untuk daya beda yang berharga –1. Sehingga butir soal ini harus dibuang atau tidak dihitung dalam penentuan skor mahasiswa.2 = 0.25. khususnya untuk soal pilihan ganda. Untuk memudahkan analisis. makin baik butir soal tersebut. maka proporsi kelompok atas yang menjawab benar adalah 0.6 Koefisien atau indeks daya beda berkisar antara –1 sampai dengan +1.Dimana D = daya beda Ba = ∑ kelompok atas yang menjawab benar Bb = ∑ kelompok bawah yang menjawab benar T = ∑ peserta tes (jika jumlah ganjil = T-1) Jika jumlah peserta banyak.2. makin tinggi daya beda suatu butir soal. maka kelompok atas dan bawah masing-masing diambil 27%. Kurang dari 0. Jika daya beda negatif. butir soal dianggap kurang mampu membedakan peserta tes yang siap menghadapi tes dari peserta yang tidak siap. kelompok atas yang menjawab benar adalah 4 orang dan kelompok bawah yang menjawab benar hanya satu orang. lembar jawaban peserta kelompok atas dan bawah dijadikan sebagai sumber informasi.1. 6. Jadi daya beda soal nomor X adalah: 0. yakni: kelompok atas. maka butir soal tidak dapat digunakan untuk mengukur hasil belajar siswa.25. untuk menentukan berfungsi tidaknya pengecoh suatu butir soal. Distribusi dari jawaban kedua kelompok ini untuk setiap butir soal dimasukkan dalam satu tabel 6-1 berikut: Andaikan butir soal nomor 12 Tabel 6-1 : Distribusi jawaban soal nomor 12 Pilihan Kelompok Atas Bawah A* 3 1 B 0 1 C 1 1 D 0 2 E 0 1 . Harga daya beda yang dianggap masih memadai untuk sebutir soal adalah ≥ 0.

Apabila pada pengecoh ditemukan kelompok atas lebih banyak dibandingkan kelompok bawah. Analisis validitas isi ini hanya bisa dilakukan oleh seorang yang menguasai bidang studi tersebut dengan baik. perumusan tujuan pendidikan masih cenderung mengacu pada tujuan pendidikan menurut Bloom dan kawan-kawan. yakni: validitas isi dan keakuratan pengukuran tujuan yang ingin dicapai. Berbahayanya. Validitas isi (konten) pelajaran sangat diperlukan untuk menentukan apakah suatu butir soal merupakan alat ukur yang baik untuk suatu hasil belajar tertentu. Di Indonesia. Sehingga semua pilihan pada soal nomor 12 sudah berfungsi. Jadi dapat disimpulkan bahwa pengecoh berfungsi sebagai jawaban yang salah. Dalam kisi-kisi itu ditentukan bahwa butir soal tertentu dimaksudkan untuk mengukur pokok bahasan atau sub pokok bahasan tertentu. khususnya untuk kelompok atas.2 Spesifikasi Butir Soal Untuk menganalisis suatu butir soal ada dua spesifikasi yang harus dipertimbangkan. D. ada dua hal . hal ini akan berakibat jauh bagi siswa di masa yang akan datang. Tentukan tingkat kesukaran setiap butir soal! b. kemudian kerjakan bersama tugas 9 berikut di kelas. Analisis dimulai dengan mengadakan kajian terhadap kisi-kisi soal. Tugas 9: a. Untuk menganalisis ini perlu penguasaan tentang tujuan pendidikan. cocokkan secara bersama jawaban THB tentang besaran. Jadi kisi-kisi soal digunakan sebagai tolok ukur untuk memvalidasi butir soal. Yang perlu diperhatikan bahwa butir soal yang tidak secara akurat mengukur tujuan yang telah ditetapkan akan merupakan butir soal yang sia-sia. bila pada pengecoh tidak ada satupun yang memilih. Andaikan tabel di atas jumlah yang menjawab benar A lebih banyak kelompok bawah.1. Selain penilaian terhadap setiap butir soal. maka pilihan ini harus diperbaiki pula.Jumlah 4 1 2 2 1 Jawaban yang benar adalah A (tanda *). belum tentu akan membuat perangkat tes (soal ujian) menjadi baik. C. jumlah peserta yang memilih A adalah banyak. maka pilihan ini harus diperbaiki. Selain itu. Pengecoh B. aspek yang harus dianalisis secara kualitatif oleh seorang ahli bidang studi adalah apakah butir soal yang digunakan apakah mengukur tujuan pendidikan tertentu yang ditetapkan dalam kisi-kisi.2 Karakteristik Perangkat Tes Meskipun suatu tes terdiri atas butir-butir soal yang baik. Selain memvalidasi. pilihan ini juga kurang baik dan perlu diperbaiki. satuan dan angka penting anda di kelas. Dari uraian di atas. Apakah pada butir-butir soal obyektif ada pilihan-pilihan yang perlu diperbaiki? Sebutkan! 6. Tentukan daya beda setiap butir soal dan tentukan pula kelayakannya untuk digunakan sebagai THB! c. bila butir soal itu digunakan untuk menentukan keputusan bagi seseorang. dan E ada yang memilih terutama kelompok bawah. 6.

Keraguan atau pertanyaan ini sulit dijawab.1 Reliabilitas Tes Ketika kita mengamati skor hasil tes siswa. Skor yang diperoleh peserta es pada dasarnya merupakan skor yang secara langsung berhubungan dengan alat ukur dan kondisi eksternal saat tes berlangsung.yang harus diperhatikan dalam menilai soal ujian. Tetapi skor sesungguhnya itupun tidak kita ketahui. yaitu: skor yang diperoleh (obtained score). . Reliabilitas ditinjau dari stabilitas dapat ditentukan dengan mengkorelasikan anatardua skor dari satu tes yang diadministrasikan dua kali kepada kelompok peserta tes yang sama. dan konsistensi atau homogenitas tes. Kedua perangkat tes diadministrasikan pada kelompok peserta tes yang sama dalam waktu berurutan. Andaikan skor peserta tes itu tidak mengandung unsur kekeliruan. kita harus mengkonstruk dua perangkat tes yang paralel. Hasil tes dari dua perangkat tes tersebut dikorelasikan. Secara umum. ekuivalensi dari dua tes yang paralel. Kekeliruan ini bisa bersumber pada alat ukurnya atau mungkin faktor yang lain. Dalam hal ini. maka skor itu merupakan skor yang sesungguhnya. 6. maka ada beberapa prosedur untuk memperoleh koefisien korelasi yang menggambarkan reliabilitasnya. yakni: validitas dan reliabilitasnya. Untuk itu kita kenal adanya tiga bentuk skor dalam setiap hasil tes. Kedua hal ini dapat dijelaskan sebagai berikut. Selang waktu antara dua pengadministrasian tes harus dekat. Sehingga skor yang diperoleh peserta tes adalah skor yang kemungkinan besar mengandung kekeliruan yang tidak dapat diketahui. muncul pertanyaan atau keraguan pada diri kita. mengapa? Reliabilitas dalam arti ekuivaensi dari dua tes yang paralel. Untuk melihat apakah perangkat tes itu dapat dipercaya sebagai alat ukur yang dapat menggambarkan kemampuan peserta tes. Kondisi eksternal tidak dapat didefinisikan sepenuhnya. reliabilitas dimaknai sebagai sejauh mana suatu alat ukur dapat diyakini memberikan informsi yang konsisten (ajeg) dan tidak mendua tentang karakteristik peserta tes yang diujikan. dan kekeliruan skor (score error). Karena reliabilitas merupakan salah satu bentuk khusus korelasi yang menggambarkan keajegan alat ukur (tes). Reliabilitas tes dapat ditinjau dari unsur stabilitas. yaitu apakah skor itu benar-benar menggambarkan tingkat kemampuan siswa kita. Hubungan ketiganya dinyatakan dengan: Skor yang diperoleh = skor sesungguhnya – kekeliruan Secara operasional reliabilitas tes didefinisikan sebagai koefisien korelasi antara dua perangkat skor yang dihasilkan oleh perangkat tes yang sama atau paralel yang diadministrasikan kepada sekelompok peserta tes yang sama.2. begitupula alat ukur yang digunakan tidak dapat diketaui sepenuhnya kekuatan dan kelemahannya. maka dapat dilihat dari aspek reliabilitasnya. skor sesungguhnya (true score). karena dalam setiap tes selalu akan terdapat unsur kekeliruan (error).

yaitu: ukuran yang menunjukkan sejauh mana skor dalam tes berasosiasi dengan penguasaan peserta dalam bidang studi yang diuji melalui perangkat tes tersebut. Untuk menentukan koefisien korelasi ini dapat dilakukan dengan dua cara. Apakah peserta tes yang bervariasi berpengaruh terhadap reliabilitas tes? Jelaskan. Selain validitas isi. c. dalam arti mengukur mata pelajaran atau bidang studi yang sama. Apakah penskoran tes yang kurang obyektif berpengaruh terhadap reliabilitas tes? Jelaskan. yaitu: validitas prediktif. diskusikan dan kerjakan secara kelompok tugas 10 berikut ini. dengan rumus ke-20nya (KR-20): n SB2 . Untuk tes hasil belajar. yaitu: teknik split-half dan teknik Kuder-Richardson (KR). Untuk memperoleh skor setengah pertama dan kedua dapat dilakukan dengan mengkorelasikan skor pada nomor ganjil dan nomor genap. Tenik Kuder-Richardson dikembangkangkan oleh Kuder dan Richardson. b. Apakah jumlah butir soal dalam perangkat tes berpengaruh terhadap reliabilitas tes? Jelaskan. Validitas isi ini ditentukan oleh ahli yang menguasai bidang studi tersebut.2.2 Validitas Tes Seperti halnya pada butir soal. aspek validitas yang paling penting adalah validitas isi (content validity). perangkat tes yang baik juga harus memenuhi kriteria valid (tepat). Ketiga jenis validitas tersebut tidak dibahas di sini .∑pq SD2 KR-20 =  [ ] n-1 dimana n = ∑ butir soal SB = simpangan baku skor-skor tes p q = tingkat kesukaran tes (perangkat tes) =1-p Setelah anda mempelajari reliabilitas tes di atas. juga kita kenal jenis validitas tes yang lain.Reliabilitas dalam arti konsistensi tes merupakan koefisien korelasi yang menunjukkan seberapa jauh suatu perangkat tes homogen. Tugas 10: a. dan validitas konstruk. Teknik split-half dapat dilakukan dengan mengkorelasikan skor setengah pertama dengan skor setengah kedua dari suatu tes. 6. Validitas tes didefinisikan sebagai seberapa jauh perangkat tes itu berguna dalam mengambil keputusan yang relevan dengan tujuan yang telah ditentukan. yang bisa menganalisis tes harus orang mempunyai latar belakang bidang studi yang baik. Oleh karena itu. Jadi untuk validitas ini analisisnya lebih bersifat kualitatif. validitas serempak.

W.. A. Jakarta. Depdikbud. 1995. Program Pengembangan Keterampilan Teknik Instruksional (Pekerti): Penilaian Hasil Belajar... Djamarah S. Depdikbud.. Sydney. Systematic Instruction in Science for The Middle and High School Years. Rineka Cipta. Setelah anda mempelajari validitas tes. Jakarta. CATATAN: KERJAKAN TUGAS 1 S/D 11 DENGAN SUNGGUH-SUNGGUH DAN KUMPULKAN PADA PERTEMUAN BERIKUTNYA!!!! . Jakarta. Giancoli D. 1996.. 1993. Evaluation to Improve Learning. Fisika 1 untuk Sekolah Menengah Umum Kelas 1. 1995. Kurikulum Sekolah Menengah Umum: GBPP Mata Pelajaran Fisika. & Zain A. New Jersey.. 1990. Columbus. Depdikbud. 1995. F. W. Bybee R. A.. Inc... Becoming a Secondary School Science Teacher. Depdikbud. SUMBER Bloom B. Inc. dan Hastings. B. Zainul A. Merrill Publishing Company. Tugas 11: Apakah reliabilitas tes berpengaruh terhadap validitas tes? Jelaskan. Madaus G. McGraw-Hill Book Company. Jakarta.. Nasoetion N. New York.. Addison-Wesley Publishing Company. Trowbridge L.. Physics.. Strategi Belajar Mengajar. Englewood Clifs.. Kertiasa N. (1980).karena ketekaitannya dengan keperluan terhadap penilaian perangkat tes hasil belajar tidak terlalu kuat. diskusikan secara kelompok tugas 11 berikut. S. Prentice-Hall International. Farmer W. Fourth edition.. Farrel M.

Materi Kuliah EVALUASI HASIL BELAJAR: (Tes Hasil Belajar) Handout digunakan terbatas untuk: Matakuliah Evaluasi Hasil belajar Fisika .

2010 .Oleh: Indrawati (Staf Pengajar Pendidikan Fisika FKIP Unej) Jember.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->