PENYUSUNAN INSTRUMEN PENELITIAN Oleh : Sri Yamtinah A.

PENDAHULUAN Meneliti adalah melakukan pengukuran terhadap fenomena sosial maupun alam. Dengan demikian harus ada alat ukur yang baik. Alat ukur dalam penelitian biasanya dinamakan instrumen penelitian. Instrumen penelitian diartikan sebagai suatu alat yang digunakan mengukur fenomena alam maupun sosial yang diamati. Secara spesifik semua fenomena ini disebut variabel penelitian. Instrumen memegang peranan yang sangat penting dalam menentukan mutu suatu penelitian. Mutu penelitian dipengaruhi oleh kualitas data penelitian. Terdapat dua hal yang mempengaruhi kualitas data hasil penelitian, yaitu kualitas instrumen penelitian dan kualitas pengumpulan data. Kualitas instrumen penelitian berkenaan dengan validitas dan reliabilitas instrumen sedangkan kualitas pengumpulan data berkenaan dengan ketepatan cara-cara yang digunakan untuk mengumpulkan data. Oleh karena itu, instrumen yang telah teruji validitas dan reliabiltasnya, belum tentu dapat menghasilkan data yang valid dan reliabel, apabila instrumen tersebut tidak digunakan secara tepat dalam pengumpulan datanya. Sedangkan jika kualitas instrumen yang digunakan tidak baik dalam arti mempunyai validitas dan reliabilitas yang rendah, maka data yang diperoleh juga tidak valid atau tidak sesuai dengan fakta di lapangan, sehingga dapat menghasilkan kesimpulan yang keliru. Untuk mengumpulkan data dalam suatu penelitian, kita dapat menggunakan instrumen yang telah tersedia dan dapat pula menggunakan instrumen yang dibuat sendiri. Instrumen yang telah tersedia pada umumnya adalah instrumen yang sudah dianggap baku untuk mengumpulkan data variabel-variabel tertentu. Dengan demikian, jika instrumen baku telah tersedia untuk mengumpulkan data variabel penelitian maka kita dapat langsung menggunakan instrumen tersebut, dengan catatan bahwa teori yang dijadikan landasan penyusunan instrumen tersebut sesuai dengan teori yang diacu dalam penelitian kita. Selain itu konstruk variabel yang diukur oleh instrumen tersebut juga sama dengan konstruk variabel yang hendak kita ukur dalam penelitian. Akan tetapi, jika instrumen yang baku belum tersedia untuk mengumpulkan data variabel penelitian, maka instrumen untuk mengumpulkan data variabel tersebut harus dibuat sendiri oleh peneliti. Pengumpulan data dapat dilakukan dalam berbagai setting, berbagai sumber, dan berbagai cara. Bila dlihat dari setting-nya, data dapat dikumpulkan pada setting alamiah (natural setting), pada laboratorium dengan metode eksperimen, di rumah dengan berbagai responden, pada suatu seminar, diskusi, dijalan dan lain-lain. Bila dilihat dari sumber datanya, maka pengumpulan data dapat menggunakan sumber primer, dan sumber sekunder. Sumber primer adalah sumber data yang langsung memberikan data kepada pengumpul data, dan sumber sekunder merupakan sumber yang tidak langsung memberikan data kepada pengumpul data, misalnya lewat orang lain atau lewat dokumen. Selanjutnya bila dilihat dari segi cara atau teknik pengumpulan data, maka teknik pengumpulan data dapat dilakukan dengan interview (wawancara), kuesioner (angket), observasi (pengamatan) dan dokumentasi.

menjodohkan (matching choice). Instrumen yang berisi benar – salah. Menurut Arikunto. Instrumen tes bersifat mengukur. Fungsi instrumen adalah mengungkapkan fakta menjadi data. yaitu wawancara terstruktur dan wawancara tidak terstruktur. Instrumen yang berisi jawaban skala. Teknik Pengumpulan Data Ada 5 cara teknik pengumpulan data. ataupun tes isian (completion test). yaitu frekuensi atau jumlah jawaban. Angka tersebut bukan skor atau data ordinal.B. yang dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variabel. 1. bila peneliti atau pengumpul data telah mengetahui dengan pasti tentang informasi apa yang akan diperoleh. pengetahuan intelegensi. Instrumen Pengumpulan Data Secara garis besar. interval atau rasio. yaitu: a. yaitu: a. jawaban tersebut dapat dijumlahkan sehingga diperoleh angka. deskriptif kualitatif ataupun kuantitatif terkait dengan narasi. Wawancara terstruktur digunakan sebagai teknik pengumpulan data. benar salah (true false). interval atau rasio. Pada instrumen non tes dengan jawaban terbuka. tetapi data nominal. instrumen adalah suatu alat yang memenuhi persyaratan akademis. b. data merupakan penggambaran variabel yang diteliti dan berfungsi sebagai alat pembuktian hipotesis. 2. Interview (Wawancara) Interview (wawancara) merupakan salah satu bentuk teknik pengumpulan data yang banyak digunakan dalam bentuk deskriptif kualitatif dan deskriptif secara kuantitatif. kemungkinan diperoleh data angka yang bisa diolah menjadi data nominal. Dalam hal ini wawancara dibedakan menjadi dua macam. Dalam studi dokumenter. ordinal. karena berisi pertanyaan atau pernyataan yang alternative jawabannya memiliki standar jawaban tertentu. mengikuti bentuk skala sikap dari Likert. Non Tes (bukan test) Pada instrumen non test atau bersifat menghimpun dengan jawaban berstruktur. Instrumen memegang peranan penting dalam menentukan mutu suatu penelitian dan penilaian. Sedangkan menurut Djaali dan Muljono. benar – salah ataupun skala jawaban. INSTRUMEN DAN TEKNIK PENGUMPULAN DATA Instrumen adalah alat yang digunakan untuk mengumpulkan data dalam suatu penelitian dan penilaian. kemampuan atau bakat yang dimiliki oleh individu atau kelompok. . Instrumen merupakan alat ukur yang digunakan untuk mendapatkan informasi kuantitatif dan kualitatif tentang variasi karakteristik variabel penelitian secara objektif. dapat berbentuk tes pilihan jamak (multiple choice). bentuk instrumen digolongkan menjadi dua macam. jawaban singkat (short answer). Wawancara dilaksanakan secara lisan dalam pertemuan tatap muka individual atau kelompok. berupa pertanyaan atau pernyataan yang jawabannya berbentuk skala deskriptif ataupun skala garis. Tes Tes adalah serentetan pertanyaan atau latihan serta alat lain yang digunakan untuk mengukur ketrampilan. data yang diperoleh pada umumnya adalah data naratif deskriptif. benar tidaknya data tergantung dari baik tidaknya instrumen pengumpulan data.

Observasi Observasi atau pengamatan merupakan suatu teknik atau cara mengumpulkan data dengan jalan mengadakan pengamatan terhadap kegiatan yang sedang berlangsung. wawancara mendalam. yaitu: Pertama. b. maupun elektronik. Dalam observasi partisipatif pengamat ikut serta dalam kegiatan yang sedang berlangsung. dan sebagainya. Dalam observasi non partisipatif pengamat tidak ikut serta dalam kegiatan. butirbutir pertanyaan dirumuskan secara jelas menggunakan kata-kata yang lazim digunakan (popular). Pertama. gambar. Teknik Triangulasi berarti peneliti menggunakan teknik pengumpulan data yang berbeda-beda untuk mendapatkan data dari sumber yang sama. untuk . Peneliti menggunakan observasi partisipatif. Check-list yaitu daftar variable yang akan dikumpulkan datanya. Dengan demikian metode dokumentasi dapat dilaksanakan dengan dua cara. untuk setiap pertanyaan atau pernyataan terbuka dan berstruktur disediakan kolom untuk menuliskan jawaban atau respon dari responden secukupnya. dia hanya berperan mengamati kegiatan. dan dokumentasi untuk sumber data yang sama secara serempak. Bila peneliti melakukan pengumpulan data dengan triangulasi. Kuesioner (Angket) Kuesioner (angket) merupakan teknik pengumpulan data yang dilakukan dengan cara memberikan seperangkat pertanyaan atau pernyataan tertulis kepada responden untuk dijawabnya. triangulasi diartikan sebagai teknik pengumpulan data yang bersifat menggabungkan dari berbagai teknik pengumpulan data dan sumber data yang telah ada. Dan Ketiga. Kedua. Dokumen-dokumen yang dihimpun dipilih yang sesuai dengan tujeuan dan fokus masalah. maka sebenarnya peneliti mengumpulkan data yang sekaligus menguji kredibilitas data. sebelum butir-butir pertanyaan atau pernyataan ada penngantar atau petunjuk pengisian. personil bidang kepegawaian yang sedang rapat. Triangulasi Dalam teknik pengumpulan data. Oleh karena angket dijawab atau diisi oleh responden dan peneliti tidak selalu bertemu langsung dengan responden. pedoman dokumentasi yang memuat garis-garis besar atau kategori yang akan dicari datanya. d. dimana peneliti tidak langsung bertanya jawab dengan responden. tidak ikut dalam kegiatan.Wawancara tidak terstruktur adalah wawancara yang bebas dimana peneliti tidak menggunakan pedoman wawancara yang telah tersusun secara sistematis dan lengkap untuk pengumpulan datanya. Kegiatan tersebut biasa berkenaan dengan cara guru mengajar. yaitu mengecek kredibilitas data dengan berbagai teknik pengumpulan data dan berbagai sumber data. pengamat ikut sebagai peserta rapat atau peserta latihan. baik dokumen tertulis. Kedua. Triangulasi sumber berarti. siswa belajar. maka dalam penyusuna angket perlu diperhatikan beberapa hal. e. Dalam hal ini peneliti tinggal memberikan tanda setiap pemunculan gejala yang dimaksud. kalimat tidak terlalu panjang. kepala sekolah yang sedang memberikan pengarahan. Observasi dapat dilakukan secara partisipatif ataupun non partisipatif. c. Dokumentasi Suatu teknik pengumpulan data dengan menghimpun dan menganalisis dokumen-dokumen.

LANGKAH-LANGKAH PENYUSUNAN INSTRUMEN Langkah-langkah dalam menyusun instrument secara lengkap dapat dijabarkan sebagai berikut : 1. digolongkan menjadi dua kelompok yaitu kelompok pernyataan atau pertanyaan positif (favourable) dan kelompok pernyataan atau pertanyaan negatif (unfavourable). Koefisien reliabilitas memiliki rentangan 0-1. Validasi kedua adalah uji coba instrumen di lapangan yang merupakan bagian dari proses validasi empirik. Tulis butir-butir instrumen baik dalam bentuk pertanyaan maupun pernyataan. 3. 5. indikator sebagai jabaran dimensi dan butir sebagai jabaran indikator. uji coba dilakukan dengan menggunakan minimal 2 orang penilai (rater). Butir instrument yang ditulis divalidasi secara teoritik dan empirik 6. Dalam hal instrument tes aspek kognitif. Berdasarkan validasi pakar atau panelis dapat dilakukan revisi instrumen dan dapat ditentukan besar validitas isinya berdasarkan rumus Gregory ataupun rumus CVR (Content Validity Ratio ) (selengkapnya pada pembahasan validitas) 8. dimensi adalah indikator kompetensi dan indikator adalah indikator soal. Setelah konsep instrumen dianggap valid secara teoritik dilanjutkan penggandaan instrumen secara terbatas untuk keperluan uji coba. Untuk instrument tes aspek kognitif. 11. Dalam hal instrumen pengukuran kinerja untuk aspek psikomotor.mendapatkan data dari sumber yang berbeda-beda dengan teknik yang sama. Validasi pertama yaitu validasi teoritik ditempuh melalui pemeriksaan pakar atau panelis yang menilai seberapa jauh ketepatan dimensi sebagai jabaran dari konstruk. Buat kisi-kisi instrumen dalam bentuk tabel spesifikasi yang memuat dimensi. Dihitung koefisien reliabilitas dengan menggunakan formula atau rumus yang disesuaikan dengan jenis data. untuk menetapkan daya pembeda butir dan tingkat . masih perlu dilakukan telaah butir secara empiris berdasarkan respon siswa hasil uji coba. Dalam hal instrument tes aspek kognitif. 9. Kembangkan dimensi dan indikator variabel sesuai dengan rumusan konstruk variable. 7. Sintesa teori-teori yang sesuai dengan konsep variabel yang akan diukur (merumuskan definisi konseptual) dan membuat konstruk variable (merumuskan definisi operasional). Validasi pertama ini dapat disebut sebagai memvalidasi isi (content validity ). nomor butir dan jumlah butir untuk setiap dimensi dan indicator 4. makin tinggi koefisien reliabilitas instrumen berarti semakin baik kualitas instrument (selengkapnya pada pembahasan reliabilitas ). 2. definisi konseptual adalah standar kompetensi dan definisi operasional adalah kompetensi dasar. indikator. Dalam hal instrument pengukuran kinerja (aspek psikomotor) perlu ditentukan juga reliabilitas antar rater. C. Dalam hal instrument non kognitif. Jawaban responden adalah data empiris yang kemudian dianalisis untuk menguji validitas empiris atau validitas kriteria dari instrumen yang dikembangkan dengan Analisis Faktor Konfirmatori atau Analisis Faktor Eksploratori(untuk skripsi belum perlu dilakukan) 10. Instrumen diberikan kepada sejumlah responden sebagai sampel yang mempunyai karakteritik sama dengan populasi yang ingin diukur.

Untuk dapat mengetahui apakah secara isi. 12. maka alat ukur dapat diperbaiki. tes yang valid untuk tujuan tertentu mungkin tidak valid untuk tujuan lain. Tes yang valid adalah tes yang mampu mengukur apa yang hendak diukur. Contoh penggunaan formula Schultz & Whitney (2005) hasil pemeriksaan oleh 10 panelis dari 4 item yang diperiksa: Butir ke.6 . perlu pemahaman yang mendalam tentang validitas dan reliabilitas instrumen. maka perlu orang-orang yang ahli di bidangnya yang kita tunjuk sebagai panelis untuk memeriksa instrument kita. Pada formula Schultz & Whitney (2005) analisisnya pada masing-masing butir. Ada 3 jenis validitas pengukuran yaitu: 1.75. Artinya alat ukur yang mempunyai validitas isi yang baik adalah tes yang benar-benar mengukur penguasaan materi yang seharusnya dikuasai sesuai dengan konten pengajaran yang tercantum dalam kurikulum. Rakit semua butir yang telah dibuat menjadi instrumen final. Pemeriksaan validitas pengukuran dapat dilakukan pada saat tes baru dibuat atau disusun dan dapat juga dilakukan pada saat uji coba alat ukur. VALIDITAS INSTRUMEN Validitas berasal dari kata validity yang berarti “kesahihan”. Validitas pengukuran memiliki nilai dari rendah ke tinggi. makin tinggi tingkat validitas makin baik pengukuran itu. Pemeriksaan validitas dan perbaikan alat ukur dilakukan berulang-ulang sampai alat ukur mencapai validitas pengukuran yang cukup tinggi. Not necessary Usefull Essential CVR 1 1 1 8 0. Oleh karena fungsinya adalah melihat kecocokan. terdapat dua hal yang harus diperhatikan dan dipenuhi untuk memperoleh instrumen yang berkualitas yaitu instrumen tersebut harus valid dan reliabel. Terkait langkah-langkah pengembangan instrumen di atas. D. Pemeriksaan validitas pengukuran dilakukan sebelum alat ukur/tes digunakan sesungguhnya. digunakan formula : Dimana: ne adalah banyaknya penelaah yang menyatakan essential N adalah banyaknya penelaah dan validitas isi dikatakan memenuhi syarat jika CVR ≥ 0. Validitas adalah sejauh mana suatu alat ukur atau tes melakukan fungsinya atau mengukur apa yang seharusnya diukur. Artinya sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsinya. a.. Untuk itu. Apabila hasil pemeriksaan menunjukkan tingkat validitas rendah. Oleh karena itu validitas selalu dikaitkan dengan tujuan tertentu. Atau dengan kata lain validitas adalah kecocokan antara alat ukur (tes) dengan sasaran ukur.kesukaran. Validitas Isi Validitas isi adalah kecocokan di antara isi alat ukur (tes) dengan isi sasaran ukur. validitas instrument memenuhi syarat atau tidak digunakan 2 formula yaitu formula Schultz & Whitney (2005) untuk melihat validitas isi masingmasing butir dan formula Gregorry (2007) untuk melihat validitas isi secara keseluruhan.

6. 16.700 maka dapat dianalisis juga bahwa masih banyak item yang dianggap kurang relevan yang perlu untuk direvisi. 10. 9. 12. 3. 26. 18. 17. 18. 19. 21. 7. Nilai ini lebih dari 0. dalam bentuk menilai relevan atau kurang relevan masing-masing indicator butir bila dicocokkan dengan butir-butirnya. 28.14. 24. Selanjutnya dibuat table bantu sebagai berikut : Panelis II Panelis I Jumlah Item yang Kurang Relevan Jumlah Item yang Relevan Jumlah Item yang Kurang Relevan 4 3 Jumlah Item yang Relevan 2 23 Conten Validity (CV) = Nilai CV= 0. 22. 16.30. Validitas Kriteria Prosedur pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. 29 1. 23. 20.0 b. 3.32. Untuk keseluruhan butir digunakan formula dari Gregory (2007): Pada formula Gregorry. Hal ini juga menunjukkan bahwa instrumen ini relevan untuk mengukur variable yang diteliti. dua orang panelis memberikan penilaiannya terhadap 32 butir pernyataan angket yaitu : Panelis I Panelis II Nomor Item Kurang relevan Nomor Item Relevan Nomor Item Kurang relevan Nomor Item Relevan 1.6 4 0 0 10 1. 26. 11. diperlukan 2 orang panelis untuk memeriksa kecocokan antara indicator dengan butir-butir instrument.700 yang berarti memenuhi persyaratan untuk dapat dilanjutkan. 29 2.8 3 0 2 8 0. Untuk melihat tingginya . 14.13. 2. 20. 5. 4. Formula Gregory (2000) adalah sebagai berikut : Content Validity (CV) = Dimana. 8. 25. 5. A = Jumlah item yang kurang relevan menurut kedua panelis B= Jumlah item yang kurang relevan menurut Panelis I dan relevan menurut Panelis II C= Jumlah item relevan menurut Panelis I dan yang kurang relevan menurut Panelis II D= Jumlah item yang relevan menurut kedua Panelis Kriteria yang digunakan adalah jika CV > 0. 15.10. 27.22. 12.7419. 6.2 0 1 9 0. 32. 7. Namun memperhatikan angka 0. Contoh penggunaan formula Gregorry. 4. 13. 25. 19. 31. seperti yang disyaratkan Gregory. 31.7419 yang hanya sedikit lebih tinggi dari 0. 28. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan.22.9. 24. 17.30. 27. 23. 21. 2.700 maka analisis dapat dilanjutkan.11. 8. 15.

Validitas Konkuren Apabila skor tes dan skor kriteria dapat diperoleh dalam waktu yang bersamaan. 3. Pengumpulan bukti validitas . Validitas Prediktif Validitas prediktif sangat penting artinya bila tes dimaksudkan berfungsi sebagai prediktor bagi performansi di waktu yang akan datang. Dalam hal ini skor tes masuk disebut sebagai skor tes (X) dan nilai siswa pada ulangan semester sebagai skor kriteria (Y).validitas berdasar kriteria dilakukan komputasi korelasi product moment antara skor tes (X) dengan skor kriteria (Y). maka korelasi antara keduanya disebut sebagai validitas konkuren. yaitu yang menjadi dasar penyusunan instrument ( Djemari. validitas tes (rxy) selanjutnya disebut r hitung. a. maka hasil uji tes buatan guru sebagai skor tes (X) dan skor dari hasil uji tes yang telah baku sebagai skor kriteria (Y). Dalam menguji validitas perangkat tes buatan guru. b. Koefisien korelasi product moment dari keduanya menghasilkan validitas konkuren. Validitas Konstruk Validitas konstruk mengacu pada sejauhmana suatu tes mengukur konsep dari suatu teori. Kemudian hasil perhitungan dapat dionsultasikan dengan tabel r product moment. yaitu validitas prediktif (predictive validity) dan validitas konkuren ( concurrent validity ). validitas tes (rxy) selanjutnya disebut r hitung. Kemudian hasil perhitungan dapat dikonsultasikan dengan tabel r product moment. Item dikatakan valid bila harga r hitung ≥ r tabel. Formula korelasi product moment adalah : rxy = Keterangan rumus: rxy : koefisien validitas X : skor butir item nomor tertentu Y : skor total N : jumlah subyek Taraf signifikansi yang dipakai adalah 5%. Misalnya perangkat tes masuk dikatakan punya validitas prediktif yang baik bila mampu meramalkan kemampuan calon siswanya. Ada dua jenis validitas berdasar kriteria. 2008). Formula korelasi product moment adalah : rxy = Keterangan rumus: rxy : koefisien validitas X : skor butir item nomor tertentu Y : skor total N : jumlah subyek Taraf signifikansi yang dipakai adalah 5%. Item dikatakan valid bila harga r hitung ≥ r tabel.

Setelah selesai dijawab oleh subyek barulah item pada masing-masing tes kembali dipisahkan sehingga diperoleh dua distribusi skor. kestabilan maupun konsistensi. Kelebihan dari metode ini terletak pada lebih mudah pada penyusunan soal karena hanya menyusun seperangkat saja. Pendekatan Tes Ulang Dalam pendekatan ini penyajian instrumen diberikan sebanyak dua kali dengan tenggang waktu tertentu. berarti hanya akan ada satu distribusi .konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait/variable/sifat yang diukur. RELIABILITAS INSTRUMEN Reliabilitas merupakan penerjemahan dari rely dan ability. Selanjutnya 2 distribusi skor ini ditentukan reliabilitasnya melalui formula korelasi product moment. Ide pokok dari reliabilitas adalah sejauh mana hasil dari suatu pengukuran dapat dipercaya. Kelebihan dari metode tes paralel ini adalah siswa hanya mengerjakan sekali. c. Istilah reliabilitas sering diartikan sebagai keterpercayaan. Penentuan reliabilitas instrumen dapat dilakukan dengan tiga cara : a. selama aspek yang diukur dalam diri subyek memang belum berubah. Bila perbedaan sangat besar dari waktu ke waktu maka hasil pengukuran tidak dapat dipercaya dan dikatakan tidak reliabel. Dengan pendekatan konsistensi internal ini penyusun soal hanya cukup membuat seperangkat soal saja dan diujikan kepada kelompok subyek satu kali. Dalam pelaksanaannya. E. kemungkinan siswa akan menjadi jenuh sehingga hasil yang didapatkan pada tes ke dua besar kemungkinan hanya apa yang diingat dari tes pertama. Namun penyusun soal mengalami kesulitan karena menyusun dua perangkat soal yang paralel adalah sebuah kesulitan tersendiri. sehingga mengurangi kejenuhan siswa. kepada sekelompok subyek. Selanjutnya dua distribusi skor ini ditentukan reliabilitasnya dengan menghitung koefisien korelasi antar keduanya dengan menggunakan korelasi product moment. kedua tes paralel dapat digabungkan terlebih dahulu sehingga seakan-akan merupakan satu bentuk tes. Dalam hal ini relatif sama berarti tetap adanya toleransi terhadap perbedaan-perbedaan kecil di antara hasil beberapa kali pengukuran. b. Dengan hanya satu kali dikenakan pada kelompok subyek. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama diperoleh hasil yang relatif sama. keterandalan. Penentuan validitas konstruk dapat dilakukan dengan multitrait multi factor dan factor analysis. Apabila suatu instrumen telah diberikan sebanyak dua kali kepada kelompok subyek maka akan didapatkan dua distribusi skor. Konsistensi Internal Kelemahan-kelemahan yang ada pada pendekatan tes ulang maupun tes paralel dapat diatasi pendekatan konsistensi internal. Namun demikian karena siswa harus mengerjakan 2 kali soal yang sama. keajegan. Pendekatan Tes Paralel Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan sekaligus dua bentuk tes yang paralel satu sama lain.

Formula : rxy = (ini baru ½ tes) rii = (reliabilitas tes keseluruhan) 2). Cara apapun yang dipilih diharapkan akan memberikan belahan yang setara atau homogen. Pembelahan terhadap perangkat soal dapat menggunakan cara random ataupun cara gasal genap. Formula Alpha Pembelahan item tes tidak hanya terbatas dengan pembelahan menjadi 2 belahan saja. Formula : rxy = dimana : rxy : koefisien reliabilitas d : perbedaan skor kedua belahan ( skor belahan 1 – belahan 2 ) Sd2 : varians perbedaan skor kedua belahan Sx2 : varians skor total 3). Untuk tes yang dibelah menjadi lebih dari 2 belahan dapat digunakan formula Alpha sebagai berikut : Formula : α = Dimana : α : koefisien reliabilitas k : banyaknya belahan tes Sj2 : varians belahan j Sx2 : varians skor total Formula α digunakan juga pada data yang bersifat politomus. dibuktikan dengan koefisien korelasi tinggi antar kedua belahan. Oleh karena itu prosedur analisis reliabilitasnya diarahkan pada kelompok-kelompok butir soal atau terhadap butir-butir soal sehingga perlu diberlakukan pembelahan terhadap perangkat soal.skor. maka dapat dipilih formula Rulon. Pembelahan tes bisa dilakukan menjadi beberapa belahan apabila diperlukan. Formula KR-20 Formula ini digunakan untuk jumlah soal yang tidak terlalu banyak Formula : KR-20 = Di mana : KR-20 : koefisien korelasi k : banyaknya item dalam tes . dengan anggapan bahwa sumber kesalahan ( varians error ) adalah terletak pada perbedaan perbedaan skor kedua belahan. Penentuan reliabilitas dapat menggunakan rumus-rumus sebagai berikut : 1). Formula Rulon Apabila homogenitas kedua belahan tes diragukan. 4). Formula Spearman-Brown Formula Spearman-Brown ini dapat digunakan dengan persyaratan kedua belahan paralel.

Sehingga diformulasikan : P= Dimana : P : indeks kesukaran B : banyaknya peserta yang menjawab benar JS : jumlah seluruh peserta Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk menentukan daya pembeda butir.0.0 – 1.0.80) distribusinya berbentuk negatif skewed. Indeks kesukaran : 0.25) distribusinya berbentuk positif skewed.p : proporsi peserta yang menjawab benar q : proporsi peserta yang menjawab salah (q=1-p) Sx2 : varians skor total F.31 – 0.0 soal mudah Indeks kesukaran (P) merupakan proporsi penjawab benar pada sebuah soal.2 kurang dapat membedakan 0. digunakan formula point biserial. sedangkan tes yang mudah dengan TK= >0.0 dapat membedakan dengan baik sekali G.7 dapat membedakan dengan baik 0. Tingkat kesukaran yang diukur .1.3 soal sukar 0.0. Besaran tingkat kesukaran antara 0.4 cukup dapat membedakan 0.21 .0 .7 soal sedang 0. Formula rumus korelasi point biserial adalah : rxy = dimana : rxy : koefisien korelasi Mp : rerata skor total dari sejumlah subyek yang menjawab benar pada item yang ditentukan validitasnya Mt : rerata skor total seluruh peserta pada seluruh soal St : standar deviasi dari skor total p : proporsi peserta yang menjawab benar q : proporsi peserta yang menjawab salah (q=1-p) Kriteria daya pembeda butir : 0.41 .0.71 – 1. TINGKAT KESUKARAN Soal yang baik adalah soal yang tidak terlalu sukar dan tidak terlalu mudah.71 . DAYA PEMBEDA Daya beda butir merupakan kemampuan sebuah soal untuk membedakan antara siswa berkemampuan tinggi dengan siswa berkemampuan rendah.0 – 0. Untuk tes yang sangat sukar (TK= < 0.

Columbus.dengan menggunakan rumus di atas juga memiliki kelemahan karena sangat ditentukan oleh sampel. New Jersey. 5th Edition. maka soal akan sangat mudah (TK= >0. Grondlund. (2005). (2007). R. Linn.D.New Jersey Shultz.E. J. Prentice Hall. R. Measurement theory in action: Case studies and exercises. R. principles.. . Jika sampel berkemampuan tinggi.Inc.L & Frisbie. (2005).90). & N.A (1986).Englewood Cliffs. Thorndike.L.Pearson Education Upper Saddle River. Psychological testing: History. Mitra Cendikia Press : Yogyakarta Ebel. Inc. DAFTAR BACAAN Djemari Mardapi (2008). Essentials of Educational Measurement. Measurement and Assessment in Teaching. Jika sampel berkemampuan rendah. New Jersey Gregory. Teknik Penyusunan Instrumen Tes dan Non Tes. & Whitney. Eight edition. Ohio. Prentice Hall. Measurement and Evaluation in Psychology and Education. J. Seventh edition. S. (2000). California: Sage Publications.M. K. D. maka soal akan sangat sulit (TK = < 0.Inc. and applications. Thousand Oaks. Fourth edition.40). Boston. MA: Allyn & Bacon. Upper Saddle River. R.

Sign up to vote on this title
UsefulNot useful