RELIABILITAS DAN VALIDITAS 1. RELIABILITAS 1.1 Definisi Reliabilitas Reliabilitas menyangkut ketepatan alat ukur.

Pengertian reliabilitas dapat lebih mudah dipikirkan jika pertanyaan berikut dijawab : 1) Jika set objek yang sama diukur berkali-kali dengan alat ukur yang sama, apakah kita akan memperoleh hasil yang sama? 2) Apakah alat ukur yang diperoleh dengan menggunakan alat ukut tertentu adalah alat ukur yang sebenarnya dari objek tersebut? 3) Berapa besar error yang kita peroleh dengan menggunakan ukuran tersebut terhadap objek? Jawaban terhadap pertanyaan tersebut tidak lain dari 3 aspek pengertian tentang reliabilitas. Suatu alat ukur disebut mempunyai reliabilitas tinggi atau dapat dipercaya jika alat ukur itu mantap, dalam pengertian bahwa alat ukur tersebut stabil, dapat diandalkan (dependability) dan dapat diramalkan (predictability).Suatu alat ukur yang mantap tidak berubah-ubah pengukurannya dan dapat diandalkan karena penggunaan alat ukur tersebut berkali-kali akan memberikan hasil yang serupa. Pertanyaan kedua member aspek akurasi. Suatu pertanyaan atau ukuran yang akurat adalah ukuran yang cocok dengan yang ingin diukur. Jika kedua aspek di atas, yaitu aspek stabilitas dan aspek akurasi digabungkan, maka dapat disimpulkan bahwa alat ukur tersebut mantap dan dapat mengukur secara cermat dan tepat. Suatu alat ukur juga harus sedemikian rupa sifatnya sehingga error yang terjadi, yaitu error pengukuran yang random sifatnya, dapat ditolerir. Dari aspek-aspek reliabilitas di atas, dapat disimpulkan bahwa reliabilitas adalah ketepatan atau tingkat presisi suatu ukuran atau alat pengukur.

1.2 Teori Reliabilitas Untuk melihat relibilitas suatu alat atau instrumen, kita harus memiliki suatu alat yang standar. Ukuran yang diperoleh dengan menggunakan alat standar ini dinamakan ukuran yang sebenarnya atau skor yang sebenarnya. Skor yang diperoleh dengan menggunakan alat yang kita pakai, dinamakan skor yang diperoleh. Selisih angka antara

3 Menguji Indeks Reliabilitas Reliabilitas alat penelitian dapat diuji / dinilai dengan menggunakan beberapa teknik. Jika kita nyatakan : Ys Yp Ye = = = skor yang sebenarnya skor yang diperoleh error pengukuran Maka suatu identity dapat dibangun. kita sebut error ukuran. Dalam bentuk variance. Untuk mencari derajat reliabilitas. maka digunakan koefisien reliabilitas (r) yang memiliki 2 arti. Reliabilitas adalah perbandingan antara variance sebenarnya dengan variance yang diperoleh. yaitu : a). reliabilitas dinyatakan dalan bentuk variance. yaitu : b). Makin besar error yang terjadi. identiti di atas dapat ditulis sebagai : Vp Vs Ve = = = variance yang diperoleh variance sebenarnya variance error Reliabilitas dapat dilihat dari error yang dibuat. Caranya adalah dengan mengulang . dan begitu pula sebaliknya. maka makin kecil reliabilitas pengukuran.skor yang sebenarnya dengan skor yang kita peroleh. yaitu : 1. antara lain : 1) Teknik kesesuaian Menilai reliabilitas dengan teknik kesesuaian adlah dengan cara mencari indeks kesesuaian kasar (crude index of agreement). Reliabilitas adalah perbandingan antara selisih variance diperoleh dengan variance error dan variance sebenarnya. yaitu : Yp = Ys + Ye Besarnya error (galat) pengukuran adalah : Dalam praktik.

observasi dibagi menjadi dua bagian.penelitian dengan menggunakan alat yang sama. dan dalam waktu yang tidak lama. lalu menganalisis stabilitas dari jawaban. yang mempunyai hubungan satu sama lain. responden yang sama. atau Satu peneliti menggunakan dua alat ukur yang berbeda dalam pengertian bahwa alat-alat ukur tersebut memang diperuntukkan bagi pengukuran variabel yang bersangkutan Langkah pertama dalam mencari reliabilitas adalah dengan mencari korelasi antara kedua hasil ukuran tersebut. Teknik ini bertujuan untuk menguji reliabilitas pertanyaan-pertanyaan atau pernyataan-pernyataan berbentuk skala. dengan cara mencari koefisien korelasi Spearmam. dicari dengan menggunakan rumus : 3) Teknik belah dua (split half) Teknik ini hampir sama dengan teknik paralel. hanya saja pada teknik split half. Kerja memisahkan pengukuran atas dua bagian yang paralel dapat dilakukan dengan 2 cara. yaitu : Dua peneliti menggunakan alat ukur yang sama. 2) Teknik paralel Teknik ini hampir serupa prosedurnya dengan teknik penyesuaian. Hasil penelitian pertama kemudian digabungkan dengan hasil penelitian kedua. variabel diukur 2 kali pada waktu yang sama atau hampir bersamaan. Penilaian reliabilitas ini bertujuan untuk mengukur internal konsistensi pertanyaan atau pernyataan. koefisien reliabilitas dapat dicari dengan menggunakan rumus : dimana : V = koefisien korelasi Spearman r = koefisien reliabilitas Sedangkan koefisien korelasi Spearman. Dari angka korelasi Spearman tersebut. hanya saja dalam tenik paralel. Rumus reliabilitas yang dikemukakan oleh Kuder dan Richardson (1937) : .

§ Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktorfaktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya. face validity.dimana : k p q s 2 = jumlah item yang diuji = proporsi respon yang benar = proporsi respon yang salah = 1 . stabil. § Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur. VALIDITAS Reliabilitas alat ukur menunjukkan pada kita tentang sifat suatu alat ukur dalam pengertian apakah suatu alat ukur cukup akurat. dan curricular validity. intrinsic validity. . Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran. predictive validity. construct validity. Istilah validitas ternyata memiliki keragaman kategori. § Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria.p = variance dari skor M = mean dari skor 2. dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor. Ebel (dalam Nazir 1988) membagi validitas menjadi concurrent validity. content validity. factorial validity. empirical validity. Di lain pihak. § Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja. atau konsisten dalam mengukur apa yang ingin kita ukur. validitas mempersoalkan apakah kita benar-bnar mengukur apa yang kita pikirkan sedang kita ukur. § Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan kinerja yang baik dalam pengukuran.

Berdasarkan definisi-definisi validitas di atas. dan validitas konstrak. subsansinya) cukup representative untuk sebuah sampling. § Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional. § Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi. Thorndike dan Hagen membagi validitas atas dua jenis saja.§ Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur. yaitu validitas isi.1 Validitas Isi Validitas isi mempersoalkan apakah isi dari suatu alat ukur (bahannya. Pertanyaan tersebut mempersoalkan masalah validitas isi dari alat ukur (soal ujian) yang digunakan untuk . terlihat bahwa terdapat tumpang tindih antara yang satu dengan lainnya. topiknya. Kerlinger membagi validitas menjadi tiga jenis. dan kemudian dipertimbangkan tentang representative tidaknya isi yang akan diuji. Soal tersebut perlu dipertanyakan apakah soal yang dibuat telah mencakup keseluruhan isi pelajaran sesuai dengan course outline. Validitas isi dipandu oleh pertanyaan : ³Apakah isi atau substansi dari alat ukur ini merupakan representative dari sifat-sifat universal yang ingin diukur?´ Definis dasar dari validaitas isi adalah suatu pendapat. Dosen tersebut membuat soal dalam bentuk objektif dan essai. baik pendapat pribadi maupun pendapat orang lain. 2. Materi yang diberikan selama setengah semester telah ditentukan dalam course outline. validitas yang berhubungan dengan kriteria. Validitas langsung adalah validitas yang berdasarkan pada analisis rasional dan putusan profesi (professional judgment). Tiap-tiap item dalam uji perlu dipelajari secara seksama. Contoh dari validitas isi adalah : seorang dosen memberikan ujian tengah semester pada Fakultas Pertanian.Oleh karena itu. sedangkan validaitas derivatif bergantung pada pembuktian statistic dan empiris. § Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang. yaitu validitas langsung dan validitas derivatif.

Dalam melihat validitas konstrak. Dilihat dari segi waktu untuk memperoleh skor kriterianya. di samping menggunakan penilaian sendiri yang disesuaikan dengan course outline dari mata pelajaran yang bersangkutan.3 Validitas Konstrak Konstrak adalah suatu abstraksasi dan generalisasi khusus dan merupakan suatu konsep yang diciptakan khusus untuk kebutuhan ilmiah dan mempunyai pengertian terbatas. Kita lihat bahwa dalam menentukan validitas isi alat ukur. yang perlu sekali mendapat perhatian adalah : 1) Apakah alat ukur (soal ujian) telah mewakili semua mata pelajaran yang diberikan? 2) Apakah pokok-pokok yang dicantumkan dalam alat ukur (soal) sesuai dengan mata pelajaran yang telah diajarkan? Biasanya dosen mendiskusikan soal dengan dosen lainnya untuk melihat validitas isi tersebut. 2. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor alat ukur. . 2.Bukti empiris yang memperlihatkan ada tidaknya keterkaitan antara komponen atau dimensi di atas .Komponen-komponen atau dimensi-dimensi yang membentuk konsep tersebut .Landasan teori yang merangkum dimensi tersebut . dimana x melambangkan skor alat ukur dan y melambangkan skor kriteria. yaitu rxy.mengukur prestasi mahasiswa dalam jarak waktu setengah semester. prosedur validasi berdasar kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan validitas konkuren (concurrent validity).2 Validitas yang berhubungan dengan kriteria Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Konstrak tersebut diberi definisi sehingga dapat diamati dan diukur. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur yang bersangkutan. beberapa pertanyaan di bawah ini perlu dijawab.

Arti lainnya dari validitas muka adalah validitas muka berhubungan dengan penilaian para ahli terhadap suatu alt ukur. persepsi. Hal tersebut dibutuhkan untuk mengetahui sifat-sifat apakah yang dapat menerangkan variance dari alat ukur tersebut. 2. serta alat ukur yang digunakan untuk mengukur konstrak tersebut. xi = jumlah kuadrat deviasi skor dari Xi . peneliti melihat isi dan makna dari komponen-komponen tersebut. misalnya : seseorang peneliti ingin menyusun skala tentang persepsi. status ekonomi. Contoh Uji Validitas dan Uji Reliabilitas Contoh perhitungan korelasi butir untuk soal bentuk uraian dengan skor butir kontinum. pendidikan tradisional. Untuk mengetahui kemahiran mengetik seseorang. validitas muka berhubungan dengan pengukuran atribut yang konkrit tanpa memerlukan referensi. dsb) adalah menganalisis unsure-unsur apa yang menjadi bagian dari konstrak tersebut. Skala tersebut diperlihatkan kepada beberapa ahli. maka suruhlah ia mengetik dan hitung jumlah huruf / kalimat yang dapat diselesaikan per menit. Uji Validitas : Jika skor butir instrumen atau soal tes kontinum (misalnya skala sikap atau soal bentuk uraian dengan skor butir 1-5 atau skor soal 0-10) dan diberi simbol Xi dan skor total instrumen atau tes diberi simbol Xt.4 Validitas Muka Ada 2 pengertian validitas muka. maka skala tersebut mempunyai validitas muka yang tinggi.Hal pertama yang dikerjakan oleh seorang peneliti dalam membahas validitas konstrak (seperti : inteligensia. Jika ahli-ahli itu berpendapat bahwa unsure-unsur dalam skala tersebut dapat mengukur persepsi secara baik. 3. maka jumlah kata yang ditulis per detik sudah merupakan ukuran yang tepat tentang kemahiran steno seseorang. Kemudian. maka rumus yang digunakan untuk menghitung koefesien korelasi antara skor butir instrumen atau soal dengan skor total instrumen atau skor total tes adalah sebagai berikut: Keterangan: rit = koefisien korelasi antara skor butir soal dengan skor total. misalnya : jika ingin mengetahui kemahiran seseorang dalam menulis steno. Pertama. fertilitas.

631. selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus koefesien Alpha.xt = jumlah kuadrat deviasi skor dari Xt Data hasil uji coba adalah sebagai berikut: Nomor Responden 1 2 3 4 5 6 7 8 9 10 Jumlah Penyelesaian: Untuk n=10 dengan alpha sebesar 0. maka semua butir mempunyai korelasi signifikan dengan skor total tes. Karena nilai koefesien korelasi antara skor butir dengan skor total untuk semua butir lebih besar dari 0.631. Uji reliabilitas : Dari soal diatas. Dengan demikian maka semua butir tes dianggap valid atau dapat digunakan untuk mengukur hasil belajar. yaitu: Keterangan: rii = koefisien reliabilitas tes k = cacah butir = varian skor butir = varian skor total Koefisien reliabilitas dari contoh diatas dapat dihitung dengan cara pertama-tama dihitung varian butir sebagai berikut: Nomor Butir Pertanyaan 1 5 5 4 4 5 3 3 3 2 2 2 4 4 4 3 5 3 3 2 2 1 3 3 3 2 3 3 2 2 2 1 1 4 5 4 4 3 4 3 3 3 2 1 5 3 3 3 4 5 2 2 2 1 1 6 5 4 4 3 5 3 2 2 2 1 7 3 3 3 4 4 1 2 2 1 1 Jumlah 28 26 24 24 31 17 17 16 11 8 202 36 31 22 32 26 31 24 .05 didapat nilai table r=0.

24 8.62 Jadi koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0.56 1.97.29 0.44 1.16 1. Contoh Perhitungan Korelasi Butir untuk Soal Bentuk Objektif Uji Validitas : Jika skor butir soal diskontinum (misalnya soal bentuk objektif dengan skor butir soal 0 atau 1) maka kita menggunakan koefesien korelasi biserial dan rumus yang digunakan untuk menghitung koefesien korelasi biserial antara skor butir soal dengan skor total tes adalah: Keterangan: rbis(i) X1 Xt st pi qi = koefesien korelasi beserial antara skor butir soal nomor i dengan skor total = rata-rata skor total responden yang menjawab benar butir soal nomor i = rata-rata skor total semua responden = standar deviasi skor total semua responden = proporsi jawaban yang benar untuk butir soal nomor i = proporsi jawaban yang salah untuk butir soal nomor i Contoh hasil uji coba adalah sebagai berikut: Nomor Butir Pertanyaan Nomor Responden 1 2 3 4 1 1 1 0 1 2 1 1 1 1 3 1 0 1 0 4 1 1 1 0 5 0 1 0 0 6 0 1 0 0 7 0 0 0 0 Jumlah 4 5 3 2 .69 1.24 1.Nomor butir Varian Butir 1 2 3 4 5 6 7 Jumlah 1.

76 0.66 0.107 0 1 1 0 1 1 7 1 1 1 0 1 1 9 0 1 1 0 0 1 5 0 1 1 0 0 1 6 0 1 1 0 1 1 5 0 1 1 0 0 0 3 0 1 0 0 0 0 1 1 7 6 0 3 5 36 Nomor Butir r-butir r-tabel 1 2 3 4 5 6 7 0.63 0.63 0.60 St = 2.57 0.63 Valid Valid Valid Valid 0.63 Status Valid 0.63 Tidak valid Ternyata dari tujuh butir soal tes ada 5 butir yang valid dan dua butir tidak valid. Oleh karena itu perlu dilakukan perhitungan untuk menghitung koefesien antara skor butir dengan skor total baru (5 butir).5 6 7 8 9 10 Jumlah Xt = 3.63 Tidak valid 0.75 0.70 0.63 0.54 0. sebagai berikut: Data hasil uji coba adalah sebagai berikut: Nomor Responden 1 2 3 4 5 6 1 1 1 0 1 0 1 Nomor Butir Pertanyaan 3 1 0 1 0 0 1 4 1 1 1 0 0 1 5 0 1 0 0 0 1 6 0 1 0 0 0 1 3 4 2 1 0 5 Jumlah .81 0.

5 0. Dengan demikian maka semua butir tes (5 butir) dianggap valid atau dapat digunakan untuk mengukur hasil belajar.631. Karena niai koefesien korelasi biserial antara skor butir dengan skor total untuk semua butir lebih besar dari 0.6 0. Uji Reliabilitas : Selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus KR-20.4 0.5 0.5 0.7 8 9 10 Jumlah Xt = 2.631.7 0.21 . sebagai berikut: Keterangan: rii = koefesien reliabilitas tes k = cacah butir piqi = varian skor butir pi = proporsi jawaban yang benar untuk butir nomor i qi = proporsi jawaban yang salah untuk butir nomor i = varian skor total Koefesien reliabitas dari contoh diatas adalah: Pertama-tama dihitung varian butir (piqi) sebagai berikut: Nomor butir 1 3 4 5 6 pi 0.3 qi 0.25 0.3 0.21 0.05 didapat nilai table r = 0.25 0.5 0. maka semua butir mempunyai korelasi biserial yang signifikan dengan skor total tes.6 St = 1.8 1 0 1 1 7 1 0 0 1 5 1 0 0 1 6 1 0 1 1 5 1 0 0 0 3 5 0 2 4 26 Untuk n = 10 dengan alpha sebesar 0.24 0.7 piqi 0.

Jumlah St = 3. .16 Jadi koefesien reliabilitas tes (dengan 5 butir) pada contoh diatas adalah 0.24 1.80.

Reliabilitas. Metode Penelitian Pendidikan. 2008. Menyusun dan Mengevaluasi Laporan Penelitian. Boston: Allyn and Bacon Gronlund. EN. 1983. 2000. 2009. Instrumen. dan Linn. Robert J. Pengukuran Dalam Bidang Pendidikan. 2000. Pendekatan Kuantitatif. Yogyakarta: Gajah Mada University Press. Jakarta: Ghalia Indonesia. 1997. Kerlinger. Nazir Moh. Jakarta: Bumi Aksara. A & Susana Urbina. Jakarta: PT Grasindo. 1990. Azas-Azas Penelitian Behavioral (Alih Bahasa Simatupang dan Koesoemanto). New Jersey: Prentice-Hall Inc. Sugiyono. 2003. New York: Macmillan Publishing Company. Measurement and Evaluation in Teaching. Soetarlinah. Penelitian. 2006.D. Principles and Aplications. Suharsimi. Sixth Edition. 1990. Suharto. Psychological Testing. . Metode Penelitian. Sukadji. Arikunto. Uji Validitas. Djaali&Pudji Muljono. dkk.. Psycological Testing: History. Manajemen Penelitian. Pengantar Statistika. Husaini. Ph. Jakarta: UI-Press. Bandung: Penerbit Alfabeta. Gregory. 1995. Kualitatif dan R&D. Usman.DAFTAR PUSTAKA Anastasia. Jakarta: Rineka Cipta.

Sign up to vote on this title
UsefulNot useful