You are on page 1of 47

Validitas, Reliabilitas dan Analisis Item

Nunik, Debora, Rifqi, Agoes, Aniza, Listya, Tyas, Fiska

VALIDITAS

Validitas
Konsep validitas merujuk pada kualitas instrumen. Instrumen yang valid adalah, instrumen yang benar-benar dapat mengukur atribut psikologis yang dapat diukur. Dapat dikatakan bahwa suatu alat ukur valid, jika memiliki keterkaitan atau relasi dengan atribut yang diukur. Maka, metode pengujian validitas selalu melibatkan prosedur pembuktian ada tidaknya hubungan tersebut.

Metode Pengujian Validitas


Content validity Construct validity Convergen Divergen Concurrent validity Predictive validity

validitas

Criterion validity

Content Validity
Termasuk pada kategori metode kualitatif. Dilakukan dengan cara analisis isi (content analysis) untuk menemukan hubungan antara isi instrumen dengan atribut psikologis yang diukur.

CVR =

(/2) /2

Keterangan: CVR : content validity ratio Ne : banyaknya panelis N : Total panelis

Construct Validity
Proses analisis untuk menemukan hubungan antara instrumen khususnya item dalam instrumen itu dengan konstruk teoritik tentang atribut psikologis yang akan diukur dengan alat ukur tersebut.

Construct validity
Teknik ini bisa digunakan apabila: - Test homogen( hanya mengukur satu construct ) - Skor test naik atau turun sesuai dengan prediksi teoritis (dipengaruhi oleh fungsi usia, waktu, manipulasi ekspresimen, perbedaan kelompok sample) - Skor test berkorelasi dengan test lain yang secara teoritis diprediksi memiliki hubungan

Construct validity
A. Convergent evidence
Hasil pengukuran berkorelasi tinggi dengan alat ukur lain yang mengukur konstruk yang sama (contoh: test kecerdasan A & test kecerdasan IST- hasil data dikotomi / true-false)
- Phi Coefficient = =

Lalu uji signifikansi dengan: 2 = 2

- Untuk typical performance (misal: jenis test kepribadian) Contoh: peneliti mengkonstruksi alat ukur dgn variable kecemasan, dikorelasikan dgn alat ukur STAI (state trait anxiety inventory) - Rumus Pearson product moment

Product Moment
Rumus :

r = pearson r correlation coefficient n = jumlah sample

Construct validity
B. Divergent evidence
Alat ukur dianggap valid jika alat ukur itu memiliki korelasi yg rendah dengan hasil pengukuran konstruk yg tidak berkaitan - Jika hasil datanya dikotomi Phi Coefficient = = Lalu uji signifikansi dengan: 2 = 2
(ketika tidak signifikan= test valid)

Criterion Validity
Dilakukan dengan melihat hubungan antara tes dengan suatu kriteria. Kriteria pertama yang digunakan berupa perfomance yang menunjukkan keberhasilan perilaku berkenaan dengan atribut psikologis yang diukur oleh tes yang divalidasi. Kriteria kedua yang digunakan berupa tes lain yang mengukur atribut yang sama dengan tes yang divalidasi.

Criterion Validity
Concurrent Validity Korelasi antara test skor dengan current criterion measure. Misal: alat ukur learning disability dengan skor SAT; motivasi kerja dengan perilaku penjualan Dari contoh diatas jenis data antara alat ukur 1 dan alat ukur 2 ialah interval. Jadi, menggunakan pearson product moment.

Criterion Validity
Predictive validity Menunjukkan sejauh mana skor tes bersangkutan dapat digunakan meramal keberhasilan siswa di masa mendatang dalam bidang tertentu. Hasil skor tes di korelasikan dengan keberhasilan siswa di masa mendatang. Contoh : misalnya nilai UAN Matematika 98 dibandingkan dengan nilai matematika di perguruan tinggi. (keduanya rasio)

= + y = skor kriteria prediktif x = nilai yang akan di prediksi b = slope dari garis regresi = () a = intercept dari garis regresi =

VALIDITAS EKSTERNAL
Dilakukan dengan membandingkan (untukmencar i persamaan) antara kriteria yang ada pada instrumen dengan fakta-fakta empiris yang terjadi lapangan. Instrumen penelitian yang mempunyai validitas eksternal yang tinggi akan mengakibatkan hasil penelitian mempunyai validitas eksternal ya ng tinggi pula. Untuk meningkatkan validitas eksternal instrument, maka dapat dilakukan dengan memperbesar jumlah anggota sampel.

RELIABILITAS

Reliabilitas
Konsistensi skor yang dapat dicapai individu yang sama dalam atribut psikologi yang sama, walaupun diukur dalam waktu yang berbeda ataukah menggunakan instrumen yang berbeda. Lebih luas lagi reliabilitas menunjukkan perbedaan individual pada atribut yang diukur bukannya disebabkan oleh faktor instrumen yang buruk atau situasi tes yang tidak kondusif.

Metode Pengujian Reliabilitas

Statistik
Derajat reliabilitas ditunjukkan dengan koefisien krelasi yang dihitung dengan menggunakan teknik statistik berupa teknik korelasi. Ada syarat yang harus dipenuhi dalam menggunakan teknik korelasi tertentu, misalnya jika menggunakan korelasi product moment data tes harus berskala interval atau jika data berskala ordinal maka digunakan teknik rank spearman, jika data berskala nominal menggunakan chi square.

Metode Test - Retest


Estimasi derajat reliabilitas dilakukan dengan cara melakukan pengukuran 2x dengan test yang sama kepada subjek yang sama pada waktu yang berbeda. Kelebihan : hanya memerlukan satu jenis instrumen. Kelemahan : menimbulkan kelelahan pada subjek dan ada faktor belajar yang dapat mempengaruhi hasil test.

Alat ukur yang sama digunakan kembali pada subjek yang sama, jadi jenis datanya akan sama. Contoh 1: alat ukur yang mengukur trait anxiety dengan skala jenis data = interval X = pengukuran pertama, Y = pengukuran kedua

Pearsons Product Moment

Rumus :

r = pearson r correlation coefficient n = jumlah sample

Single Administration Method


Dilaksanakan melalui proses pengukuran hanya satu kali. Teknik uji reliabilitas yang digunakan:
split-half correlation + Spearman-Brown correction Kuder-Richardson 20/21
Digunakan datanya dichotomous

Alpha cronbach

Rumus Spearman Brown

ri = reliabilitas instrumen rb = indeks korelasi antara dua belahan instrumen

Rumus Kuder Richardson 20


r tt= Koefisien korelasi dengan KR20 k = jumlah butir soal p = proporsi jawaban benar pada butir tertentu q = proporsi jawaban salah pada butir tertentu ( q = 1 p ) s2= varians skor total

Rumus Richardson 21

Rumus Alpha Cronbach

= Koefisien Cronbach's Alpha b = banyaknya pertanyaan dalam butir Si2 = varians butir St2 = varians total

Parallel Form Methods


Pengujian reliabilitas ini menuntut cara tersedianya dua bentuk instrumen yang paralel dalam mengukur satu atribut yang psikologis. Menurut Gulliksen hal ini merupakan metode terbaik dalam pengujian reliabilitas karena peluang memperoleh true score yang mendekati observe score akan lebih besar dengan menggunakan 2 instrumen.

Product Moment
Rumus :

r = pearson r correlation coefficient n = jumlah sample

ANALISIS ITEM

Analisis Item
Item dalam suatu instrumen dalah isi dari instrumen itu sendiri. Item merupakan stimulus untuk merangsang munculnya respon sehingga perilaku subjek ukur akan dapat diidentifikasi melalui ikatan antara stumulul dengan respon. Analisis item adalah analisis terhadap item untuk memperoleh informasi tentang kualitas item. Dua cara analisis item, yaitu secara kualitatif dan secara kuantitatif.

Analisis Item Kualitatif


Pemeriksaan atau analisis melalui menelaah apakah item telah memenuhi syarat sebagai item yang baik. Analisis ini dilakukan terhadap item dari tes yang mengukur atribut psikologis yang termasuk kategori personality. Karakteristik item yang berkualitas baik adalah, pertama item dipersepsikan sama oleh semua orang yang membaca kedua adalah item tidak mengandung social desirability. Dua cara analisis item kualitatif : diskusi dengan para ahli dan mengumpulkan sejumlah sampel subjek yang akan menjadi sasaran ukur.

Analisis Item Kuantitatif


Penggunaan prosedur statistik terhadap jawaban subjek atas item untuk memeriksa kemampuan item dalam hal membedaka individu, mengukur taraf kesulitan item dalam hal membedakan individu, mengukur taraf kesulitan item dan memeriksa kualitas distraktor dari item.

Analisis Tingkat Kesulitan Item


Setiap respon subjek terhadap item menggambarkan ikatan langsung dengan item sebagai stimulus dari perilaku atau atribut perilaku yang diukur oleh item tersebut. Analisis tingkat kesulitan item hanya dilakukan terhadap item yang digunakan untuk mengukur atribut ability. Biasanya digunakan dalam achiement tes dan aptitude test. Tingkat atau derajat kesulitan suatu item disebut sebagai facility index yang ditunjukkan dengan simbol p.

p = tingkat kesulitan item N = jumlah individu yang mengikuti tes

Analisis Distraktor
Distraktor adalah pilihan jawaban salah yang terdapat pada item multiple choice dari instrumen yang mengukur atribut ability. Item yang baik adalah yang memberi peluang pada setiap distraktor untuk dipilih oleh subjek dalam proporsi yang sama. Karakteristik item yang baik ditinjau dari distraktornya adalah yang memiliki peluang yang sama, dengan dasar pemikiran bahwa responden memahami persoalan yang ditanyakan akan memilih jawaban yang benar.

Rumus

Di = proporsi distraktor ke i n = jumlah responden yang pilih distraktor i N = jumlah responden yang jawab salah

Analisis Diskriminasi
Analisis diskriminasi cocok digunakan untuk hampir keseluruhan tipe tes. Daya diskriminasi menunjukkan kemampuan item dalam membedakan subjek atau responden yang memang memiliki perbedaan. Daya pembeda ini akan menunjukkan kemampuan item untuk membedakan mana responden yang kuat motivasinya, mana yang lemah (jika atribut yang digunakan adalah motivasi). Kemampuan item dalam membedakan subjek mana yang cerdas dan mana yang kurang, direpresentasikan oleh daya pembeda ini, jika atribut yang diukur adalah kecerdasan.

Atas dasar hasil analisis item, maka hasilnya dapat digunakan untuk : 1. Mempertahankan item yang berkualitas 2. Merevisi item yang kurang baik 3. Menggugurkan item dan atau menggantinya dengan item lain. 2 pendekatan yang digunakan untuk pengukuran dalam diskriminasi item : Item-discrimination index Item-total correlation

Item discrimination index


Perhitungan dalam item discrimination index memiliki persyaratan dimana item-item yang diukur bersifat dichotomus, seperti benar/salah. Selain itu juga digunakan dalam perhitungan ablity test menggunakan jawaban singkat dan essay hanya jika jawabannya dinilai ulang menjadi benar atau salah.

The discrimination index (D) dengan cara membandingkan performance dari 2 kelompok yang di tes. Rumus : = D : Item discrimination index for a given test item =
=

Item-Total Correlation
Dapat dijadikan sebagai indikasi untuk melihat kemamouan setiap item dalam memprediksi keseluruhan skor tes. Fokus dari item-total korelasi ini melihat apa yang diukur dari setiap item itu. Jika tes dan item mempunyai atribut yang sama, performance dari setiap item seharusnya di korelasikan dengan skor total dari tes.

Rumus

X = nilai-nilai dalam item yang akan dianalisis Y = total nilai dalam tes X = rata-rata untuk skor item yang dianalisis Y = rata-rata dari total skor dalam tes x = standar deviasi dari nilai-nilai dalam item yang dianalisis y = standar deviasi dari total skor dalam tes

Item total corelation ini digunakan jika datanya adalah dichotomus (alternatives choices, objective personality atau interest items) Korelasi yang digunakan adalah point biserial correlation.

Rumus untuk point-biserial correlation

Derajat Korelasi
Guildford (1965)
KOEFISIEN <0.20 0.20 0.40 0.41 0.70 0.71 1.00 DERAJAT KORELASI Tidak ada korelasi Korelasi rendah Korelasi tinggi Korelasi tinggi sekali

You might also like