Validitas, Reliabilitas dan Analisis Item

Nunik, Debora, Rifqi, Agoes, Aniza, Listya, Tyas, Fiska

VALIDITAS

Validitas
• Konsep validitas merujuk pada kualitas instrumen. • Instrumen yang valid adalah, instrumen yang benar-benar dapat mengukur atribut psikologis yang dapat diukur. • Dapat dikatakan bahwa suatu alat ukur valid, jika memiliki keterkaitan atau relasi dengan atribut yang diukur. Maka, metode pengujian validitas selalu melibatkan prosedur pembuktian ada tidaknya hubungan tersebut.

Metode Pengujian Validitas
Content validity Construct validity Convergen Divergen Concurrent validity Predictive validity

validitas

Criterion validity

Content Validity • Termasuk pada kategori metode kualitatif. . • Dilakukan dengan cara analisis isi (content analysis) untuk menemukan hubungan antara isi instrumen dengan atribut psikologis yang diukur.

CVR = 𝑛𝑒 −(𝑁/2) 𝑁/2 Keterangan: • CVR : content validity ratio • Ne : banyaknya panelis • N : Total panelis .

Construct Validity • Proses analisis untuk menemukan hubungan antara instrumen khususnya item dalam instrumen itu dengan konstruk teoritik tentang atribut psikologis yang akan diukur dengan alat ukur tersebut. .

Test homogen( hanya mengukur satu construct ) .Skor test berkorelasi dengan test lain yang secara teoritis diprediksi memiliki hubungan . manipulasi ekspresimen.Construct validity Teknik ini bisa digunakan apabila: . waktu.Skor test naik atau turun sesuai dengan prediksi teoritis (dipengaruhi oleh fungsi usia. perbedaan kelompok sample) .

Phi Coefficient 𝐶𝑂𝑉 𝑥𝑦 ∅ = 𝑟 = 𝑆𝑥𝑆𝑌 Lalu uji signifikansi dengan: 2 = 𝑁 ∅2 .hasil data dikotomi / true-false) . Convergent evidence – Hasil pengukuran berkorelasi tinggi dengan alat ukur lain yang mengukur konstruk yang sama (contoh: test kecerdasan A & test kecerdasan IST.Construct validity A.

Rumus Pearson product moment ..Untuk typical performance (misal: jenis test kepribadian) Contoh: peneliti mengkonstruksi alat ukur dgn variable kecemasan. dikorelasikan dgn alat ukur STAI (state trait anxiety inventory) .

Product Moment • Rumus : • r = pearson r correlation coefficient • n = jumlah sample .

Construct validity B.Jika hasil datanya dikotomi Phi Coefficient 𝐶𝑂𝑉 𝑥𝑦 ∅ = 𝑟 = 𝑆𝑥𝑆𝑌 Lalu uji signifikansi dengan: 2 = 𝑁 ∅2 (ketika tidak signifikan= test valid) . Divergent evidence – Alat ukur dianggap valid jika alat ukur itu memiliki korelasi yg rendah dengan hasil pengukuran konstruk yg tidak berkaitan .

• Kriteria kedua yang digunakan berupa tes lain yang mengukur atribut yang sama dengan tes yang divalidasi.Criterion Validity • Dilakukan dengan melihat hubungan antara tes dengan suatu kriteria. • Kriteria pertama yang digunakan berupa perfomance yang menunjukkan keberhasilan perilaku berkenaan dengan atribut psikologis yang diukur oleh tes yang divalidasi. .

.Criterion Validity • Concurrent Validity Korelasi antara test skor dengan current criterion measure. motivasi kerja dengan perilaku penjualan Dari contoh diatas jenis data antara alat ukur 1 dan alat ukur 2 ialah interval. Jadi. Misal: alat ukur learning disability dengan skor SAT. menggunakan pearson product moment.

(keduanya rasio) . • Contoh : misalnya nilai UAN Matematika 98 dibandingkan dengan nilai matematika di perguruan tinggi. • Hasil skor tes di korelasikan dengan keberhasilan siswa di masa mendatang.Criterion Validity • Predictive validity • Menunjukkan sejauh mana skor tes bersangkutan dapat digunakan meramal keberhasilan siswa di masa mendatang dalam bidang tertentu.

• 𝑦 ′ = 𝑎 + 𝑏𝑋 y’ = skor kriteria prediktif x = nilai yang akan di prediksi b = slope dari garis regresi 𝑏 = (𝑟)𝜎𝑦 𝜎𝑥 a = intercept dari garis regresi 𝑎 = 𝑌 − 𝑏 𝑋 .

.VALIDITAS EKSTERNAL • Dilakukan dengan membandingkan (untukmencar i persamaan) antara kriteria yang ada pada instrumen dengan fakta-fakta empiris yang terjadi lapangan. maka dapat dilakukan dengan memperbesar jumlah anggota sampel. Untuk meningkatkan validitas eksternal instrument. • Instrumen penelitian yang mempunyai validitas eksternal yang tinggi akan mengakibatkan hasil penelitian mempunyai validitas eksternal ya ng tinggi pula.

RELIABILITAS .

• Lebih luas lagi reliabilitas menunjukkan perbedaan individual pada atribut yang diukur bukannya disebabkan oleh faktor instrumen yang buruk atau situasi tes yang tidak kondusif.Reliabilitas • Konsistensi skor yang dapat dicapai individu yang sama dalam atribut psikologi yang sama. . walaupun diukur dalam waktu yang berbeda ataukah menggunakan instrumen yang berbeda.

Metode Pengujian Reliabilitas .

• Ada syarat yang harus dipenuhi dalam menggunakan teknik korelasi tertentu.Statistik • Derajat reliabilitas ditunjukkan dengan koefisien krelasi yang dihitung dengan menggunakan teknik statistik berupa teknik korelasi. misalnya jika menggunakan korelasi product moment data tes harus berskala interval atau jika data berskala ordinal maka digunakan teknik rank spearman. . jika data berskala nominal menggunakan chi square.

Retest • Estimasi derajat reliabilitas dilakukan dengan cara melakukan pengukuran 2x dengan test yang sama kepada subjek yang sama pada waktu yang berbeda. • Kelemahan : menimbulkan kelelahan pada subjek dan ada faktor belajar yang dapat mempengaruhi hasil test.Metode Test . • Kelebihan : hanya memerlukan satu jenis instrumen. .

Contoh 1: alat ukur yang mengukur trait anxiety dengan skala  jenis data = interval X = pengukuran pertama.Alat ukur yang sama digunakan kembali pada subjek yang sama. Y = pengukuran kedua Pearson’s Product Moment Rumus : • r = pearson r correlation coefficient • n = jumlah sample . jadi jenis datanya akan sama.

Single Administration Method • Dilaksanakan melalui proses pengukuran hanya satu kali. • Teknik uji reliabilitas yang digunakan: – split-half correlation + Spearman-Brown correction – Kuder-Richardson 20/21 • Digunakan datanya dichotomous – Alpha cronbach .

Rumus Spearman Brown • ri = reliabilitas instrumen • rb = indeks korelasi antara dua belahan instrumen .

Rumus Kuder Richardson 20 • r tt= Koefisien korelasi dengan KR20 • k = jumlah butir soal • p = proporsi jawaban benar pada butir tertentu • q = proporsi jawaban salah pada butir tertentu ( q = 1 – p ) • s2= varians skor total .

Rumus Richardson 21 .

Rumus Alpha Cronbach • α = Koefisien Cronbach's Alpha • b = banyaknya pertanyaan dalam butir • ΣSi2 = varians butir • St2 = varians total .

.Parallel Form Methods • Pengujian reliabilitas ini menuntut cara tersedianya dua bentuk instrumen yang paralel dalam mengukur satu atribut yang psikologis. • Menurut Gulliksen hal ini merupakan metode terbaik dalam pengujian reliabilitas karena peluang memperoleh true score yang mendekati observe score akan lebih besar dengan menggunakan 2 instrumen.

Product Moment • Rumus : • r = pearson r correlation coefficient • n = jumlah sample .

ANALISIS ITEM .

Analisis Item • Item dalam suatu instrumen dalah isi dari instrumen itu sendiri. Item merupakan stimulus untuk merangsang munculnya respon sehingga perilaku subjek ukur akan dapat diidentifikasi melalui ikatan antara stumulul dengan respon. yaitu secara kualitatif dan secara kuantitatif. • Analisis item adalah analisis terhadap item untuk memperoleh informasi tentang kualitas item. • Dua cara analisis item. .

• Dua cara analisis item kualitatif : diskusi dengan para ahli dan mengumpulkan sejumlah sampel subjek yang akan menjadi sasaran ukur. • Karakteristik item yang berkualitas baik adalah. • Analisis ini dilakukan terhadap item dari tes yang mengukur atribut psikologis yang termasuk kategori personality. pertama item dipersepsikan sama oleh semua orang yang membaca kedua adalah item tidak mengandung social desirability. .Analisis Item Kualitatif • Pemeriksaan atau analisis melalui menelaah apakah item telah memenuhi syarat sebagai item yang baik.

Analisis Item Kuantitatif • Penggunaan prosedur statistik terhadap jawaban subjek atas item untuk memeriksa kemampuan item dalam hal membedaka individu. mengukur taraf kesulitan item dalam hal membedakan individu. mengukur taraf kesulitan item dan memeriksa kualitas distraktor dari item. .

Analisis Tingkat Kesulitan Item • Setiap respon subjek terhadap item menggambarkan ikatan langsung dengan item sebagai stimulus dari perilaku atau atribut perilaku yang diukur oleh item tersebut. . • Tingkat atau derajat kesulitan suatu item disebut sebagai facility index yang ditunjukkan dengan simbol p. • Biasanya digunakan dalam achiement tes dan aptitude test. • Analisis tingkat kesulitan item hanya dilakukan terhadap item yang digunakan untuk mengukur atribut ability.

• p = tingkat kesulitan item • N = jumlah individu yang mengikuti tes .

Analisis Distraktor • Distraktor adalah pilihan jawaban salah yang terdapat pada item multiple choice dari instrumen yang mengukur atribut ability. dengan dasar pemikiran bahwa responden memahami persoalan yang ditanyakan akan memilih jawaban yang benar. • Karakteristik item yang baik ditinjau dari distraktornya adalah yang memiliki peluang yang sama. • Item yang baik adalah yang memberi peluang pada setiap distraktor untuk dipilih oleh subjek dalam proporsi yang sama. .

Rumus 𝐷𝑖 = 𝑛𝑖 𝑁 • Di = proporsi distraktor ke i • n = jumlah responden yang pilih distraktor i • N = jumlah responden yang jawab salah .

jika atribut yang diukur adalah kecerdasan. • Daya pembeda ini akan menunjukkan kemampuan item untuk membedakan mana responden yang kuat motivasinya. Kemampuan item dalam membedakan subjek mana yang cerdas dan mana yang kurang. .Analisis Diskriminasi • Analisis diskriminasi cocok digunakan untuk hampir keseluruhan tipe tes. direpresentasikan oleh daya pembeda ini. • Daya diskriminasi menunjukkan kemampuan item dalam membedakan subjek atau responden yang memang memiliki perbedaan. mana yang lemah (jika atribut yang digunakan adalah motivasi).

• Atas dasar hasil analisis item. Menggugurkan item dan atau menggantinya dengan item lain. maka hasilnya dapat digunakan untuk : 1. • 2 pendekatan yang digunakan untuk pengukuran dalam diskriminasi item : – Item-discrimination index – Item-total correlation . Merevisi item yang kurang baik 3. Mempertahankan item yang berkualitas 2.

• Selain itu juga digunakan dalam perhitungan ablity test menggunakan jawaban singkat dan essay hanya jika jawabannya dinilai ulang menjadi benar atau salah. .Item discrimination index • Perhitungan dalam item discrimination index memiliki persyaratan dimana item-item yang diukur bersifat dichotomus. seperti benar/salah.

• Rumus : 𝐷 = 𝜌𝑇 − 𝜌𝐵 • D : Item discrimination index for a given test item • 𝜌𝑇 = • 𝜌𝐵 = 𝑝𝑟𝑜𝑝𝑜𝑟𝑠𝑖 𝑜𝑟𝑎𝑛𝑔 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑎𝑑𝑎 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 𝑎𝑡𝑎𝑠 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟 𝑑𝑎𝑙𝑎𝑚 𝑚𝑒𝑛𝑗𝑎𝑤𝑎𝑏 𝑗𝑢𝑚𝑙𝑎ℎ 𝑜𝑟𝑎𝑛𝑔 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 𝑎𝑡𝑎𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑠𝑖 𝑜𝑟𝑎𝑛𝑔 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑎𝑑𝑎 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 𝑏𝑎𝑤𝑎ℎ 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟 𝑑𝑎𝑙𝑎𝑚 𝑚𝑒𝑛𝑗𝑎𝑤𝑎 𝑗𝑢𝑚𝑙𝑎ℎ 𝑜𝑟𝑎𝑛𝑔 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑜𝑚𝑝𝑜𝑘 𝑏𝑎𝑤𝑎ℎ .• The discrimination index (D) dengan cara membandingkan performance dari 2 kelompok yang di tes.

Item-Total Correlation • Dapat dijadikan sebagai indikasi untuk melihat kemamouan setiap item dalam memprediksi keseluruhan skor tes. • Fokus dari item-total korelasi ini melihat apa yang diukur dari setiap item itu. Jika tes dan item mempunyai atribut yang sama. performance dari setiap item seharusnya di korelasikan dengan skor total dari tes. .

Rumus • • • • • • X = nilai-nilai dalam item yang akan dianalisis Y = total nilai dalam tes X = rata-rata untuk skor item yang dianalisis Y = rata-rata dari total skor dalam tes σx = standar deviasi dari nilai-nilai dalam item yang dianalisis σy = standar deviasi dari total skor dalam tes .

objective personality atau interest items) • Korelasi yang digunakan adalah point biserial correlation.• Item total corelation ini digunakan jika datanya adalah dichotomus (alternatives choices. .

Rumus untuk point-biserial correlation .

41 – 0.00 DERAJAT KORELASI Tidak ada korelasi Korelasi rendah Korelasi tinggi Korelasi tinggi sekali .70 0.Derajat Korelasi • Guildford (1965) KOEFISIEN <0.71 – 1.40 0.20 – 0.20 0.

Sign up to vote on this title
UsefulNot useful