P. 1
6. Validitas Dan Reliabilitas Instrumen Tes Dan Nontes

6. Validitas Dan Reliabilitas Instrumen Tes Dan Nontes

|Views: 2,984|Likes:
Published by llrnd

More info:

Published by: llrnd on May 05, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

06/22/2013

pdf

text

original

VALIDITAS DAN RELIABILITAS INSTRUMEN TES DAN NONTES

Disusun untuk memenuhi tugas Evaluasi Pembelajaran Matematika
Dosen Pengampu: Dr. Kartono, M.Si
Rombel: 01













Oleh:
1. Dian Teguh F.
2. Ulfah Rubiati
3. Elmy Melani




JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
2010

A. Validitas Tes
1. Konsep Validitas
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang
dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara
empiris guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan
validitas adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia
B. Anderson dan kawan-kawan disebutkan:
A test is valid if it measures what it purpose to measure. Atau jika diartikan “sebuah
tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Validitas
sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman.
Untuk menjadi valid suatu instrumen tidak hanya konsisten dalam penggunaannya,
namun yang terpenting adalah harus mampu mengukur sasaran ukurnya. Hal ini berarti
bahwa validitas merupakan ciri instrumen yang terpenting. Berbagai usaha dilakukan
untuk meningkatkan validitas instrumen, baik langsung ataupun tidak berhubungan
dengan peningkatan validitas instrumen itu sendiri. Untuk menjadi valid maka suatu
instrumen harus dikonstruksi dengan baik dan mencakup materi yang benar-benar
mewakili sasaran ukurnya. Validitas instrumen bersifat relatif terhadap situasi tertentu
dan tergantung pada kondisi tertentu. Instrumen yang mempunyai validitas tinggi
terhadap tujuan atau kegunaan tertentu mungkin akan mempunyai validitas sedang atau
mungkin rendah terhadap tujuan lainnya.
Menurut Messik (1989) terdapat lima aspek yang berbeda dalam konsep validitas.
Kelima aspek tersebut secara bersama-sama berfungsi sebagai ukuran validitas umum
atau standar untuk semua pengukuran psikologis dan pendidikan. Kelima aspek tersebut
adalah:
(1) Substansi.
Aspek substansi validitas mencakup verifikasi proses utama dalam pengungkapan
tugas penilaian. Hal ini dapat dikenali melalui penggunaan teori substansi dan
pemodelan proses. Ketika menentukan substansi instrumen, seseorang perlu
mempertimbangkan dua hal pokok: Pertama, tugas penilaian harus mewakili materi
yang akan dinilai. Kedua, penilaian harus ditetapkan berdasarkan fakta-fakta empiris.
(2) Strukrur pensekoran.
Strukrur pensekoran harus secara rasional konsisten dengan apa yang diketahui
tentang sifat hubungan struktural dari keberadaan konstruk yang dipersoalkan.
Struktur internal penilaian harus konsisten dengan apa yang diketahui tentang struktur
internal dari domain konstruk.
(3) Ketergeneralisasian.
Ketergene-ralisasian penilaian harus memenuhi keterwakilan isi dan konstruk. Hal ini
memungkinkan penafsiran skor untuk penggeneralisasian secara luas dalam konstruk
yang ditetapkan. Fakta seperti kemampuan generalisasi tersebut tergantung pada
tingkat korelasi suatu tugas dengan tugas lainnya yang juga mewakili konstruk atau
aspek-aspek konstruk.
(4) Faktor-faktor eksternal.
Aspek eksternal dari validitas mengacu pada tingkat hubungan skor assessment
dengan ukuran lain dan perilaku nonassessment yang mencerminkan tinggi, rendah,
dan hubungan interaksi antara konstruk yang ditetapkan.
(5) Akibat dari validitas.
Akibat validitas meliputi bukti dan dasar pemikiran dalam mengevaluasi konsekuensi
penafsiran dan menggunakan skor yang tidak diharapkan dan yang diharapkan.
Penyelidikan jenis ini terutama penting ketika berhubungan dengan akibat yang
merugikan bagi individu dan kelompok yang dihubungkan dengan penyimpangan
dalam penskoran dan penafsiran.
2. Jenis-jenis Validitas
Berdasarkan jenisnya ada dua macam validitas, yaitu validitas logis dan validitas
empiris.
a. Validitas logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”, yang
berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah
instrumen yang memenuhi persyaratan validberdasarkan hasil penalaran. Kondisi
valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah
dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana
pelaksanaan tugas lain misalnya membuat sebuah kerangan. Jadi, validitas logis tidak
perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai
disusun.
b. Validitas empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”.
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh
masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang
jujur. Jadi, validitas empiris tidak dapat hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui
pengalaman.
Berdasarkan cara pengambilan keputusan untuk menyatakan valid dan tidaknya
sebuah instrumen, menurut Crocker dan Algina (1986) membedakan tiga jenis validitas,
yaitu validitas isi, validitas konstruk, validitas relasi kriteria.
a. Validitas isi
Sebuah tes dikatakan memiliki validitas isi apabila mengkaji kepadanan sampel
(materi atau isi pelajaran) yang terdapat dalam suatu instrumen. Oleh karena materi
yang diajarkan tertera dalam kurikulum maka validitas isi ini sering disebut validitas
kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunanan dengan cara
merinci materi kurikulum atau materi buku pelajaran. Bagaiman cara merinci materi
untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara lebih
mendalam pada waktu menjelaskan cara penyusunan tes. Validitas isi biasanya
digunakan untuk menyebut validitas instrumen tes.
b. Validitas konstruk
Sebuah tes dikatakan memiliki validitas apabila butir-butir soal yang membangun
tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir
tersebut sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional.
Validitas konstruk mengkaji sifat-sifat psikologis yang menjelaskan keragaman
skor responden dalam instrumen tertentu. Validitas ini biasanya digunakan untuk
menyebut validitas instrumen non tes.
Validitas konstruk mencakup syarat-syarat empiris dan logis dari validitas isi dan
validitas kriteria. Hal Ini berari bahwa validitas konstruk menggabungkan syarat-
syarat yang terdapat dalam validitas isi dan validitas relasi kriteria (Anastasi, 1997).
Validitas konstruk menghubungkan gagasan dan praktek pengukuran di satu pihak,
dengan gagasan teoretik di pihak lain. Para penyusunan instrumen biasanya bertolak
dengan bekal suatu konstruk, kemudian mengembangkan instrumen untuk mengukur
konstruk tersebut. Selanjutnya, butir-butir instrumen yang telah dikembambangkan
diujicobakan secara empiris.
c. Validitas relasi kriteria
Sebuah tes dikatakan memeiliki validitas relasi kriteria apabila membandingkan
skor responden dengan satu atau lebih variable eksternal. Variabel eksternal bisa
berupa criteria bahwa tes diharapkan memprediksi, seperti hubungan dengan tes lain
yang diduga mengukur konstruk yang sama dan tes lain yang mengukur hal yang
berbeda. Kriteria adalah variabel perilaku yang akan diprediksi oleh skor tes.
Dalam penetuan koefisien relasi kriteria dapat diperoleh melalui dua prosedur
yang berebeda dari segi waktu pengambilan data (skor) kriterianya,yaitu validitas
konkuren dan validitas prediktif. Validitas prediktif diperoleh apabila pengambilan
skor criteria tidak bersamaan dengan pengambilan skor tes. Apabila skor tes dan skor
kriterianya diperoleh dalam waktuyang relatif sama, maka koefisien korelasi antara
variable itu merupakan koefisien validitas konkuren.

Validitas isi dan validitas konstruk berhubungan dengan kecocokan butir-butir
instrumen dengan tujuan ukurnya. Kedua jenis validitas tersebut dapat ditentukan melalui
pengkajian secara teoretis dan secara empiris, yang mencakup:
(1)menjelaskan pokok bahasan dan sub pokok bahasan;
(2)menetapkan pokok bahasan dan subpokok bahasan yang diukur oleh setiap butir
instrumen;
(3)mencocokkan butir-butir instrumen dengan pokok bahasan dan subpokokbahasan
yang diukurnya.
3. Cara mengetahui validitas alat ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium,
dalam arti memiliki kesesajaran antara hasil tes tersebut dengan kriterium. Teknik yang
digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang
dikemukakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a. Korelasi product moment dengan simpangan, dan
b. Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan simpangan:






Keterangan:
xy
r = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan ( X X x ÷ = dan Y Y y ÷ = )
¿xy
= jumlah perkalia x dan y
2
x = kuadrat dari x
2
y = kuadrat dari y
Rumus korelasi product moment dengan angka kasar:







Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus
simpangan, ternyata terdapat perbedaan sebesar 0,003, lebih besar yang dihitung dengan
( )( )
¿ ¿
¿
=
2 2
y x
xy
xy
r

( )( )
( ) ( ) ( ) ( )
2
2
2
2
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
=
Y Y N X X N
Y X XY N
r
XY

rumus simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan
jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas. Perbedaan
ini sangat kecil sehingga dapat diabaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan sebagai
berikut:
- Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal. Misalnya hal
pertama nilainya naik, hal kedua ikut naik. Sebaliknya jika hal pertama turun, yang
kedua ikut turun.
- Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal. Misalnya
hal pertama nilainya naik, justru yang kedua turun. Sebaliknya jika yang pertama
turun, yang kedua naik.
Keadaan hubungan antara dua hal yang kita jumpai dalam kehidupan sehari-hari
tidak selalu hanya positif atau negatif saja, tetapi mungkin 0. Besarnaya korelasi pun
tidak menentu.
Koefisien korelasi selalu terdapat antara ÷1,00 sampai +1,00. Namun karena dalam
menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh
koefisien >1,00. Koefisien negatif menunjukkan hubungan kebalikan sedangkan
koefisien positif menunjukkan adanya kesejajaran untuk mengadakan intrepetasi
mengenai besarnya koefisien korelasi adalah sebagai berikut:
o Antara 0,800÷1,00 : sangat tinggi
o Antara 0,600÷0,800 : tinggi
o Antara 0,400÷0,600 : cukup
o Antara 0,200÷0,400 : rendah
o Antara 0,00÷0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada dua cara, yaitu:
1. Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup, dan
sebagainya.
2. Dengan berkonsultasi ke tabel harga kritik rproduct moment sehingga dapat diketahui
signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik dalam
tabel, maka korelasi tersebut tidak signifikan. Begitu juga sebaliknya.
4. Validitas butir soal atau validitas item
Di samping mencari validitas soal perlu juga dicari validitas item. Pengertian umum
untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai
dukungan yang besar terhadap skor total. Skor pada item menyebakan skor total menjadi
tinggi atau rendah. Dengan kata lain dapat dikemukakan bahwa sebuah item memiliki
validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total.
Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item
digunakan rumus korelasi.
Contoh perhitungan:
TABEL ANALISIS ITEM UNTUK PERHITUNGAN VALIDITAS ITEM
No. Nama
Butir soal/item Skor
total 1 2 3 4 5 6 7 8 9 10
1. Hartati 1 0 1 0 1 1 1 1 1 1 8
2. Yoyok 0 0 1 0 1 0 0 1 1 1 5
3. Oktaf 0 1 0 0 0 1 0 1 0 1 4
4. Wendi 1 1 0 0 1 1 0 0 1 0 5
5. Diana 1 1 1 1 1 1 0 0 0 0 6
6. Paul 1 0 1 0 1 0 1 0 0 0 4
7. Susana 1 1 1 1 1 1 1 0 0 0 7
8. Helen 0 1 0 1 1 1 1 1 1 1 8
Keterangan:
Skor 1 bagi item yang dijawab benar
Skor 0 bagi item yang dijawab salah.
Akan dihitung validitas item untuk soal nomor 6. Maka skor item no.6 disebut
variabel X dan skor total disebut variabel Y.
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel
persiapannya sebagai berikut.
TABEL PERSIAPAN UNTUK MENGHITUNG VALIDITAS ITEM NOMOR 6
No. Nama X Y
1. Hartati 1 8
2. Yoyok 0 5
Keterangan:
X = skor item nomor 6
Y = skor total
Dari perhitungan kalkulator diperoleh data sebagai
berikut:
6 =
¿
X 6
2
=
¿
X 17 , 6 =
p
X
46 =
¿
Y 288
2
=
¿
Y 75 , 0
8
6
= = p
37 =
¿
XY 57 , 5 =
t
X 25 , 0
8
2
= = q
Data dimasukkan ke dalam rumus korelasi product moment dengan angka kasar
sebagai berikut:

( )( )
( ) ( ) ( ) ( )
2
2
2
2
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
=
Y Y N X X N
Y X XY N
r
XY

( )( )
2 2
46 288 8 6 6 8
46 6 37 8
÷ × ÷ ×
× ÷ ×
=
XY
r



( )( ) 2116 2304 36 48
276 297
÷ ÷
÷
=


188 12
20
×
=



2256
20
=


421 , 0
497 , 47
20
= =

Koefisien validitas item nomor 6 adalah 0,421. Dilihat sepintas bilangan ini
memang sesuai dengan kenyataannya. Validitas item tersebut kurang meyakinkan. Tentu
saja validitasnya tidak tinggi.
3. Oktaf 1 3
4. Wendi 1 5
5. Diana 1 6
6. Paul 0 4
7. Susana 1 7
8. Helen 1 8
Masih ada cara lain untuk menghitung validitas item. Salah satu cara yang terkenal
adalah menggunakan rumus
pbi
¸ yang rumus lengkapnya adalah sebagai berikut:






Keterangan:

pbi
¸ = koefisien korelasi biserial
M
p
= rerata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya
M
t
= rerata skor total
S
t
= standar deviasi dari skor total
p = proporsi siswa yang menjawab benar

|
|
.
|

\
|
=
siswa seluruh jumlah
benar menjawab yang siswa banyak
p
q = proporsi siwa yang menjawab salah
(q = 1 - p)
Apabila item 6 dicari validitasnya dengan rumus ini maka perhitungannya melelui
langkah-langkah sebagai berikut:
1. Mencari
17 , 6
6
37
6
8 7 6 5 3 8
= =
+ + + + +
=
p
M
2. Mencari
75 , 5
8
46
8
8 7 4 6 5 3 5 8
= =
+ + + + + + +
=
t
M
3. Dari perhitungan diperoleh harga standar deviasi, yaitu 7139 , 1 =
n
o atau
8323 , 1
1
=
÷ n
o . Untuk n kecil, diambil standar deviasi yang 7139 , 1 =
n
o .
q
p
S
M M
t
t p
pbi
÷
= ¸

4. Menentukan harga p, yaitu 75 , 0
8
6
=
5. Menentukan harga q, yaitu 25 , 0
8
2
= atau 25 , 0 75 , 0 1 = ÷
6. Memasukkan ke rumus
pbi
¸
q
p
S
M M
t
t p
pbi
÷
= ¸

25 , 0
75 , 0
7139 , 1
75 , 5 17 , 6 ÷
=

7321 , 1
7139 , 1
42 , 0
× =

4244 , 0 =

Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya berbeda tetapi
sangat kecil, yaitu 0,0034. Mungkin hal ini disebabkan karena adanya pembulatan angka.
5. Tes standar sebagai kriterium dalam menentukan validitas
Tes terstandar (standardized test) adalah tes yang telah dicobakan berkali-kali
sehingga dapat dijamin kebaikannya. Sebuah tes terstandar biasanya memiliki identitas
antara lain: sudah dicobakan berapa kali dan di mana, berapa koefisien validitas,
reliabilitas, taraf kesukaran, daya pembeda dan lain-lain keterangan yang dianggap perlu.
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai kriterium
dilakukan dengan mengalikan koefisien validitas tes terstandar tersebut.
Dari tabel sebelumnya, jika dari tes terstandar diketahui bahwa validitasnya 0,89
maka bilangan 0,421 belum merupakan validitas soal mata pelajaran yang dicari.
Validitas tersebut harus dikalikan dengan 0,89 yang hasilnya 21449 , 0 89 , 0 421 , 0 = × .
6. Validitas faktor
Selain validitas soal secara keseluruhan dan validitas butir atau item, masih ada lagi
yang perlu diketahui validitasnya, yaitu faktor-faktor atau bagian keseluruhan materi.
Setiap keseluruhan materi pelajaran terdiri dari pokok-pokok bahasan atau mungkin
sekelompok pokok bahasan yang merupakan satu kesatuan.
Contoh:
Guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahasan,yaitu:
persamaan linear satu variabel, himpunan, dan segiempat. Untuk keperluan ini guru
tersebut membuat 30 butir soal, untuk persamaan linear satu variabel 8 butir, untuk
himpunan 12 butir, dan untuk segiempat 10 butir.
Apabila guru ingin mengetahui validitas faktor, maka ada 3 faktor dalam soal ini.
Seperti halnya pengertian validitas butir, pengertian validitas faktor adalah sebagai
berikut: butir-butir soal dalam faktor dikatakan valid apabila mempunyai dukungan yang
besar terhadap soal-soal secara keseluruhan. Sebagai tanda bahwa butir-butir faktor
tersebut mempunyai dukungan yang besar terhadap seluruh soal, yakni apabila jumlah
skor untuk butir-butir faktor tersebut menunjukkan adanya kesejajaran dengan skor total.
Cara mengetahui kesejajaran tersebut digunakan juga rumus korelasi product
moment. Misalnya kita akan mengetahui validitas factor 1, yakni soal-soal untuk materi
persamaan linear satu variabel, kita bisa membuat tabel kesejajaran skor faktor 1 dengan
skor total sama seperti ketika membuat tabel validitas pada item soal. Dan kemudian
dimasukkan ke dalam rumus korelasi product moment. Harga r yang diperoleh
menunjukkan indeks validitas faktor 1. Untuk faktor 2 dan 3 caranya sama.
TABEL UNTUK MENGHITUNG KESEJAJARAN SKOR FAKTOR 1 DENGAN
SKOR TOTAL
Nama subjek Skor faktor 1
(X)
Skor faktor 2
(Y)
X
2
Y
2
XY
Amir 6 19 36 361 114
Hasan 7 25 49 625 175
Ninda 4 17 16 289 68
Warih 3 12 9 144 36
Irzal 8 29 64 841 232
Gandi 6 23 36 529 138
Santo 5 19 25 361 95
Tini 7 26 49 676 182
Yanti 5 16 25 256 80
Hamid 4 15 16 225 60
Dedi 7 26 49 676 182
Desi 8 30 64 900 240
Wahyu 5 20 25 400 100
Jumlah 75 277 463 6283 1702

7. Validitas Instrumen Nontes




B. Reliabilitas Tes
1. Konsep reliabilitas
Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan dengan
masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang
tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas
tes, berhubungan dengan masalah ketetapan hasil tes. Konsep reliabilitas ini tidak akan
sulit dimengerti apabila pembaca telah memahami konsep validitas.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting. Dalam
hal ini validitas lebih penting, dan reliabilitas ini perlu, karena menyokong terbentuknya
validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang
valid biasanya reliabel.
A reliable measure in one that provides consistent and stable indication of the
characteristic being investigated.
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur kejiwaan
manusia itu sendiri tidak ajeg. Misalnya: kemampuan, kecakapan, sikap, dan sebagainya
yang berubah dari waktu ke waktu.
Secara garis besar ada 3 hal yang mempengaruhi hasil tes, yaitu:
a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-
butir solanya.
Tes yang terdiri dari banyak butir lebih valid dibandingkan dengan tes yang
hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan
tinggo rendahnya reliabilitas tes. Maka semakin panjang tes, maka reliabilitasnya
semakin tinggi. Dalam menghitung besarnya reliabilitas yang berhubung dengan
penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan
oleh Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown.
Rumusnya adalah:
r n
nr
r
nn
) 1 ( 1 ÷ +
=
Keterangan:
nn
r = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal
baru
n = berapa kali butir-butir soal itu ditambah
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Adakalanya penambahan butir-butir soal tes tidak berarti bahkan adakalanya
merugikan. Hal ini disebabkan karena:
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak
menambah tinggi reliabilitas tes.
2) Penambahan tingginyareliabilitas tes tidak sebanding nilainya dengan waktu,
biaya, dan tenaga yang dikeluarkan untuk itu. Kulaitas butir-butir soal
ditentukan oleh:
a) Jelas tidaknya rumusan soal
b) Baik tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab
c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.
b. Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar kecilnya
reliabilitas tes. Tes yang diobakan kepada bukan kelompok terpilih, akan
menunjukkan reliabilitas yang lebih besardaripada yang dicobakan pada kelompok
tertentu yang diambil secara dipilih.
c. Hal yang berhubungan dengan penyelenggaraan tes
Sudah disebutkan bahwa factor penyelenggaraan tes yang bersifat
administratif, sangat menentukan hasil tes.
Contoh:
1) Petunjuk yang diberikan sebelum tes dimulai, akan member ketenangan kepada
para tester dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan
banyak terdapat pertanyaan
2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa
terhadap tes
3) Suasana lingkungan dan tempat tes akan mempengaruhi hasil tes.
2. Cara-cara mencari besarnya reliabilitas
Untuk mengetahui ketetapan suatu tes dapat dilihat dari kesejajaran hasil. Seperti
halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk
mengetahui validitas, rumus tersebut juga digunakan menentukan kesejajaran hasil dalam
reliabilitas tes.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes
(consistency external) dan pada tes itu sendiri (consistency internal).
a. Metode bentuk parallel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam
istilah bahasa Inggris disebut alternate-form method (parallel forms).
Dalam menggunakan metode tes parallel ini pengetes harus menyiapkan dua
buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh
karena itu, ada yang menyebutkan double test-double-trial method. Penggunaan
faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect
dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena
sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk
mencobakan dua kali tes.
b. Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
Dalam menggunakan metode ini pengetes hanya memiliki satu seri tes tetapi
dicobakan dua kali, dan metode ini sering disebut single-test-double-trial method.
Kemudian hasil kali tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkap pengetahuan dan pemahaman, cara ini
kurang mengena karena tercoba akan masih ingat butir-butir soalnya. Tenggang
waktu dalam pemberian tes perlu diperhatikan karena factor ini juga mempengaruhi
reliabilitas tes.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes
pertama. Hal ini tidak menjadi masalah karena pengetes harus sadar akan adanya
practice effect dan carry over effect. Yang terpenting adalah adanya kesejajaran
hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.
Ketika pelaksanaan tes kedua pastilah tampak skornya naik, tetapi kenaikannya
dialami oleh seluruh siswa yang dites. Metode ini juga disebut self-correlation
method karena mengkorelasikan hasil dari tes yang sama.
c. Metode belah dua (split-half method)
Kelemahan penggunaan dua metode sebelumnya dapat diatasi dengan metode
ketiga yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya
menggunakan sebuah tes dan dicobakan satu kali, yang biasa disebut single-test-
single-trial method.
Pada metode belah dua tidak dapat ditafsirkan langsung koefisien korelasinya,
tetapi pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui
reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan
rumus Spearman-Brown sebagai berikut:






Keterangan:
|
.
|

\
|
+
=
2
1
2
1
2
1
2
1
11
1
2
r
r
r

2
1
2
1
r = korelasi antara skor-skor setiap belahan tes.
11
r = koefisien reliabilitas yang sudah disesuaikan.
Banyak pemakai metode ini salah membelah hasil tes pada waktu
menganalisis. Yang perlu diperhatikan adalah dalam membelah item atau butir soal
bukan mengelompokkan separo hasil peserta tes dan separo yang lain kemudian
mengkorelasikannya. Bagi pemakai metode ini harus ingat bahwa banyaknya butir
soal harus genap agar dapat dibelah.
Ada dua cara membelah butir soal ini yaitu:
1) Membelah atas item-item genap dan item-iten ganjil yang disebut belahan
ganjil-genap
2) Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang disebut belahan
awal-akhir.
Contoh perhitungan reliabilitas dengan metode belah dua
TABEL ANALISIS ITEM TES MATEMATIKA
No. Nama
Nomor item 1,3,5,
7,9
2,4,6,
8,10
1,2,3
,4,5
6,7,8
,9,10
1 2 3 4 5 6 7 8 9 10 Skor
total
ganjil genap awal
Akhir
1. Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2. Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3. Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4. Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5. Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6. Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
7. Susan 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
8. Helen 0 1 0 1 1 1 1 1 1 1 8 5 5 3 5



1) Pembelahan ganjil-genap
No. Nama
Item ganjil
(1,3,5,7,9)
(X)
Item genap
(2,4,6,8,10)
(Y)
1. Hartati 5 3
2. Yoyok 3 2
3. Oktaf 0 4
4. Wendi 3 2
5. Diana 3 3
6. Paul 4 0
7. Susan 4 3
8. Helen 5 5

2) Pembelahan awal-akhir
No. Nama
Item awal
(1,2,3,4,5)
(X)
Item akhir
(6,7,8,9,10)
(Y)
1. Hartati 3 5
2. Yoyok 2 3
3. Oktaf 1 3
4. Wendi 3 2
5. Diana 5 1
6. Paul 3 1
7. Susan 5 2
8. Helen 3 5

3) Penggunaan rumus Flanagon


|
|
.
|

\
|
+
÷ =
2
2
2
2
1
11
1 2
t
S
S S
r


Keterangan:
11
r = reliabilitas tes
2
1
S = varians belahan pertama (varian skor item ganjil)
2
2
S = varians belahan kedua (varians skor item genap)
2
t
S = varians total yaitu varians skor total
4) Penggunaan rumus Rulon







Keterangan:
2
d
S = varians beda
d = difference yaitu prebedaan antara skor belahan pertama dengan skor
belahan kedua
5) Penggunaan rumus K-R. 20






Keterangan:
r
11
= reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab item dengan benar
q = proporsisubjek yang menjawab item dengan salah (q=1-p)
2
2
11
1
t
d
S
S
r ÷ =

|
|
.
|

\
| ÷
|
.
|

\
|
÷
=
¿
2
2
11
1 S
pq S
n
n
r

¿
pq= jumlah hasil perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes (akar dari varians)
Contoh penggunaan rumus K-R. 20 (biasa digunakan dalam kasus pilihan
ganda) :
Tabel perhitungan mencari reliabilitas tes dengan K-R. 20
No. Nama
Nomor item Skor
total 1 2 3 4 5 6 7
1. Wardoyo 1 0 1 1 1 1 0 5
2. Benny 0 1 1 0 1 1 1 5
3. Hanafi 0 0 0 0 1 0 1 2
4. Rahmand 0 1 1 1 1 1 1 6
5. Tanti 1 0 0 0 1 0 0 2
6. Nadia 0 1 1 1 1 0 0 4
7. Tini 0 0 0 1 1 1 0 3
8. Budi 0 1 0 1 1 0 0 3
9. Daron 0 1 0 1 1 0 0 3
10. Yakub 0 0 0 1 1 0 0 2
N
p
2 5 4 7 10 4 3 35
p 0,2 0,5 0,4 0,7 1 0,4 0,3
q 0,8 0,5 0,6 0,3 0 0,6 0,7
pq 0,16 0,25 0,24 0,21 0 0,24 0,21 1,31
Kemudian hasil dari tabel disubstitusikan ke dalam rumus K-R. 20
|
|
.
|

\
| ÷
|
.
|

\
|
÷
=
¿
2
2
11
1 S
pq S
n
n
r

2
2
36 , 1
31 , 1 36 , 1
6
7 ÷
× =

S = 1,56 (dicari dengan kalkulator)

85 , 1
31 , 1 85 , 1
17 , 1
÷
× =


85 , 1
54 , 0
17 , 1 × =


3415 , 0 29 , 0 17 , 1 = × =

Dibulatkan menjadi 0,342.
Jadi reliabilitas tes tersebut adalah 0,342.
6) Penggunaan rumus K-R. 21




Keterangan:
M = mean atau rerata skor total
7) Penggunaan rumus Hoyt

atau


keterangan:
r
11
= reliabilitas seluruh soal
V
r
= varians responden
V
s
= varians sisa
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah
sebagai berikut:
(1) Mencari jumlah kuadrat responden
(2) Mencari jumlah kuadrat item
(3) Mencari jumlah kuadrat total
|
|
.
|

\
|
÷
÷ |
.
|

\
|
÷
=
2 11
) (
1
1
t
nS
M n M
n
n
r

r
s
V
V
r ÷ =1
11
r
s r
V
V V
r
÷
=
11
(4) Mencari jumlahkuadrat sisa
(5) Mencari varians responden dan varians sisa dengan tabel F
(6) Memasukkan ke dalam rumus r
11
3. Mencari reliabilitas tes bentuk uraian
Menilai soal bentuk uraian tidak dapat dilakukan dengan pemberian nilai “benar”
atau “salaah”. Suatu butir soal uraian menghendaki gradualisasi penilaian. Barangkali
butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai
tertinggi hanya 5, dan butir soal nomor 3 sampai 10, dan sebagainya.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis
butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal
dicantumkan pada kolom item menurut apa adanya. Rumus yang digunakan adalah rumus
alpha sebagai berikut:





Keterangan:

11
r = reliabilitas yang dicari

¿
2
i
o = jumlah varians skor tiap-tiap item

2
t
o = varians total
Contoh perhitungan mencari reliabilitas pada soal uraian:
TABEL ANALISIS ITEM
No. Nama
Nomor item Skor
total
Kuadrat
skor total 1 2 3 4 5 6
1. Hana 10 6 8 8 10 10 52 2704
2. Isna 6 4 4 6 6 5 31 961
3. Inay 8 2 6 8 7 8 39 1521
4. Tia 7 3 7 7 6 6 36 1296
|
|
.
|

\
|
÷
|
.
|

\
|
÷
=
¿
2
2
11
1
1
t
i
n
n
r
o
o

5. Resti 0 5 3 2 4 4 18 324
6. Rika 2 4 2 8 6 8 30 900
7. Ani 4 3 6 6 6 6 31 961
8. Sita 5 5 5 7 7 7 36 1296
9. Tami 5 5 4 6 8 5 33 1089
10. Alfi 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
Jumlah
kuadrat
328 201 264 418 458 451 2120


Dengan data yang tertera dalam tabel, dicari varians tiap-tiap item dahulu baru
dijumlahkan.
Ingat rumus varians, yaitu:
( )
N
N
X
X
2
2
2
¿
¿
÷
= o atau
( )
N
X
N
X
t
t
t
2
2
2 ¿ ¿
÷ = o
Varians untuk item no.1:
8 , 7
10
78
10
250 328
10
10
50
328
2
) 1 (
2
= =
÷
=
÷
= o
Varians untuk item no.2:
61 , 1
10
1 , 16
10
9 , 184 201
10
10
43
201
2
) 2 (
2
= =
÷
=
÷
= o
Varians untuk item no. 3:
36 , 3
10
6 , 33
10
4 , 230 264
10
10
48
264
2
) 3 (
2
= =
÷
=
÷
= o
Varians untuk item no. 4:
36 , 3
10
6 , 33
10
4 , 384 418
10
10
62
418
2
) 4 (
2
= =
÷
=
÷
= o
Varians untuk item no. 5:
24 , 2
10
4 , 22
10
6 , 435 458
10
10
66
458
2
) 5 (
2
= =
÷
=
÷
= o
Varians untuk item no. 6:
85 , 2
10
5 , 28
10
5 , 422 451
10
10
65
451
2
) 6 (
2
= =
÷
=
÷
= o
Jumlah varians semua item 22 , 21 85 , 2 24 , 2 36 , 3 36 , 3 61 , 1 8 , 7
2
= + + + + + =
¿ i
o
04 , 68
10
4 , 680
10
6 , 11155 11836
10
10
334
11836
2
2
= =
÷
=
÷
=
t
o

Kemudian dimasukkan ke dalam rumus alpha
8256 , 0 688 , 0
5
6
) 312 , 0 1 (
5
6
04 , 68
22 , 21
1
1 6
6
11
= × = ÷ × = |
.
|

\
|
÷
|
.
|

\
|
÷
= r

Dengan diperolehnya koefisien korelasi yakni r
11
sebenarnya baru diketahui tinggi
rendahnya koefisien tersebut. Lebih sempurnanya penghitungan reliabilitas sampai pada
kesimpulan, sebaliknya hasil tersebut dikonsultasikan dengan tabel r product moment.
Bagi mahasiswa yang menulis skripsi dan ingin menguji reliabilitas angket yang
digunakan untuk mengumpulkan data, rumus alpha ini dapat juga diterapkan. Kesalahn
fatal yang sering kita jumpai adalah penggunaan teknik belah dua untuk menghitung
reliabilitas angket. Dalam menggunakan teknik belah dua, peneliti harus selalu ingat
persyaratannya, antara lain bahwa belahan pertama dengan belahan kedua yang dicari
kesejajarannya harus seimbang.
C. Kesalahan pengukuran Baku (standart error of measurement)
Kesalahan pengukuran baku berkaitan dengan nilai skor tes pada kelompok
tertentu. SEM mengukur variabel kesalahan dari sebuah pengukuran dan secara langsung
berhubungan dengan kesalahan variansi skor.
Rumus yang digunakan dalam kesalahan pengukuran baku adalah:


Keterangan:
SEM / SE = Standar Error Measurment
S
x
2
= varians
S
x
= akar varians / standar deviasi
Selain itu, kesalahan pengukuran baku berhubungan dengan nilai reliabilitas yang
ada.Begitu pula sebaliknya. Jika tes reliabilitas sama dengan 0, maka kesalahan
pengukuran baku sama dengan standart deviasinya, jika tes reliabilitasnya +1,00
merupakan kemungkinan terbesar, kesalahan pengukuran bakunya sama dengan 0. Jadi
semakin tinggi nilai reliabilitas pada suatu instrument baik tes maupun nontes, maka
semakin rendah tingkat kesalahan dalam pengukuran.










) 1 ( ) 1 (
2
xx x xx x
r S r S SE SEM ÷ = ÷ = =


A. Validitas Tes 1. Konsep Validitas Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya. Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan: A test is valid if it measures what it purpose to measure. Atau jika diartikan “sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Untuk menjadi valid suatu instrumen tidak hanya konsisten dalam penggunaannya, namun yang terpenting adalah harus mampu mengukur sasaran ukurnya. Hal ini berarti bahwa validitas merupakan ciri instrumen yang terpenting. Berbagai usaha dilakukan untuk meningkatkan validitas instrumen, baik langsung ataupun tidak berhubungan dengan peningkatan validitas instrumen itu sendiri. Untuk menjadi valid maka suatu instrumen harus dikonstruksi dengan baik dan mencakup materi yang benar-benar mewakili sasaran ukurnya. Validitas instrumen bersifat relatif terhadap situasi tertentu dan tergantung pada kondisi tertentu. Instrumen yang mempunyai validitas tinggi terhadap tujuan atau kegunaan tertentu mungkin akan mempunyai validitas sedang atau mungkin rendah terhadap tujuan lainnya. Menurut Messik (1989) terdapat lima aspek yang berbeda dalam konsep validitas. Kelima aspek tersebut secara bersama-sama berfungsi sebagai ukuran validitas umum atau standar untuk semua pengukuran psikologis dan pendidikan. Kelima aspek tersebut adalah: (1) Substansi. Aspek substansi validitas mencakup verifikasi proses utama dalam pengungkapan tugas penilaian. Hal ini dapat dikenali melalui penggunaan teori substansi dan pemodelan proses. Ketika menentukan substansi instrumen, seseorang perlu mempertimbangkan dua hal pokok: Pertama, tugas penilaian harus mewakili materi yang akan dinilai. Kedua, penilaian harus ditetapkan berdasarkan fakta-fakta empiris.

yang berarti penalaran. Jenis-jenis Validitas Berdasarkan jenisnya ada dua macam validitas. a. Dengan makna demikian maka validitas logis untuk sebuah instrumen yang memenuhi persyaratan validberdasarkan hasil penalaran. Fakta seperti kemampuan generalisasi tersebut tergantung pada tingkat korelasi suatu tugas dengan tugas lainnya yang juga mewakili konstruk atau aspek-aspek konstruk. (5) Akibat dari validitas. Strukrur pensekoran harus secara rasional konsisten dengan apa yang diketahui tentang sifat hubungan struktural dari keberadaan konstruk yang dipersoalkan. Jadi. mengikuti teori dan ketentuan yang ada. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang secara baik. 2. Aspek eksternal dari validitas mengacu pada tingkat hubungan skor assessment dengan ukuran lain dan perilaku nonassessment yang mencerminkan tinggi. Hal ini memungkinkan penafsiran skor untuk penggeneralisasian secara luas dalam konstruk yang ditetapkan. dan hubungan interaksi antara konstruk yang ditetapkan. yaitu validitas logis dan validitas empiris. Akibat validitas meliputi bukti dan dasar pemikiran dalam mengevaluasi konsekuensi penafsiran dan menggunakan skor yang tidak diharapkan dan yang diharapkan. (3) Ketergeneralisasian. Struktur internal penilaian harus konsisten dengan apa yang diketahui tentang struktur internal dari domain konstruk. validitas logis tidak .(2) Strukrur pensekoran. (4) Faktor-faktor eksternal. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah kerangan. rendah. Validitas logis Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”. Penyelidikan jenis ini terutama penting ketika berhubungan dengan akibat yang merugikan bagi individu dan kelompok yang dihubungkan dengan penyimpangan dalam penskoran dan penafsiran. Ketergene-ralisasian penilaian harus memenuhi keterwakilan isi dan konstruk.

Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering disebut validitas kurikuler.perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun. Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Validitas ini biasanya digunakan untuk menyebut validitas instrumen non tes. Validitas konstruk mengkaji sifat-sifat psikologis yang menjelaskan keragaman skor responden dalam instrumen tertentu. Validitas isi biasanya digunakan untuk menyebut validitas instrumen tes. Jadi. validitas konstruk. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional. . Bagaiman cara merinci materi untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu menjelaskan cara penyusunan tes. a. yaitu validitas isi. validitas relasi kriteria. Berdasarkan cara pengambilan keputusan untuk menyatakan valid dan tidaknya sebuah instrumen. tetapi harus dibuktikan melalui pengalaman. Sebagai contoh sehari-hari. Validitas isi dapat diusahakan tercapainya sejak saat penyusunanan dengan cara merinci materi kurikulum atau materi buku pelajaran. b. b. Validitas konstruk Sebuah tes dikatakan memiliki validitas apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan instruksional khusus. Validitas empiris Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. menurut Crocker dan Algina (1986) membedakan tiga jenis validitas. validitas empiris tidak dapat hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis. Validitas isi Sebuah tes dikatakan memiliki validitas isi apabila mengkaji kepadanan sampel (materi atau isi pelajaran) yang terdapat dalam suatu instrumen.

butir-butir instrumen yang telah dikembambangkan diujicobakan secara empiris. Dalam penetuan koefisien relasi kriteria dapat diperoleh melalui dua prosedur yang berebeda dari segi waktu pengambilan data (skor) kriterianya. Selanjutnya. kemudian mengembangkan instrumen untuk mengukur konstruk tersebut. 1997). 3. Validitas konstruk menghubungkan gagasan dan praktek pengukuran di satu pihak. Validitas isi dan validitas konstruk berhubungan dengan kecocokan butir-butir instrumen dengan tujuan ukurnya. c. yang mencakup: (1)menjelaskan pokok bahasan dan sub pokok bahasan. dengan gagasan teoretik di pihak lain. Validitas prediktif diperoleh apabila pengambilan skor criteria tidak bersamaan dengan pengambilan skor tes.Validitas konstruk mencakup syarat-syarat empiris dan logis dari validitas isi dan validitas kriteria. Cara mengetahui validitas alat ukur . (3)mencocokkan butir-butir instrumen dengan pokok bahasan dan subpokokbahasan yang diukurnya. seperti hubungan dengan tes lain yang diduga mengukur konstruk yang sama dan tes lain yang mengukur hal yang berbeda. Validitas relasi kriteria Sebuah tes dikatakan memeiliki validitas relasi kriteria apabila membandingkan skor responden dengan satu atau lebih variable eksternal. Variabel eksternal bisa berupa criteria bahwa tes diharapkan memprediksi. Para penyusunan instrumen biasanya bertolak dengan bekal suatu konstruk. Apabila skor tes dan skor kriterianya diperoleh dalam waktuyang relatif sama. Kedua jenis validitas tersebut dapat ditentukan melalui pengkajian secara teoretis dan secara empiris. (2)menetapkan pokok bahasan dan subpokok bahasan yang diukur oleh setiap butir instrumen. Hal Ini berari bahwa validitas konstruk menggabungkan syaratsyarat yang terdapat dalam validitas isi dan validitas relasi kriteria (Anastasi. Kriteria adalah variabel perilaku yang akan diprediksi oleh skor tes. maka koefisien korelasi antara variable itu merupakan koefisien validitas konkuren.yaitu validitas konkuren dan validitas prediktif.

Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium. Korelasi product moment dengan simpangan. Korelasi product moment dengan angka kasar. lebih besar yang dihitung dengan . dalam arti memiliki kesesajaran antara hasil tes tersebut dengan kriterium. Rumus korelasi product moment ada dua macam. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson. yaitu: a. Rumus korelasi product moment dengan simpangan: rxy     xy x2 y2  Keterangan: rxy = koefisien korelasi antara variabel X dan variabel Y. dua variabel yang dikorelasikan ( x  X  X dan y  Y  Y )  x2 y2 xy = jumlah perkalia x dan y = kuadrat dari x = kuadrat dari y Rumus korelasi product moment dengan angka kasar: rXY  N  X N  XY   X Y  2 2   X  N Y 2  Y   2  Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus simpangan. dan b.003. ternyata terdapat perbedaan sebesar 0.

Sebaliknya jika hal pertama turun. hal kedua ikut naik.00 : sangat tinggi o Antara 0. Begitu juga sebaliknya.  Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal.00. Besarnaya korelasi pun tidak menentu. Namun karena dalam menghitung sering dilakukan pembulatan angka-angka. tetapi mungkin 0.2000.400 : rendah o Antara 0. Misalnya hal pertama nilainya naik. Perbedaan ini sangat kecil sehingga dapat diabaikan. sangat mungkin diperoleh koefisien >1.200 : sangat rendah Penafsiran harga koefisien korelasi ada dua cara. cukup.4000. Keadaan hubungan antara dua hal yang kita jumpai dalam kehidupan sehari-hari tidak selalu hanya positif atau negatif saja.000. justru yang kedua turun. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas. 4.600 : cukup o Antara 0. Jika harga r lebih kecil dari harga kritik dalam tabel. 2. yaitu: 1. yang kedua naik. Koefisien negatif menunjukkan hubungan kebalikan sedangkan koefisien positif menunjukkan adanya kesejajaran untuk mengadakan intrepetasi mengenai besarnya koefisien korelasi adalah sebagai berikut: o Antara 0. Dengan berkonsultasi ke tabel harga kritik rproduct moment sehingga dapat diketahui signifikan tidaknya korelasi tersebut. Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi.6000. Koefisien korelasi selalu terdapat antara 1. Sebaliknya jika yang pertama turun. yang kedua ikut turun. maka korelasi tersebut tidak signifikan.00. Validitas butir soal atau validitas item .00 sampai +1.rumus simpangan. Untuk memperjelas pengertian tersebut dapat disampaikan keterangan sebagai berikut:  Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal.8001. dan sebagainya. Misalnya hal pertama nilainya naik.800 : tinggi o Antara 0.

Akan dihitung validitas item untuk soal nomor 6. Untuk menghitung validitas item nomor 6. 8. Skor pada item menyebakan skor total menjadi tinggi atau rendah. 7. 6. 4. 5. dibuat terlebih dahulu tabel persiapannya sebagai berikut. TABEL PERSIAPAN UNTUK MENGHITUNG VALIDITAS ITEM NOMOR 6 No. 2.6 disebut variabel X dan skor total disebut variabel Y. 3. Nama Hartati Yoyok X 1 0 Y 8 5 . Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi. 2.Di samping mencari validitas soal perlu juga dicari validitas item. Maka skor item no. Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. 1. Contoh perhitungan: TABEL ANALISIS ITEM UNTUK PERHITUNGAN VALIDITAS ITEM No. Nama Hartati Yoyok Oktaf Wendi Diana Paul Susana Helen Butir soal/item 1 1 0 0 1 1 1 1 0 2 0 0 1 1 1 0 1 1 3 1 1 0 0 1 1 1 0 4 0 0 0 0 1 0 1 1 5 1 1 0 1 1 1 1 1 6 1 0 1 1 1 0 1 1 7 1 0 0 0 0 1 1 1 8 1 1 1 0 0 0 0 1 9 1 1 0 1 0 0 0 1 10 1 1 1 0 0 0 0 1 Skor total 8 5 4 5 6 4 7 8 Keterangan: Skor 1 bagi item yang dijawab benar Skor 0 bagi item yang dijawab salah. 1. Dengan kata lain dapat dikemukakan bahwa sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total.

Validitas item tersebut kurang meyakinkan. 8. .75 8  XY  37 sebagai berikut: X t  5.57 q 2  0.3.421.17 Y  46 Y  288 p 6  0.497   Koefisien validitas item nomor 6 adalah 0. Dilihat sepintas bilangan ini memang sesuai dengan kenyataannya. 7. 4.421 47 .25 8 Data dimasukkan ke dalam rumus korelasi product moment dengan angka kasar rXY  N  X N  XY   X Y  2 2   X  N Y 2  Y  2  2  rXY  8  6  6 8  288  46  2 8  37  6  46  297  276 48  36 2304  2116   20 12  188 20 2256 20  0. Oktaf Wendi Diana Paul Susana Helen 1 1 1 0 1 1 3 5 6 4 7 8 Keterangan: X = skor item nomor 6 Y = skor total Dari perhitungan kalkulator diperoleh data sebagai berikut: X 6 2 X 2 6 X p  6. 6. Tentu saja validitasnya tidak tinggi. 5.

75 8 8 atau Mencari Mt  3.8323 . Untuk n kecil. Dari perhitungan diperoleh harga standar deviasi.Masih ada cara lain untuk menghitung validitas item. Mencari Mp  2.7139  n1  1.7139 . Salah satu cara yang terkenal adalah menggunakan rumus  pbi yang rumus lengkapnya adalah sebagai berikut:  pbi  M p  Mt St p q Keterangan:  pbi Mp Mt St p = koefisien korelasi biserial = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnya = rerata skor total = standar deviasi dari skor total = proporsi siswa yang menjawab benar  banyak siswa yang menjawabbenar  p    jumlah seluruh siswa   q = proporsi siwa yang menjawab salah (q = 1 .17 6 6 8  5  3  5  6  4  7  8 46   5. yaitu  n  1. 8  3  5  6  7  8 37   6. diambil standar deviasi yang  n  1.p) Apabila item 6 dicari validitasnya dengan rumus ini maka perhitungannya melelui langkah-langkah sebagai berikut: 1. .

7139  0. 6. Sebuah tes terstandar biasanya memiliki identitas antara lain: sudah dicobakan berapa kali dan di mana. Tes standar sebagai kriterium dalam menentukan validitas Tes terstandar (standardized test) adalah tes yang telah dicobakan berkali-kali sehingga dapat dijamin kebaikannya.89  0. berapa koefisien validitas.7321 1. masih ada lagi yang perlu diketahui validitasnya. yaitu Menentukan harga q.4. daya pembeda dan lain-lain keterangan yang dianggap perlu. Mungkin hal ini disebabkan karena adanya pembulatan angka. Dari tabel sebelumnya.17  5. Menentukan harga p. Cara menentukan validitas soal yang menggunakan tes terstandar sebagai kriterium dilakukan dengan mengalikan koefisien validitas tes terstandar tersebut.42  1. yaitu 0.89 maka bilangan 0. Validitas tersebut harus dikalikan dengan 0. reliabilitas. 6.75 0.25 atau 1  0. taraf kesukaran. yaitu faktor-faktor atau bagian keseluruhan materi.25 8  pbi    M p  Mt St p q 6. Validitas faktor Selain validitas soal secara keseluruhan dan validitas butir atau item. 5.75 8 2  0.75  0. yaitu Memasukkan ke rumus  pbi 6  0. .7139 0.0034.25 0.421 0. jika dari tes terstandar diketahui bahwa validitasnya 0.89 yang hasilnya 0.4244 Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya berbeda tetapi sangat kecil.421 belum merupakan validitas soal mata pelajaran yang dicari. 5.75 1.21449 . Setiap keseluruhan materi pelajaran terdiri dari pokok-pokok bahasan atau mungkin sekelompok pokok bahasan yang merupakan satu kesatuan.

Untuk keperluan ini guru tersebut membuat 30 butir soal. Cara mengetahui kesejajaran tersebut digunakan juga rumus korelasi product moment. himpunan. Harga r yang diperoleh menunjukkan indeks validitas faktor 1. Apabila guru ingin mengetahui validitas faktor. Misalnya kita akan mengetahui validitas factor 1. untuk persamaan linear satu variabel 8 butir. Sebagai tanda bahwa butir-butir faktor tersebut mempunyai dukungan yang besar terhadap seluruh soal. pengertian validitas faktor adalah sebagai berikut: butir-butir soal dalam faktor dikatakan valid apabila mempunyai dukungan yang besar terhadap soal-soal secara keseluruhan. TABEL UNTUK MENGHITUNG KESEJAJARAN SKOR FAKTOR 1 DENGAN SKOR TOTAL Nama subjek Skor faktor 1 Skor faktor 2 (X) Amir Hasan Ninda Warih Irzal Gandi Santo Tini Yanti Hamid 6 7 4 3 8 6 5 7 5 4 (Y) 19 25 17 12 29 23 19 26 16 15 36 49 16 9 64 36 25 49 25 16 361 625 289 144 841 529 361 676 256 225 114 175 68 36 232 138 95 182 80 60 X2 Y2 XY . dan segiempat. untuk himpunan 12 butir. kita bisa membuat tabel kesejajaran skor faktor 1 dengan skor total sama seperti ketika membuat tabel validitas pada item soal.Contoh: Guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahasan. Untuk faktor 2 dan 3 caranya sama. maka ada 3 faktor dalam soal ini.yaitu: persamaan linear satu variabel. Dan kemudian dimasukkan ke dalam rumus korelasi product moment. yakni apabila jumlah skor untuk butir-butir faktor tersebut menunjukkan adanya kesejajaran dengan skor total. dan untuk segiempat 10 butir. Seperti halnya pengertian validitas butir. yakni soal-soal untuk materi persamaan linear satu variabel.

berhubungan dengan masalah ketetapan hasil tes. A reliable measure in one that provides consistent and stable indication of the characteristic being investigated. sebuah tes yang valid biasanya reliabel. sikap. dan reliabilitas ini perlu.Dedi Desi Wahyu Jumlah 7 8 5 75 26 30 20 277 49 64 25 463 676 900 400 6283 182 240 100 1702 7. Dalam hal ini validitas lebih penting. Secara garis besar ada 3 hal yang mempengaruhi hasil tes. kecakapan. Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur kejiwaan manusia itu sendiri tidak ajeg. Sebaliknya. Sebuah tes mungkin reliabel tetapi tidak valid. . bahwa reliabilitas berhubungan dengan masalah kepercayaan. dan sebagainya yang berubah dari waktu ke waktu. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes. yaitu: a. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Konsep reliabilitas Sudah diterangkan dalam persyaratan tes. Sehubungan dengan reliabilitas ini. Scarvia B. Validitas Instrumen Nontes B. yaitu validitas dan reliabilitas ini penting. Maka pengertian reliabilitas tes. karena menyokong terbentuknya validitas. yaitu panjang tes dan kualitas butirbutir solanya. Hal yang berhubungan dengan tes itu sendiri. Reliabilitas Tes 1. Misalnya: kemampuan. Konsep reliabilitas ini tidak akan sulit dimengerti apabila pembaca telah memahami konsep validitas.

Kulaitas butir-butir soal ditentukan oleh: a) Jelas tidaknya rumusan soal b) Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan. penambahan banyaknya butir soal sudah tidak menambah tinggi reliabilitas tes. Tinggi rendahnya validitas menunjukkan tinggo rendahnya reliabilitas tes. dan tenaga yang dikeluarkan untuk itu. Dalam menghitung besarnya reliabilitas yang berhubung dengan penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown. Hal ini disebabkan karena: 1) Sampai pada suatu batas tertentu. Hal yang berhubungan dengan tercoba (testee) Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar kecilnya reliabilitas tes. maka reliabilitasnya semakin tinggi.Tes yang terdiri dari banyak butir lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. b. . Maka semakin panjang tes. biaya. akan menunjukkan reliabilitas yang lebih besardaripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih. Rumusnya adalah: rnn  nr 1  (n  1)r Keterangan: rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru n r = berapa kali butir-butir soal itu ditambah = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah Adakalanya penambahan butir-butir soal tes tidak berarti bahkan adakalanya merugikan. 2) Penambahan tingginyareliabilitas tes tidak sebanding nilainya dengan waktu. Tes yang diobakan kepada bukan kelompok terpilih.

sangat menentukan hasil tes. Hal yang berhubungan dengan penyelenggaraan tes Sudah disebutkan bahwa factor penyelenggaraan tes yang bersifat administratif. Contoh: 1) Petunjuk yang diberikan sebelum tes dimulai. Metode tes ulang (test-retest method) . Kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus menyusun dua seri tes. Cara-cara mencari besarnya reliabilitas Untuk mengetahui ketetapan suatu tes dapat dilihat dari kesejajaran hasil. a. b. tetapi butir-butir soalnya berbeda. akan member ketenangan kepada para tester dalam mengerjakan tes. rumus tersebut juga digunakan menentukan kesejajaran hasil dalam reliabilitas tes. Metode bentuk parallel (equivalent) Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.c. Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu sendiri (consistency internal). dan susunan. ada yang menyebutkan double test-double-trial method. tingkat kesukaran. artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas. dan masing-masing dicobakan pada kelompok siswa yang sama. dan dalam penyelenggaraan tidak akan banyak terdapat pertanyaan 2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes 3) Suasana lingkungan dan tempat tes akan mempengaruhi hasil tes. Dalam menggunakan metode tes parallel ini pengetes harus menyiapkan dua buah tes. Oleh karena itu. Dalam istilah bahasa Inggris disebut alternate-form method (parallel forms). Penggunaan faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect dan carry-over effect. 2.

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. baru diketahui reliabilitas separo tes. Dalam menggunakan metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali. Metode ini juga disebut self-correlation method karena mengkorelasikan hasil dari tes yang sama. dan metode ini sering disebut single-test-double-trial method. Yang terpenting adalah adanya kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi. Metode belah dua (split-half method) Kelemahan penggunaan dua metode sebelumnya dapat diatasi dengan metode ketiga yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown sebagai berikut: r11  2r1 1 2 2 1  r   1 1  2 2  Keterangan: . tetapi kenaikannya dialami oleh seluruh siswa yang dites. Ketika pelaksanaan tes kedua pastilah tampak skornya naik. cara ini kurang mengena karena tercoba akan masih ingat butir-butir soalnya. Kemudian hasil kali tes tersebut dihitung korelasinya. c. tetapi pada waktu membelah dua dan mengkorelasikan dua belahan. Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Tenggang waktu dalam pemberian tes perlu diperhatikan karena factor ini juga mempengaruhi reliabilitas tes. Pada metode belah dua tidak dapat ditafsirkan langsung koefisien korelasinya. Untuk tes yang banyak mengungkap pengetahuan dan pemahaman. Hal ini tidak menjadi masalah karena pengetes harus sadar akan adanya practice effect dan carry over effect. yang biasa disebut single-testsingle-trial method.

5.3 6.10 genap 1.4. Bagi pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah. 3.r1 1 2 2 = korelasi antara skor-skor setiap belahan tes.4.9. 8. 2. = koefisien reliabilitas yang sudah disesuaikan. 8. Contoh perhitungan reliabilitas dengan metode belah dua TABEL ANALISIS ITEM TES MATEMATIKA Nomor item No.8 .6.3. 7.10 Akhir . 5. Ada dua cara membelah butir soal ini yaitu: 1) Membelah atas item-item genap dan item-iten ganjil yang disebut belahan ganjil-genap 2) Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor awal dan separo pada nomor-nomor akhir yang disebut belahan awal-akhir.7. Nama 1.2. Yang perlu diperhatikan adalah dalam membelah item atau butir soal bukan mengelompokkan separo hasil peserta tes dan separo yang lain kemudian mengkorelasikannya. 4.9 1 2 3 4 5 6 7 8 9 10 Skor total 1.5 awal . Hartati 1 0 1 0 1 1 1 1 1 Yoyok Oktaf Wendi Diana Paul Susan Helen 0 0 1 0 1 0 0 1 1 0 1 0 0 0 1 0 1 0 1 1 0 0 1 1 0 0 1 1 1 1 1 1 1 0 0 0 1 0 1 0 1 0 1 0 0 1 1 1 1 1 1 1 0 0 0 1 0 1 1 1 1 1 1 1 1 1 0 0 0 0 1 8 5 4 5 6 4 7 8 5 3 0 3 3 4 4 5 3 2 4 2 3 0 3 5 3 2 1 3 5 3 5 3 5 3 3 2 1 1 2 5 ganjil 2. 7. r11 Banyak pemakai metode ini salah membelah hasil tes pada waktu menganalisis. 6.

7.1) Pembelahan ganjil-genap Item ganjil No.7.3. 2. 5. 7.2. 6. 8.8. 7. 5.10) (Y) 3 2 4 2 3 0 3 5 2) Pembelahan awal-akhir Item awal No. Nama (1.6.9) (X) 1. 4. 3. 2.10) (Y) 5 3 3 2 1 1 2 5 3) Penggunaan rumus Flanagon 2  S12  S 2  1   r11  2 2  St   .5) (X) 1.4. Hartati Yoyok Oktaf Wendi Diana Paul Susan Helen 5 3 0 3 3 4 4 5 Item genap (2.8. 6. Nama (1.9.4. 3. 8.5. Hartati Yoyok Oktaf Wendi Diana Paul Susan Helen 3 2 1 3 5 3 5 3 Item akhir (6. 4.3.

Keterangan: r11 = reliabilitas tes S12 = varians belahan pertama (varian skor item ganjil) S 22 = varians belahan kedua (varians skor item genap) S t2 = varians total yaitu varians skor total 4) Penggunaan rumus Rulon 2 Sd r11  1  2 St Keterangan: S d2 = varians beda d = difference yaitu prebedaan antara skor belahan pertama dengan skor belahan kedua 5) Penggunaan rumus K-R. 20 2  n  S   pq   r11     S2  n  1    Keterangan: r11 = reliabilitas tes secara keseluruhan p q = proporsi subjek yang menjawab item dengan benar = proporsisubjek yang menjawab item dengan salah (q=1-p) .

56 (dicari dengan kalkulator) .3 5 1 1 1 1 1 1 1 1 1 1 10 1 0 0 6 1 1 0 1 0 0 1 0 0 0 4 0. 20 2  n  S   pq    r11     n  1  S2    7 1. 3.16 0. 2. 20 No. 1. 20 (biasa digunakan dalam kasus pilihan ganda) : Tabel perhitungan mencari reliabilitas tes dengan K-R. 10.8 2 0 1 0 1 0 1 0 1 1 0 5 0.31   6 1.5 0.7 0. pq = jumlah hasil perkalian antara p dan q n S = banyaknya item = standar deviasi dari tes (akar dari varians) Contoh penggunaan rumus K-R.5 3 1 1 0 1 0 1 0 0 0 0 4 0.24 0. 6.6 4 1 0 0 1 0 1 1 1 1 1 7 0.21 Kemudian hasil dari tabel disubstitusikan ke dalam rumus K-R. 8. 5.24 0.36 2 S = 1.2 0.21 0.4 0. 4.25 0.7 1.6 7 0 1 1 1 0 0 0 0 0 0 3 0. 9.3 0.36 2  1. Nama Wardoyo Benny Hanafi Rahmand Tanti Nadia Tini Budi Daron Yakub Np p q pq Nomor item 1 1 0 0 0 1 0 0 0 0 0 2 0. 7.31 Skor total 5 5 2 6 2 4 3 3 3 2 35 0.4 0.

54 1.85  1.17  1. 1.17  0.85 0. Jadi reliabilitas tes tersebut adalah 0.31 1. 21  n  M (n  M )   r11   1  2  nSt  n  1    Keterangan: M = mean atau rerata skor total 7) Penggunaan rumus Hoyt r11  1  Vs Vr atau r11  Vr  Vs Vr keterangan: r11 = reliabilitas seluruh soal Vr = varians responden Vs = varians sisa Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut: (1) Mencari jumlah kuadrat responden (2) Mencari jumlah kuadrat item (3) Mencari jumlah kuadrat total .342.29  0.342. 6) Penggunaan rumus K-R.3415 Dibulatkan menjadi 0.85  1.17   1.

Nama Hana Isna Inay Tia Nomor item 1 10 6 8 7 2 6 4 2 3 3 8 4 6 7 4 8 6 8 7 5 10 6 7 6 6 10 5 8 6 Skor total 52 31 39 36 Kuadrat skor total 2704 961 1521 1296 . tetapi butir soal nomor 2 nilai tertinggi hanya 5. Skor untuk masing-masing butir soal dicantumkan pada kolom item menurut apa adanya. dan butir soal nomor 3 sampai 10. 3. 4. dan sebagainya. Rumus yang digunakan adalah rumus alpha sebagai berikut: 2  n    i  1   r11    n  1   t2     Keterangan: r11 = reliabilitas yang dicari 2 i   t2 = jumlah varians skor tiap-tiap item = varians total Contoh perhitungan mencari reliabilitas pada soal uraian: TABEL ANALISIS ITEM No. Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif. Mencari reliabilitas tes bentuk uraian Menilai soal bentuk uraian tidak dapat dilakukan dengan pemberian nilai “benar” atau “salaah”. 1. 2. Suatu butir soal uraian menghendaki gradualisasi penilaian.(4) Mencari jumlahkuadrat sisa (5) Mencari varians responden dan varians sisa dengan tabel F (6) Memasukkan ke dalam rumus r11 3. Barangkali butir soal nomor 1 penilaian terendah 0 tertinggi 8.

8.61 10 10 10 Varians untuk item no.36 10 10 10 Varians untuk item no. dicari varians tiap-tiap item dahulu baru dijumlahkan.1  1.4  33. 3:  2 ( 3)  264  482 10  264  230.5.9  16.6  3. 4:  2 ( 4)  418  622 10  418  384. Ingat rumus varians. 9. 7.6  3. 5: . 6.36 10 10 10 Varians untuk item no.8  10 10 10 Varians untuk item no. yaitu:   2 X 2  X   N N 2 atau  t 2 X  N 2 t  X   t 2 N Varians untuk item no.1:  2 (1) 502 328  10  328  250  78  7.2:  2 ( 2)  201  432 10  201  184.4  33. 10. Resti Rika Ani Sita Tami Alfi 0 2 4 5 5 3 50 5 4 3 5 5 6 43 3 2 6 5 4 3 48 2 8 6 7 6 4 62 4 6 6 7 8 6 66 4 8 6 7 5 6 65 18 30 31 36 33 28 334 2120 324 900 961 1296 1089 784 11836 Jumlah Jumlah kuadrat 328 201 264 418 458 451 Dengan data yang tertera dalam tabel.

6:  2 (6) 652 451  10  451  422.4  2. Bagi mahasiswa yang menulis skripsi dan ingin menguji reliabilitas angket yang digunakan untuk mengumpulkan data. Kesalahn fatal yang sering kita jumpai adalah penggunaan teknik belah dua untuk menghitung reliabilitas angket. antara lain bahwa belahan pertama dengan belahan kedua yang dicari kesejajarannya harus seimbang.24 10 10 10 Varians untuk item no.36  2. 2 ( 5)  458  662 10  458  435. . sebaliknya hasil tersebut dikonsultasikan dengan tabel r product moment.5  28.61  3.24  2. Lebih sempurnanya penghitungan reliabilitas sampai pada kesimpulan.312)   0. Kesalahan pengukuran Baku (standart error of measurement) Kesalahan pengukuran baku berkaitan dengan nilai skor tes pada kelompok tertentu.688  0.4  68.85  10 10 10 Jumlah varians semua item  2 i  7.5  2. C. Dalam menggunakan teknik belah dua.22  6 r11      (1  0.22 t2  11836  3342 10  11836  11155.04 10 10 10 Kemudian dimasukkan ke dalam rumus alpha 6  6  21.04  5 Dengan diperolehnya koefisien korelasi yakni r11 sebenarnya baru diketahui tinggi rendahnya koefisien tersebut.85  21. SEM mengukur variabel kesalahan dari sebuah pengukuran dan secara langsung berhubungan dengan kesalahan variansi skor.8  1.8256 1  5  6  1  68. rumus alpha ini dapat juga diterapkan. peneliti harus selalu ingat persyaratannya.36  3.6  680.6  22.

Jadi semakin tinggi nilai reliabilitas pada suatu instrument baik tes maupun nontes. Jika tes reliabilitas sama dengan 0. jika tes reliabilitasnya +1.Rumus yang digunakan dalam kesalahan pengukuran baku adalah: 2 SEM  SE  S x (1  rxx )  S x (1  rxx ) Keterangan: SEM / SE Sx2 Sx = Standar Error Measurment = varians = akar varians / standar deviasi Selain itu. kesalahan pengukuran baku berhubungan dengan nilai reliabilitas yang ada.Begitu pula sebaliknya. . maka kesalahan pengukuran baku sama dengan standart deviasinya. kesalahan pengukuran bakunya sama dengan 0.00 merupakan kemungkinan terbesar. maka semakin rendah tingkat kesalahan dalam pengukuran.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->