You are on page 1of 5

Reliabilitas

Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang
dinilainya. Artinya, kapan pun alat penilaian tersebut digunakan akan memberikan hasil yang
relatif sama.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil
pada saat yang berlainan waktunya terhadap siswa yang sama. Misalnya siswa kelas V pada hari
ini dites kemampuan matematiknya. Minggu berikutnya siswa tersebut dites kembali. Hasil dari
kedua tes relatif sama. Sungguh pun demikian, masih mungkin terjadi ada perbedaan hasil untuk
hal-hal tertentu akibat faktor kebetulan, Selang waktu, atau terjadinya perubahan pandangan
siswa terhadap soal yang sama. Jika ini terjadi, kelemahan terletak dalam tes itu, yang tidak
memiliki kepastian jawaban atau meragukan siswa. Dengan kata lain, derajat reliabilitasnya
masih rendah.
Di lain pihak perbedaan hasil penilaian bukan disebabkan oleh alat penilaiannya, melainkan oleh
kondisi yang terjadi pada diri siswa. Misalnya fisik siswa dalam keadaan sakit pada waktu tes
yang pertama, motivasi pada waktu tes pertama berbeda dengan motivasi tes pada berikutnya.
Atas dasar itu perbedaan hasil penilaian pertama dengan hasil penilaian berikutnya bisa terjadi
akibat perubahan pada diri subjek yang dinilai dan atau oleh faktor yang berkaitan dengan
pemberian tes itu sendiri. Hal ini tidak mengherankan dan sudah umum terjadi, yang sering
dinyatakan dengan istilah kesalahan penilaian. Ini berarti, skor hasil penilaian yang pertama dan
skor hasil penilaian kedua terhadap subjek yang sama, terjadi kesalahan pengukuran yang
dimungkinkan oleh kedua faktor di atas. Oleh karenanya, setiap skor hasil penilaian
menghasilkan dua bagian, yakni hasil penilaian pertama yang disebut skor sejati dan hasil
penilaian berikutnya terhadap subjek yang sama, yang mengandung hasil skor plus kesalahan
penilaian.
Indeks reliabilitas alat penilaian dapat dicari dengan mengorelasikan skor-skor yang diperoleh
dari hasil penilaian yang berulang-ulang pada waktu yang berbeda atau dengan kelompok
pertanyaan yang sepadan. Prosedur ini dilakukan dengan cara memberikan tes dua kali kepada
subjek yang sama pada waktu yang berbeda. Cara kedua adalah membagi tes menjadi dua bagian
yang sama atau yang setaraf untuk melihat keajegan tes tersebut. Cara yang pertama dikenal
dengan tes ulang (retest) dan cara kedua dikenal dengan pecahan sebanding atau setara.
Suatu tes dapat dikatakan baik bilamana tes tersebut memiliki ciri sebagai alat ukur yang baik.
Kriterianya antara lain :
Memiliki validitas yang cukup tinggi,
Memiliki reliabilitas yang baik,
Memiliki nilai kepraktisan.
Validitas dan reliabilitas akan diuraikan secara mendalam pada bagian ini; sedangkan mengenai
kepraktisan hanya akan disinggung sedikit.
Tes memiliki sifat kepraktisan artinya praktis dari segi perencanaan, pelaksanaan penggunaan
tes, dan memiliki nilai ekonomik, di samping masih harus mempertimbangkan kerahasiaan tes.
Jangan sampai hanya atas dasar murahnya dan mudahnya pengolahan hasil sampai
mengorbankan prinsip utamanya yakni validitas dan reliabilitasnya.

Validitas Tes
Pengertian Validitas
Validitas sering diartikan dengan kesahihan, sedangkan reliabilitas diartikan dengan
keterandalan. Suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya layak
mengukur obyek yang seharusnya diukur dan sesuai dengan kriteria tertentu. Artinya adanya
kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Bilamana alat ukur tidak memiliki validitas yang dapat dipertanggungjawabkan, maka data yang
masuk juga sis dan kesimpulan yang ditarik juga menjadi salah.
Adapun jenis validitas tes secara umum dapat dikelompokkan ke dalam tiga pengelompokan,
yaitu :
Validitas konstruksi,
Validitas isi, dan
Validitas kriteria, yang meliputi :
Validitas pengukuran setara
Validitas pengukuran serentak
Validitas prediktif.

Hubungan Antara Validitas dengan Reliabilitas


Umumnya orang berpendapat bahwa validitas mempunyai hubungan proporsional dengan
reliabilitas. Orang menduga bahwa semakin valid suatu tes, semakin reliabel dan sebaliknya.
Dugaan itu tidak sepenuhnya salah, tetapi juga tidak sepenuhnya betul (Noeng Muhadjir,
1984:56).
Ada kemungkinan hubungan antara validitas reliabilitas itu bersifat independent, bebas satu
sama lain dan dapat pula bersifat detrimental.
Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internal rendah, tetapi
mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogen mungkin sekali
mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya dengan menambah item tanpa
menambah varians menambah varians dalam faktor umum yang tidak bersangkutan dengan
kriteria.
Tujuan validitas dan reliabilitas seringkali bersilangan. Bila kita ingin mempunyai suatu tes
reliabel sekaligus valid dengan koefisien tinggi, sering kita mengerjakan pekerjaan yang
mempunyai tujuan bersilangan. Reliabilitas maksimal membutuhkan interkorelasi tinggi antar
item, sedangkan validitas prediktif yang maksimal memerlukan interkorelasi antar item rendah.
Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkan validitas
prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlu kompromi.
Bila kita ingin mempertinggi reliabilitas suatu tes dan sekaligus mempertinggi validitas, cara
yang dapat ditempuh adalah menambah varians faktor umum (Noeng Muhadjir, 1984:56-57).
Namun jika langkah ini kita ambil, sebaiknya diperhitungkan apakah penambahan faktor umum
ini dapat terjangkau oleh peserta didik. Oleh karena itu perlu dalam penentuan perencanaan,
terutama dalam penyusunan kisi-kisi tes, faktor umum yang akan diperbanyak itu diperhitungkan
juga jangan terlalu keluar dari program dan proses pendidikan sebelumnya.

Reliabilitas Tes
Pengertian Reliabilitas
Reliabilitas sering diartikan dengan keterandalan. Artinya suatu tes memiliki keterandalan
bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian
reliabilitas dapat pula diartikan dengan keajegan atau stabilitas.
Reliabilitas diartikan dengan keajegan bilamana tes tersebut diujikan berkali-kali hasilnya relatif
sama, artinya setelah hasil tes pertama dengan tes berikutnya dikorelasikan terdapat hasil yang
signifikan. Di samping itu dapat diketahui dengan jalan menggunakan dobel tes, artinya disusun
dua buah tes yang parallel, kemudian keduanya diujikan dan hasilnya dikorelasikan. Bila kedua
hasil tersebut menunjukkan korelasi positif dan signifikan, maka tes tersebut memiliki keajegan.
Reliabilitas diartikan dengan stabilitas bilamana tes itu diujikan dan hasilnya diadakan analisis
reliabilitas dengan menggunakan kriteria internal dalam tes tersebut. Cara untuk mengetahui
koefisien stabilitas ini adalah dengan beberapa rumus yang seluruhnya cukup menggunakan satu
tes dengan sekali diujikan kepada siswa.

Teknik Pengujian Reliabilitas Tes Hasil Belajar


Sebagaimana telah dikemukakan dalam pembicaraan terdahulu, dalam fungsinya sebagai alat
pengukur hasil belajar, tes hasil belajar dapat dibedakan menjadi dua golongan, yaitu: tes hasil
belajar bentuk uraian yang dikenal dengan istilah essay test atau subyektif test, dan tes hasil
belajar bentuk obyektif yang dikenal dengan istilah obyektif test atau new type test.
Sehubungan dengan itu maka dalam pembicaraan mengenai cara menentukan reliabilitas tes
hasil belajar, pertama-tama akan dikemukakan tentang cara menentukan reliabiitas tes hasil
belajar bentuk uraian dan setelah itu akan disusul dengan pembicaraan mengenai cara-cara
menentukan reliabilitas tes hasil belajar bentuk obyektif.
Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Uraian
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf
pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum,
pada umumnya orang menggunakan sebuah rumus yang dikenal dengan nama Rumus Alpha.
Adapun rumus alpha dimaksud adalah:
r11¬ = (n/(n-1))(1-(∑▒s_i^2 )/(s_t^2 ))
di mana : r11 = Koefisien reliabilitas tes
n = Banyaknya butir item yang dikeluarkan dalam tes
1 = Bilangan konstan
∑▒s_i^2 = Jumlah varian skor dari tiap-tiap butir item
s_t^2 = Varian total
dengan penjelasan lebih lanjut, bahwa :
∑▒s_i^2 dapat diperoleh dengan menggunakan rumus seperti tertera di bawah ini. Misalkan tes
uraian yang akan ditentukan reliabilitasnya terdiri dari 5 butir item, maka ∑▒s_i^2 dapat
diperoleh dengan jalan menjumlahkan varian dari item nomor 1 sampai dengan item nomor 5 :
∑▒s_i^2 = s_i1^2 + s_(i2 )^2+ s_i3^2 + s_i4^2 + s_i5^2
Sedangkan s_i1^2 , s_i2^2 , s_i3^2 , s_i4^2 , dan s_i5^2 itu sendiri, dapat diperoleh dengan
menggunakan rumus sebagai berikut:
S_i1^2 = (〖ΣX〗_(i1 )^2- (〖ΣX〗_i1/N)2)/N
S_i2^2 = (〖ΣX〗_(i2 )^2- (〖ΣX〗_i2/N)2)/N
S_i3^2 = (〖ΣX〗_(i3 )^2- (〖ΣX〗_i3/N)2)/N
Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif
Berbeda dengan tes hasil belajar bentuk uraian, maka pàda tes hasil belajar bentuk obyektif
penentuan reliabiitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan. Ketiga
macam pendekatan dimaksud adalah: (1) Pendekatan Single Test-Single Trial (Single Test-
Single Trial Method), (2) Pendekatan Test-Retest (Single Test-Double Trial Method), dan (3)
Pendekatan Alternate Form (Double Test- Double Trial Method).
Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif dengan Menggunakan Pendekatan
Single Test-Single Trial (Single Test-Single Trial Method)
Dalam rangka menentukan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan
pendekatan single test-single trial, maka penentuan reliabilitas tes tersebut dilakukan dengan
jalan melakukan pengukuran terhadap satu kelompok subyek, di mana pengukuran itu dilakukan
dengan hanya menggunakan satu jenis alat pengukur.
Pendekatan Single Test-Single Trial dengan Menggunakan Formula Rulon
Berbeda dengan formula Spearman-Brown dan formula Flanagan, menurut Rulon, petunjuk
tentang tinggi rendahnya reliabiitas tes itu dapat diperoleh lewat perbedaan antar skor-skor yang
berhasil dicapai oleh testee pada belahan I dengan belahan II. Perbedaan skor-skor antara
belahan I dengan belahan II dilambangkan dengan huruf d (singkatan dari difference), di mana d
= (X - Y).
Rumus yang dikemukakan oleh Rulon untuk mencari Koefisien Reliabilitas Tes (r11) adalah
sebagai berikut:
r11 = 1- (s_d^2)/(s_t^2 )
dimana :
r11 = Koefisien reliabilitas tes
1 = Bilangan konstan
s_d^2 = Varian perbedaan antarskor yang dicapai oleh testee pada belahan I dengan skor yang
dicapai oleh testee pada belahan II
s_t^2 = Varian total

Mengukur Reliabilitas dengan Rumus Alpha


Rumus lain yang dapat dipakai untuk mengukur homogenitas tes adalah rumus Alpha. Menurut
Cronbach, rumus Alpha dapat digunakan untuk mengukur reliabilitas tes yang menggunakan
skala Likert (skala sikap), tes yang menggunakan bentuk esai, sehingga pengukurannya tidak
hanya menggunakan skor benar = 1 dan salah = 0, seperti pada tes obyektif, melainkan dapat
menggunakan skor atau skala 1-9; 1-10 dan sebagainya.
Cara yang diternpuh untuk mengetahui tingkat reliabilitas tes ini adalah dengan jalan mencari
varians pada tiap-tiap butir dan varians pada skor totalnya, baru dikalikan dengan proporsi item.
Dilihat dari segi ketelitiannya dan pola kerjanya rumus ini mirip dengan rumus K-R.20. Karena
rumus ini banyak menggunakan perhitungan untuk mencari varians pada masing-masing item,
maka para mahasiswa diminta agar mengikuti langkah demi langkah dengan teliti.
Adapun rumus Alpha itu sendiri adalah:
r11 = {k/(k-1)}{1- (〖SD〗_b^2)/(〖SD〗_t^2 ) }
Keterangan:
〖SD〗_b^2 = jumlah varians (standar deviasi kuadrat butir)
Adapun langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini adalah:
menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila di belah jumlahnya
sama.
mengujikan tes tersebut pada satu sampel.
menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat dikelompokkan
skor ganjil dan genap; dapat pula dikelompokkan skor belahan atas dan skor belahan bawah.
mencari reliabilitas setengah tes, dengan jalan mengkorelasikan kedua skor tersebut dengan
rumus Product Moment, atau mencari deviasi pada belahan ganjil genap.
mencari reliabilitas satu tes penuh dengan menggunakan rumus Spearman Brown atau rumus
lainnya?
Beberapa rumus untuk mencari tingkat reliabilitas yang menggunakan teknik belah dua adalah:
Rumus Spearman Brown
Rumus Flanagan
Rumus Rulon.


BAB III
PENUTUP
Kesimpulan
Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang
dinilainya. Validitas sering diartikan dengan kesahihan, sedangkan reliabilitas diartikan dengan
keterandalan.
Adapun jenis validitas tes secara umum dapat dikelompokkan ke dalam tiga pengelompokan,
yaitu :
Validitas konstruksi,
Validitas isi, dan
Validitas kriteria, yang meliputi :
Validitas pengukuran setara
Validitas pengukuran serentak
Validitas prediktif.
Ada kemungkinan hubungan antara validitas reliabilitas itu bersifat independent, bebas satu
sama lain dan dapat pula bersifat detrimental.
Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internal rendah, tetapi
mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogen mungkin sekali
mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya dengan menambah item tanpa
menambah varians menambah varians dalam faktor umum yang tidak bersangkutan dengan
kriteria.
Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh seorang staf
pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi ataukah belum,
pada umumnya orang menggunakan sebuah rumus yang dikenal dengan nama Rumus Alpha.
Berbeda dengan tes hasil belajar bentuk uraian, maka pàda tes hasil belajar bentuk obyektif
penentuan reliabiitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan. Ketiga
macam pendekatan dimaksud adalah: (1) Pendekatan Single Test-Single Trial (Single Test-
Single Trial Method), (2) Pendekatan Test-Retest (Single Test-Double Trial Method), dan (3)
Pendekatan Alternate Form (Double Test- Double Trial Method).
Beberapa rumus untuk mencari tingkat reliabilitas yang menggunakan teknik belah dua adalah:
Rumus Spearman Brown
Rumus Flanagan
Rumus Rulon.

You might also like