You are on page 1of 8

INSTRUMEN PENGUKURAN HASIL BELAJAR

Oleh: Dr.Yusrizal, M.Pd



Di dalam proses belajar mengajar selalu diperlukan adanya pengukuran hasil belajar
peserta didik untuk menentukan sejauh mana peserta didik telah mencapai tujuan-tujuan
pembelajaran yang telah ditentukan. Guru sebagai pengelola proses tersebut perlu dengan
sendirinya mengetahui dan menguasai cara-cara penyusunan dan pemakaian instrumen-
instrumen (alat ukur-alat ukur) yang dapat dipakai untuk pengukuran hasil belajar ini.
Sehubungan dengan itu guru perlu mengetahui prinsip-prinsip umum di dalam melaksanakan
pengukuran yaitu:
1. Di dalam pengukuran pertama-tama harus ditentukan dan dijelaskan apa yang akan
diukur. Sebelum suatu instrumen pengukuran disusun atau dipilih , harus ditetapkan
secara jelas apa kegunaan pengukuran itu, jadi apa yang akan diukur. Karenanya perlu
adanya deskripsi yang jelas tentang karakteristik atau tingkahlaku yang akan diukur.
2. Teknik pengukuran harus dipilih berdasarkan kegunaan pengukuran. Apabila suatu
aspek tingkahlaku peserta didik yang akan diukur telah ditentukan secara jelas maka
akan dapat dipilih teknik pengukuran yang sesuai untuk mengukur tingkahlaku tersebut.
Seringkali dipilih suatu teknik pengukuran berdasarkan ketelitian yang dapat dicapai
dengan instrumen, keobjektivan hasil pengukuran, atau kemudahan pengukuran
tersebut dilaksanakan. Semua kriteria ini memang penting tetapi masih kalah penting
dibandingkan dengan kriteria utama ialah apakah teknik pengukuran itu masih
merupakan cara yang paling efektif untuk menentukan apa yang ingin diketahui tentang
subjek yang akan diukur karakteristiknya.
Tiap-tiap teknik pengukuran dapat sesuai dengan tujuan tertentu, dan tidak
memadai untuk tujuan lain. Kesesuaian inilah yang harus merupakan kriterion utama
dalam pemilihan tekni dan instrument yang akan digunakan. Sebagai contoh misalnya
adalah pertanyaan yang seringkali timbul di masyarakat: Apakah guru harus memakai
tes yang bersifat obyektif atau tes esai untuk mengukur hasil belajar peserta didik ? Tes
obyektif memang sangat efektif untuk mengukur bentuk hasil belajar tertentu.
Pertanyaan disini ialah bukan apakah teknik pengukuran ini yang perlu di[pakai, tetapi
kapan teknik itu dapat dipakai?
3. Penilain yang komprehensif memerlukan adanya sistem gabungan macam-macam
teknik pengukuran. Untuk mengukur hasil belajar peserta didik di dalam pelajaran fisika
misalnya, tidak hanya cukup apabila sebagai instrumen pengukuran dipakai suatu tes
obyektif yang dapat mengukur pengetahuan faktual tetapi tidak dapat menunjukkan
sejauh mana pelajaran telah dapat mengembangkan peserta didik untuk berfikir kritis,
atau ketrampilan motorik, bagaimana pelajaran itu telah merubah sikap peserta didik,
dan sebagainya. Untuk itu semua diperlukan instrument-instrumen lain seperti checklist
atau rating scale, kuesioner, dan sebagainya.
4. Pemakaian yang tepat dari teknik-teknik pengukuran memerlukan adanya kesadaran
bahwa masing-masing teknik tersebut mempunyai keterbatasan maupun
keunggulannya.
5. Perlu diingat bahwa bagaimanapun bagusnya suatu instrumet yang dipakai selalu
terdapat kesalahan-kesalahan di dalam pengukuran. Pertama ialah kesalahan di dalam
pengambilan sampel tingkahlaku yang akan diukur. Apakah alat ukur atau tes yang
disusun untuk suatu keperluan memang telah secara meyakinkan akan dapat mengukur
kemampuan tertentu peserta didik ? Apakah memang observasi yang dilakukan
menunjukkan tingkahlaku peserta didik yang khas?
Sumber kesalahan kedua terdapat di dalam instrument itu sendiri atau di dalam proses
penggunaannya. Misalnya skor yang diperoleh peserta didik di dalam ujian dengan tes
obyektif dapat saja diperoleh dengan jalan menebak, atau skor pada tes esai dapat saja
dipengaruhi oleh subjektivitas penilai.
Sumber utama kesalahan yang dapat terjadi adalah karena interpretasi yang tidak benar
tentang hasil/data pengukuran yang diperoleh. Perlu diingat bahwa perbedaan satu
atau dua angka yang diperoleh peserta didik dapat terjadi karena kesalahan yang tidak
disengaja, karenanya hasil yang diperoleh harus diinterpretasikan secara hati-hati pula.
Dengan mengetahui adanya keterbatasan-keterbatasan yang ada pada instrumen
pengukuran maka guru akan dapat menggunakannya secara hati-hati serta lebih efektif.
Instrumen Pengukuran Hasil Belajar
Hasil belajar peserta didik di berbagai kawasan belajar dapat diukur dengan
menggunakan bermacam-macam instrument, tergantung dari apa yang akan diukur. Di
bawah ini terdapat contoh kawasan belajar dan instrumen yang dapat dipakai untuk
mengukur hasil belajar di kawasan tersebut (Thorndike & Hagen, 1977):
Kawasan Belajar Instrumen Pengukuran
------------------------ ---------------------------------
Kognitif tes a. pilihan ganda
b. esai
c. penjodohan
d. betul salah
e. pengisian

Psikomotorik tes tertulis
Laporan
Lembaran observasi
Daftar check/rating scale
Lembaran kerja

Afektif kuesioner
Lembaran penilaian diri
Skala sikap
Lembaran observasi

Dari apa yang tertulis di atas terlihat bahwa untuk mengukur hasil belajar seorang siswa
tertentu dapat dan perlu dipakai lebih dari satu instrumen apabila diinginkan adanya informasi
yang bersifat komprehensif. Untuk mengukur hasil belajar siswa di dalam pelajaran fisika
misalnya, tidak hanya cukup apabila dipakai suatu tes tertulis yang hanya mengukur
pengetahuan yang bersifat faktual saja tetapi tidak menunjukkan sejauh mana pelajaran
tersebut telah dapat mengembangkan siswa untuk berfikir analisis/kritis, atau sejauh mana
ketrampilan motorik siswa, atau sejauh mana pelajaran tersebut telah dapat merubah sikap
atau minat peserta didik. Untuk mengungkapkan itu semua diperlukan beberapa bentuk
instrumen pengukuran, karena tiap-tiap instrumen hanya mampu menghasilkan satu bentuk
informasi tertentu yang sifatnya unik dan hanya terbatas pada satu aspek tingkah laku atau
karakteristik saja.
Di samping itu pemilihan instrument yang akan dipakai tergantung kepada beberapa
karakteristik instrument yang tidak boleh diabaikan yaitu 1) validitas, 2) reliabilitas, dan 3)
kemudahan di dalam pemakaian.

Validitas
Informasi yang diperoleh tentang validitas menunjukkan sejauh mana hasil atau skor
yang diperoleh pada pengukuran dapat diinterpretasikan sebagai tingkahlaku atau karakteristik
yang diukur. Untuk menentukan sejauh mana suatu instrumen dapat dipakai, diperlukan adanya
informasi tentang validitas instrument. informasi ini tergantung pada tujuan pengukuran, bukan
pada macam instrumen. Ketiga aspek validitas yang sesuai untuk itu adalah: 1) validitas isi, 2)
validitas kriteria, dan 3) validitas konstruk (Kerlinger, 1996) .

1). Validitas isi
Validitas ini terutama dipakai untuk instrumen pengukur hasil belajar, dan
mrenyangkut isi/topik suatu bidang studi maupun tujuan-tujuan pembelajaran atau
tingkah laku yang diharapkan dapat dilakukan oleh siswa. Untuk menentukan validitas
isi dibuat kisi-kisi sebelum instrumen pengukuran disusun. Topik-topik dan tingkah laku
yang diharapkan dinyatakan di dalam kisi-kisi dan diberi bonbot berdasarkan pentingnya
topik/tingkah laku tersebut.

2) validitas kriterion
Validitas berdasarkan kritrion dapat diartikan sebagai sejauhmana
hubungan skor yang diperoleh seseorang di dalam suatu pengukuran dengan
menggunakan suatu instrumen dengan hasil pengukuran sebagai patokan, baik
di masa yang akan datang (validitas prediktif) maupun sekarang (validitas konkuren).
Perbedaan antara kedua macam validitas ini ialah: pada penentuan validitas
konkuren kedua pengukuran dilaksanakan secara simultan dalam waktu
yang bersamaan, sedang pada penentuan validitas prediksi kedua pengukuran
dilaksanakan dengan interval waktu yang cukup lama.

Validitas konkuren
Pengukuran waktu/sama kriteria

Validitas prediksi
Pengukuran waktu/lama kriteria

Cara penentuan kriterion ialah dengan jalan mengukur korelasi kedua skor yang
diperoleh pada pengukuran dengan instrument dan skor pada pengukuran
kriterion.Validitas ini dapat diinterpretasikan dalam bentuk koefisien korelasi: makin
tinggi korelasi, makin tinggi validitas

3) validitas konstruk
Validitas konstruk dapat diartikan sebagai sejauh mana hasil yang diperoleh pada
pengukuran dapat diinterpretasikan sebagai suatu konstriuk (Gronlund, 1985). Terdapat
beberapa cara yang dapat dipakai untuk menentukan validitas konstruk,, diantaranya (a)
korelasi dengan hasil-hasil pengukuran dengan instrumen lain yang diketahui mengukur
konstruk yang sama, (b) korelasi skor butir dengan skor total, dan (c) teknik analisis
factor.

Reliabilitas
Reliabilitas suatu pengukuran dengan memakai suatu instrument menunjukkan
ketepatan dan ketelitian yang dapat dicapai pada pengukuran dengan menggunakan instrumen,
sehingga hasil yang diperoleh bersifat konsisten. Indeks reliabilitas dinyatakan dalam bentuk
koefisien korelasi atau koefisien reliabilitas, yang dapat diartikan sebagai korelasi antara dua
set skor yang diperoleh dalam pengukuran pada subyek yang sama. Indeks ini disebut juga
indeks konsistensi pengukuran, dan menyatakan sejauh mana konsistensi yang dapat diperoleh
pada hasil pengukuran dengan memakai suatu instrumen tertentu.
Banyak metode yang dapat dipilih untuk menguji reliabilitas. Metode-metode itu secara
garis besar dapat dikelompokkan menjadi menjadi dua kelompok berdasarkan perbedaannya
dalam mendefinisikan reliabilitas. A) Reliabilitas adalah kestabilan hasil pengukuran apabila
instrumen diujikan beberapa kali (external stability). Reliabilitas sebagai stabilitas eksternal ini
memandang bahwa instrumen dikatakan reliabel apabila diujikan beberapa kali akan
memberikan hasil pengukuran yang relatif konsisten. Tergolong dalam kelompok ini adalah
metode tes ulang dan metode paralel. B) Reliabilitas merupakan konsistensi internal hasil
pengukuran butir-butir instrumen. Instrumen dikatakan reliabel apabila di antara butir instrumen
memberikan hasil pengukuran yang konsisten (internal consistency). Metode dalam kelompok
ini dapat dibagi menjadi dua berdasarkan jumlah butirnya. Apabila jumlah butir genap maka
metode dapat menggunakan metode belah dua, Spearman-Brown, Flanagan atau Rulon,
sedang bila jumlah butir ganjil maka metode yang dapat digunakan adalah metode Kuder-
Richardson, atau Alpha Cronbach.
A. Reliabilitas merupakan koefisien stabilitas eksternal
Beberapa metode pengujian reliabilitas yang memandang bahwa reliabilitas
merupakan koefisien stabilitas eksternal adalah metode tes ulang dan paralel.

1) Metode uji-ulang (test-retest method))
Disini instrumen yang sama diberikan dua kali kepada subyek yang sama,
kemudian dihitung korelasi antara kedua skor yang diperoleh.

Pengukuran I waktu pengukuran II

Interval waktu disini dapat berkisar antara beberapa menit sampai beberapa minggu
Koefisien reliabilitas pengukuran ulang dihitung dengan rumus:

Keterangan :
X = skor butir belahan pertama
Y = skor butir belahan kedua
N = jumlah responden
2) Metode parallel (equivalent / alternate form)
Metode paralel dipilih apabila tidak diinginkan mengujikan dua kali Di sini dua
instrumen yang sama diberikan kepada subjek sekaligus, kemudian koefisien reliabilitas
dihitung dengan mengkorelasikan perolehan skor subjek dari kedua instrumen.
Walaupun instrumennya terdiri dari dua macam, namun hakikat isinya mengukur hal
yang sama dan nstrumen ini keduanya harus sama. Karenanya, perlu diperhatikan
bahwa kedua instrumen tersebut haruslah dikembangkan dari spesifikasi yang sama.

Pengukuran I waktu sama
pengukuran II

B. Reliabilitas merupakan koefisien konsistensi internal
Di sini dipakai satu instrumen yang kemudian diukur sejauh mana interkorelasi butir-butir
soal/pertanyaan yang ada di dalam instrumen tersebut. Apabila terdapat interkorelasi yang
positif maka instrumen disebut homogen, dan dapat dianggap bahwa semua butir
soal/pertanyaan mengukur karakteristik yang sama. Dengan lain perkataan di sini diukur
konsistensi internal instrumen.
( )( )
( ) { } ( ) { }




=
2
2
2
2
Y Y N X X N
Y X XY N
rXY
Beberapa metode pengujian reliabilitas dalam pandangan kelompok ini dapat
dibagi lagi menjadi dua.
1) Metode pengujian reliabilitas yang dilakukan dengan membelah butir menjadi
dua bagian yang sama besar. Pembelahan dapat dilakukan atas dasar nomor butir butir
ganjil genap atau nomor butir awal akhir. Metode pengujian reliabilitas dalam
kelompok ini salah satunya adalah metode belah dua Spearman Brown
. Cara mencari reliabilitas disini ialah skor yang diperoleh subyek dari masing-
masing belahan (setegah bagian) dikorelasikan, hasil yang diperoleh ini merupakan
korelasi antara kedua belahan instrumen yang sesungguhnya.
Reliabilitas instrumen kemudian dihitung dengan rumus Spearman Brown
keterangan:
r
11
= koefisien reliabilitas penuh instrumen
r = koefisien reliabilitas setengah instrumen

2) Pada kasus di mana butir instrumen berjumlah ganjil, butir tidak dapat dibelah
menjadi dua bagian yang sama besar, maka uji reliabitas dapat menggunakan rumus
Alpha Cronbach, atau Kuder-Richardson

a. Koefisien Alpha Cronbach
Keterangan :
n = jumlah butir soal/pertanyaan yang ada
s
i
2
= varians skor butir
s
t
2
= varians skor-skor pada semua n butir soal/pertanyaan

b. Kuder Richardson (KR 20 dan KR 21)
Apabila jawaban bersifat dikotomi (ya/tidak atau betul/salah) maka
s
t
2 = pq.

Keterangan :
2
1
2
1
2
1
2
1
11
1
2
r
xr
r
+
=
|
|
.
|

\
|
|
.
|

\
|

=

2
2
11
1
t
t
s
pq s
n
n
r
|
|
.
|

\
|

|
.
|

\
|

2
2
11
1
1
t
i
s
s
n
n
r
n = jumlah butir soal/pernyatan yang ada
s
t
2
= varians skor total
p = proporsi jawaban yang benar
q = proporsi jawaban yang salah

Dengan asumsi bahwa semua butir pertanyaan/soal mempunyai derajat kesukaran
sama, maka diperoleh rumus (KR-21) yang disederhanakan sebagai berikut:
Keterangan :
n = jumlah butir soal/pernyataan yang ada
M = rata-rata skor total
s
t
2
= varians skor total
Dengan memakai rumus KR 21 ini perhitungan menjadi lebih mudah tetapi hasil koefisien
reliabilitasnya yang diperoleh menjadi lebih kecil dari pada dengan KR 20.
Batas keputusan reliabilitas
Pembuatan keputusan apakah sebuah instrumen atau alat ukur dapat dinyatakan
reliabel atau tidak didasarkan pada batas untuk membuat keputusan reliabilitas. Angka
koefisien reliabilitas yang dihitung melalui berbagai metode pengujian reliabilitas masih harus
dikonfirmasikan dengan batas tertentu untuk dapat ditafsirkan reliabel atau tidak. Instrumen
dapat dinyatakan reliabel apabila koefisien yang diperoleh melalui perhitungan menggunakan
metode pengujian reliabilitas tertentu lebih besar dibandingkan dengan batas keputusan
reliabilitas.
Batas reliabilitas bersifat sangat relatif akan sangat tergantung pada kepentingan penilai
atau pengumpul data. Menurut Azwar (1995), koefisien reliabilitas harus diusahakan setinggi
mungkin, namun koefisien yang tidak tinggi dapat dianggap cukup dalam pengukuran tertentu
yang tidak digunakan sebagai dasar pengambilan keputusan yang bersifat individual.
Aiken (1995) mengutarakan seberapa tinggi seharusnya koefisien reliabilitas yang
diperoleh dari skor instrumen sangat tergantung pada apa yang akan dilakukan atas skor.
Namun dia memberikan beberapa petunjuk. Jika skor digunakan untuk menentukan apakah
dua kelompok berbeda signifikan maka koefisien reliabilitas 0,65 sudah memberikan kontribusi
dalam keputusan. Tetapi jika skor digunakan untuk membandingkan penampilan individu yang
berbeda maka koefisien reliabilitas paling tidak 0,85.
Gronlund dan Linn (1990) menyatakan bahwa koefisien korelasi yang digunakan untuk
menentukan reliabilitas dihitung dan ditafsirkan sebagai indeks korelasi sehingga batas
koefisien reliabilitas adalah korelasi berdasarkan hasil konfirmasi dengan tabel korelasi product
moment pada jumlah sampel dan tingkat kesalahan tertentu.



( )
)
`

|
.
|

\
|

=
2
11
1
1
t
ns
M n M
n
n
r
DAFTAR PUSTAKA
Aiken, Lewis R (1995). Rating scales and checklist : evaluating behavior, personality and
attitude. New York : John, Wiley & Sons, Inc
Azwar, Saifuddin (1995). Sikap manusia teori dan pengukurannya. Yogyakarta : Pustaka
Pelajar
Gronlund, Norman E dan Linn, Robert L. (1990). Measurement and evaluation in teaching. New
York : MacMillan Publishing Company
Kerlinger, Fred N (1996). Asas-asas penelitian behavioral. Terjemahan Landung R Simatupang.
Yogyakarta : Gadjah Mada University Press
Thorndike, Robert L dan Hagen, Elizabeth P (1977). Measurement and evaluation in
psychology and education. 4
th
edition. New York : John Wiley & Sons

You might also like