Makalah Psikometri

KATA PENGANTAR
Puji syukur saya panjatkan kepada Allah SWT karena berkat rahmat-Nyalah laporan ini selesai tepat pada waktunya. Tak lupa ucapan terimakasih saya ucapkan kepada:
1. Seluruh dosen mata kuliah Psikometri yang telah memberikan pemahaman terkait topic. 2. Orang tua saya yang telah memberikan dukungan yang bersifat material maupun immaterial. 3. Semua teman saya yang telah turut memberikan informasi terkait topik, yang tidak dapat disebutkan satu-persatu.
Akhirnya penulis berharap semoga Allah memberikan imbalan yang setimpal pada mereka yang telah memberikan bantuan, dan dapat menjadikan semua bantuan ini sebagai ibadah, Amiin Yaa Robbal Alamiin. Laporan ini disusun sebagai langkah untuk memahami konsep pembelajaran siswa dalam rangka untuk mengetahui aplikasi teori skinner terhadap pembelajaran. Dalam Penulisan laporan ini penulis merasa masih banyak kekurangan-kekurangan baik pada teknis penulisan maupun materi, mengingat akan kemampuan yang dimiliki penulis. Untuk itu kritik dan saran dari semua pihak sangat penulis harapkan demi penyempurnaan pembuatan laporan ini. Semoga materi ini dapat bermanfaat dan menjadi sumbangan pemikiran bagi pihak yang membutuhkan,khususnya bagi penulis sehingga tujuan yang diharapkan dapat tercapai, Amiin.
DAFTAR ISI
KATA PENGANTAR ......................................................................................1 DAFTAR ISI ......................................................................................................2 BAB I PENDAHULUAN A. LATAR BELAKANG ..................................................................................3 B. TUJUAN PENELITIAN .............................................................................4 BAB II PEMBAHASAN A. PENGERTIAN RELIABILITAS ...............................................................5 B. KOEFISIEN KORELASI ...........................................................................9 C. JENIS-JENIS RELIABILITAS.................................................................. D. RELIABILITAS YANG DIPERCEPAT ................................................... E. KETERGANTUNGAN KOEFISIEN RELIABILITAS .......................... F. KESALAHAN STANDAR PENGUKURAN ............................................ G. RELIABILITAS DITERAPKAN PADA TES DAN SKOR .................... BAB III PENUTUP A. KESIMPULAN ............................................................................................17 B. SARAN ..........................................................................................................18 DAFTAR PUSTAKA
BAB I PENDAHULUAN
A. LATAR BELAKANG
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di Indonesia, adalah muncul banyaknya para peneliti-peneliti muda yang kini lebih kritis lagi dalam meneliti objek-objek yang ada. Di Indonesia, banyak sekali para peneliti ataupun bukan peneliti yang banyak melakukan sebuah riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah kejadian. Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah pengujian agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar valid dan bersifat riel tanpa adanya kebohongan ataupun ketidaknyataan yang mengesankan data yang diperoleh bersifat dibuat-buat. Agar kajian kita bisa bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih dahulu hasil penelitian kita yang disebut dengan uji reabilitas. Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil penelitian kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan sempurna untuk seluruh kejadian yang sejenis. Perkiraan semacam itu sama sekali tidak benar dan sangat menyesatkan (Sutrisno, 1981). Nah untuk menghindari hal-hal yang semacam itu maka kita harus melakukan reabilitas, yang berguna untuk menunjukkaan kevalidtan dari hasil sebuah penelitian yang kita lakukan. Uji reliabilitas mampu menunjukkan tingkat kepercayaan terhadap sekor atau tingkat
kecocokan sekor dengan sekor sesungguhnya. Rebilitas ini bisa dicapai melalui tingkat kecocokan di antara sekor pada lebih dari sekali pengukuran. Jika makin cocok dengan sekor sesungguhnya maka makin tinggi tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu merupakan kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap ada, namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak berpengaruh terhadap hasil akhir dari sebuah pengujian.
B. TUJUAN PENELITIAN
Mengkonsep satu variable dengan jelas. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep /variable. Sebuah variable harus spesifik agar dapat menguragiintervensi informasi dari variable lain. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat level pengukuran, maka variable yang dibuat akan semakin reliable karena informasi yang dimiliki semakin mendetail. Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang mungkin diperoleh. Gunakan lebih dari satu indicator. Dengan adanya lebih dari satu indikatoryang spesifik , peneliti dapat melakikan pengukuran dari range yang lebih luas terhadapkonten definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih draftatau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan pilot studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literature-literatur yag berkaitan. Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama. Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan perbaikan pada alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan melalui analisis butir untuk mengetahui butir mana yang perlu diperbaiki. Namun pada pengukuran sesungguhnya, perhitungan reliabilitas dilakukan untuk memberi informasi tentang kualitas sekor hasil ukur kepada mereka yang memerlukannya. Tentunya perolehan tersebut bisa di jadikan acuan bagi peneliti untuk menghasilkan penelitian yng bisa dipertanggung jawabkan di kemudian hari.
BAB II PEMBAHASAN
A. Pengertian Reliabilitas
Reliabilitas, atau keandalan merupakan konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai).
Pada penelitian reliabilitas tak lepas dari ketergantungan (dependabiliti). Konsep ketergantungan ini sangat berkaitan erat dengan keterandalan. Hasil dari pengujian awal diharapkan akan konsisten dangan pengujian-pngujian berikutnya. Hasil selalu berupa numerik dan tidak boleh berubah-ubah, karena merupakan karakteristik dari proses ukuran.
Reliabilitas selalu menunjukan keandalan instrument penelitian dalam berbagai bentuk,yakni hasil pengujian yang sama jika dilakukan oleh orang yang berbeda (inter-penilai), hasil pengujian yang sama jika dilakukan oleh orang yang sama dalam waktu berbeda (pengetesan ulang),hasil pengujian yang sama jika dilakukan oleh orang yang berbeda dalam waktu yang bersamaan dengan tes yang berbeda (bentuk pralel), dan hasil pengujian yang sama dengan menggunakan berbagai pernyatan-pernyataan membangun (konsistensi internal). Reliabilitas merupakan konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji ulang dengan tes yang sama dalam kesempatan berbeda, atau dengan seperangkat item yang ekuivalen, atau juga dapat berada dalam kondisi pengujian yang berbeda. Dalam pengertian luas, reliabilitas tes menunjukkan sejauh mana perbedaan-perbedaan individu dalam skor tes dapat dianggap sebagai penyebab dari perbedaan atau penyebab dari kesalahan dalam pencarian peluang. Dewasa ini, para psikolog menerima variabilitas sebagai segi instrinsik semua perilaku dan berusaha menyelidiki serta memilah banyak sumber variabilitas semacam itu. Reliabilitas skor bergantung pada definisi varian kesalahan. Faktor-faktor yang dapat dianggap sebagai varian kesalahan untuk satu tujuan dapat dianggap sebagai varian
kebenaran dalam tujuan lain. Contoh, jika kita ingin mengukur fluktuasi suasana hati, maka perubahan dari hari ke hari pada skor kegembiraan-depresi akan relevan bagi maksud tes ini dan karenanya, akan menjadi bagian dari varian kebenaran skor yang ada. Setiap tes seharusnya didampingi oleh pernyataan reliabilitas. Ketika penguji berusaha mempertahankan kondisi-kondisi pengetesan dengan mengendalikan lingkungan pengetesan, instruksi, batas waktu, rapport, dan faktor lainnya, mereka berusaha mengurangi varian kesalahan dan membuat skor-skor tes lebih dapat dipercaya. Meskipun telah dikondisikan tes dengan kondisi pengetesan maksimum, tak satu tes pun dapat dipercaya seratus persen. Karena semua jenis reliabilitas menyangkut derajat konsistensi atau kesepakatan antara dua perangkat skor yang diturunkan secara independen, semua jenis reliabilitas dapat diungkapkan dalam istilah koefisien korelasi.
B. KOEFISIEN KORELASI Koefisien korelasi menyatakan derajat kesesuaian atau hubungan antara dua perangkat skor. Dengan demikian, jika individu dengan skor tertinggi pada variabel 1 juga mendapatkan skor tertinggi pada varabel 2. Individu nomor dua terbaik pada variabel 1 juga nomor dua terbaik pada variabel 2, dan seterusnya, sampai dengan individu yang memiliki skor terendah. Akan ada korelasi sempurna antara variabel 1 dan 2. Korelasi seperti ini akan memiliki nilai +1,00. Korelasi nol menunjukkan tidak adanya hubungan sama sekali, sebagaimana hal ini dapat terjadi karena adanya peluang. Jika setiap sampel diperoleh secara acak untuk menentukan variabel 1 dan variabel 2, maka korelasi nol atau mendekati- nol akan terjadi. Dalam kondisi ini, akan mustahil memprediksi posisi relatif individu dakan variabel 2 berdasarkan pengetahuannya mengenai variabel 1. Orang dengan skor tertinggi pada variabel 1 mungkins aja memiliki skor yang berbeda dengan variabel 2. Koefisien korelasi bisa dihitung dengan berbagai cara, tergantung pada hakikat data. Yang paling umum adalah koefisien korelasi produk-momen Pearson. Koefisien korelasi ini tidak
hanya mempertimbangkan posisi orang dalam kelompok, namun juga besar simpangannya di atas atau di bawah rata-rata kelompok. Bila posisi tiap orang dinyatakan dalam kaitan-kaitan skor standar, orang yang ada di atas rata-rata akan menerima skor standar positif, sementara yang ada di bawah rata-rata akan menerima skor negatif. Dalam praktik sesungguhnya tidak mutlak perlu adanya konversi setiap raw score ke dalam skor standar sebelum menemukan hasil silangnyam karena konversi ini bisa dibuat sekali untuks elamanya setelah hasil silang ditambahkan. SIGNIFIKANSI STATISTIK Dalam riset psikologis biasanya kita tertarik untuk melakukan generalisasi di atas sampel particular individu yang di tes sampai populasi yang diwakili sampel itu. Contoh: Kita mungkin ingin tahu apakah matematika dan kemampuan membaca punya korelasi diantara anak-anak sekolah Amerika yang usianya sama seperti anak-anak sekolah yang kita tes. Yang jelas, 10 kasus misalnya, yang sungguh-sungguh di tes tidak akan merupakan sampel yang memadai untuk generalisasi bagi populasi seluas itu. Sa,pel berukuran sama lainnya, yang dapat dibandingkan akan menghasilkan koreasi yang jauh lebih rendah atau lebih tinggi. Ada prosedur statistic untuk memperkirakan fluktuasi yang mungkin untuk bisa diharapakan dari sampel ke sampel dalam ukuran dari korelasi, rata-rata, simpangan baku, dan ukuranukuran kelompok lain manapun. Ketika kita mengatakan bahwa korelasi itu signifikan pada tingkat 1% (0,01), kita memaksudkan bahwa peluang-peluangnya tidak lebih besar daripada 1 dari 100 sehingga korelasi populasinya 0. Tingkat signifikansi merujuk pada resiko kesalahan yang hendak kita tanggung dalam menarik kesimpulan dari data kita. Selama bertahun-tahun, tingkat signifikansi merupakan cara tradisional untuk mengevaluasi korelasi. Namun, sudah mulai disadari bahwa prosedur ini memiliki kekurangan dan cacah, korelasi yang tinggipun bahkan gagal memenuhi tes signifikansi.
Pendekatan lain yang semakin mendapat perhatian mempertimbangkan besaran actual korelasi yang didapatkan dan memperkirakan interval kepercayaan di dalam korelasi populasi kemungkinan jatuh pada tingkat kepercayaan yang spesifik. (lihat, misalnya Carver 1993). Tren terhadap interval kepecayaan sebagai suplemen dan bukan pengganti untuk pengetesan signifikansi, membayang-bayangi pergeseran penting dalam analisis atas koefisien korelasi dalam tahun-tahun mendatang. KOEFISIEN RELIABILITAS Koefisien korelasi telah digunakan dalam analisis data psikometrik. Pengukuran reliabilitas tes mewakili satu aplikasi koefisien-koefisien seperti ini. Contoh sebuah koefisien reliabilitas yang dihitung oleh metode produk momen Pearson, (grafik 4-3 Hal:101). Dalam kasus ini, skor-skor 104 orang pada bentuk-bentuk ekuivalen dari tes-tes World Fluency2 memiliki korelasi. Dalam satu bentuk, para peserta tes diberi waktu 5 menit untuk menulis sebanyak mungkin kata-kata yang dimulai dengan sebuah surat yang ada. Bentuk kedua sama, kecuali surat lain yang digunakan. Dua surat ini dipilih oleh para penulis tes karena untuk maksud ini kesulitannya hamper sama. Koralasi antara jumlah kata-kata yang tertulis dalam dua bentuk tes ini adalah 0,72. Korelasi ini tinggi dan signifikan pada tingkat 0,01.
C. JENIS-JENIS RELIABILITAS Reliabilitas Tes-Retes Metode paling jelas untuk menemukan reliabilitas skor tes ialah dengan mengulang tes yang sama pada kesempatan kedua. Koefisien reliabilitas dalam kasus ini hanyalah korelasi antara skor-skor yang didapatkan oleh orang yang sama pada dua penyelenggaraan tes. Varian kesalahan berhubungan dengan fluktuasi acak kinerja dari satu kesempatan tes ke kesempatan lainnya. Variasi-variasi ini sebagian diakibatkan dari kondisi pengetesan yang tidak terkontrol seperti perubahan eksterm pada cuaca, ujung pensil yang patah, dan lain-lain. Di samping itu juga
terdapat
variasi-variasi yang muncul dari peserta tes itu sendiri, seperti sakit, letih,
ketegangan emosi, kecemasan, dan lain-lain. Reliabilitas tes ulang menunjukkan sejauh mana skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda, makin tinggi reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi peserta tes atau lingkungan pengetesan. Meskipun tampak sederhana dan blak - blakan, teknik tes dan tes ulang menampilkan berbagai kesulitan ketika diterapkan pada kebanyakan tes psikologis. Praktik mungkin akan menghasilkan kadar perbaikan yang bervariasi dalam skor-skor retes individu yang berbeda. Akan tetapi, untuk sebagian besar tes-tes psikologis, pengetesan ulang (retes) dengan tes yang sama bukanlah teknik yang tepat untuk menemukan koefisien reliabilitas. Reliabilitas Bentuk-Alternatif Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama bisa dites dengan satu bentuk pada kesempatan kedua. Korelasi antara skor-skor yang didapatkan pada dua bentuk itu merupakan keofisien reliabilitas tes. Perlu dicatat bahwa koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons terhadap berbagai butir soal contoh (bentuk-bentuk tes). Dengan begitu, koefisien ini menggabungkan dua jenis reliabilitas. Akan tetapi, karena dua jenis ini penting bagi kebanyakan maksud pengetesan, reliabilitas bentuk-alternatif memberikan ukuran yang berguna untuk mengevaluasi banyak tes. Seperti reliabilitas retes, reliabilitas bentuk-alternatif seharusnya selalu disertai oleh pernyataan tentang panjang interval antara penyelenggaraan tes, dan juga deskripsi pengalaman-pengalaman relevan yang memengaruhi. Jika kedua bentuk itu diselenggarakan langsung berturut-turut, korelasi yang dihasilkan menunjukan reliabilitas antara bentukbentuk saja, bukan antara peristiwa-peristiwa. Varian kesalahan dalam kasus ini merepresentasikan fluktuasi dalam kinerja dari satu perangkat soal ke perangkat lain, tetapi tidak merepresentasikan fluktuasi sepanjang waktu.
Dalam pengembangan bentuk-bentuk alternative, tentu saja harus dicurahkan perhatian untuk memastikan bahwa, bentuk-bentuk itu betul-betul parallel. Secara mendasar, bentuk-bentuk paralel tes seharusnya merupakan tes-tes yang disusun secara mandiri untuk memenuhi spesifikasi yang sama. Tes-tes ini seharusnya berisi jumlah soal yang sama dan seharusnya mencakup jenis isi yang sama. Kisaran dan tingkat kesulitan soal-soal ini seharusnya juga sama. Instruksi, batas waktu, contoh-contoh ilustratif, format, dan semua aspek tes lain harus dicek dalam hal ekuivalensinya. Reliabilitas Belah-Separuh (Split-half Reliability) Dari penyelenggaraan tunggal atas satu bentuk tes, mungkin untuk mencapai ukuran reliabilitas lewat berbagai prosedur belah-separuh. Dengan cara ini, dua skor didapatkan untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Tampak bahwa reliabilitas belah-separuh merupakan ukuran yang konsisten dalam kaitan dengan sampling isi. Stabilitas sementara skor-skor tidak masuk dalam reliabilitas semacam itu, karena hanya ada satu kesempatan tes. Jenis reliabilitas ini kadang kala disebut koefisien konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes. Untuk mendapatkan reliabilitas belah-separuh, masalah pertama adalah bagaimana membagi tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Tes apa pun bisa dibagi dengan berbagai cara. Dalam kebanyakan tes, paruhan yang pertama dan paruhan kedua tidak akan ekuivalen, tergantung pada perbedaan dan tingkat kesulitan soal, dan juga efek-efek kumulatif pemanasan, praktik, keletihan, kebosanan, dan banyak factor lain yang berbeda-beda dari awal sampai akhir tes. Prosedur yang memadai bagi kebanyakan maksud adalah mendapatkan skor pada soal-soal genap dan ganjil dari tes. Jika soal-soal ini aslinya diatur menurut tingkat kesulitan yang kurang lebih sama, pembagian seperti itu akan menghasilkan skor-separuh yang hampir ekuivalen. Satu hal yang perlu diwaspadai dalam membuat pemisahan ganjil-genap seperti itu berkaitan dengan kelompok-kelompok butir soal yang berhadapan dengan satu masalah, seperti pertanyaan-pertanyaan yang merujuk pada diagram mekanis tertentu atau halaman tertentu dalam tes membaca. Dalam kasus ini, seluruh kelompok soal seharusnya tetap disatukan dengan satu atau separuh lainnya. Seandainya soal-soal dalam kelompok semacam ini harus ditempatkan dalam paruhan-
paruhan tes yang berbeda dari tes, kesamaan skor-skor paruhan akan dibesar-besarkan, karena kesalahan tunggal apa pun dalam memahami masalah ini akan memengaruhi soal-soal dalam kedua paruhan. Begitu dua skor-paruhan ini didapatkan untuk tiap orang, skor-skor ini bisa dikorelasikan dengan metode yang biasa. Akan tetapi, seharusnya dicatat bahwa korelasi ini sesungguhnya memberikan reliabilitas dari separuh-tes saja. Contohnya, jika seluruh tes terdiri dari 100 butir soal, korelasinya dihitung antara dua perangkat skor yang masing-masing didasarkan pada 50 soal. Di pihak lain, dalam reliabilitas tes-retes dan reliabilitas bentuk alternative, tiap skor didasarkan pada jumlah soal penuh pada tes. Jika semuaa hal sama, semakin panjang tes, semakin dapat diandalkan tes itu. Masuk akal jika kita berekspektasi bahwa, dengan sampel perilaku lebih besar, kita akan sampai pada ukuran lebih memadai dan lebih konsisten. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek tes, dapat diperkirakan dengan rumus Spearman-Brown, seperti berikut: rnm =
dimana rnm adalah koefisien yang diperkirakan , rnm adalah koefisien yang diperoleh, dan n adalah jumlah waktu tes itu diperpanjang atau diperpendek. Jadi, jika jumlah soal tes ditingkatkan dari 25 menjadi 100, n adalah 4; jika diturunkan dari 60 ke 30, n adalah . Rumus Spearman-Brown digunakan secara luas dalam menghitung reliabilitas dalam bentuk ini. Ketika diterapkan pada reliabilitas belah-separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai berikut: rtt = untuk rbb adalah korelasi dari tes-tes paruhan. Metode alternatif untuk mendapatkan reliabilitas belah-separuh dikembangkan oleh Rulon (1939). Hanya dibutuhkan varian dari perbedaan antara skor-skor tiap orang pada dua tes-tes
separuh (SD ) dan varian skor total ( SD
) dua nilai ini disubstitusikan dalam rumus
berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :
rtt = 1-
menarik untuk memperhatikan hubungan rumus ini dengan definisi varian kesalahan. Perbedaan apa pun antara skor-skor seseorang pada dua tes paruhan menampilkan varian kesalahan atau varian yang tidak relevan. Varian-varian perbedaan-perbedaan ini, dibagi dengan varian skor-skor total, memberikan proporsi varian kesalahan dalam skor-skor itu. Ketika varian skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varian benar untuk penggunaan tes tertentu, yang sama dengan koefisien reliabilitas. Reliabilitas Kuder-Richardson dan Koefisien Alpha Metode keempat untuk mendapatkan reliabilitas, yang juga menggunakan administrasi tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antarsoal ini dipengaruhi oleh dua sumber varian kesalahan: (1) pencuplikan isi ( sebagaimana dalam bentuk alternatif dan reliabilitas belah-separuh); (2) heterogenitas dari domain perilaku yang disampelkan. Semakin homogeny domainnya, semakin tinggilah konsistensi antarsoal. Contoh , jika suatu tes mencakup soal perkalian saja, sementara yang lain memuat soal-soal pertambahan, pengurangan, perkalian dan pembagian tes terdahulu barangkali akan menunjukan lebih banyak konsistensi antarsoal daripada yang kedua tersebut. Dalam tes kedua, yang lebih heterogen, satu peserta tes bisa menunjukkan kinerja lebih baik dalam pengurangan daripada dalam operasi aritmetik lainnya, sedangkan peserta tes lainnya bisa mencapai skor yang relative baik pada tes pembagian, tetapi kurang baik pada penambahan, pengurangan, dan perkalian, dan seterusnya. Sampel yang lebih ekstrem akan ditunjukkan oleh tes terdiri dari 40 soal kosakata, yang kontras dengan tes yang terdiri dari 10 kosakata, 10 hubungan ruang, 10 penalaran aritmetik, dan 10 soal kecepatan persepsi. Dalam tes kedua, barangkali tidak ada atau ada sedikit hubungan antara kinerja individu pada berbagai jenis soal.
Tampak bahwa skor tes akan menjadi kurang ambigu bila berasal dari tes-tes yang relatif homogeny. Andaikan dalam tes 40 soal amat heterogen yang dikutip sebelumnya, baik smith maupun jones mendapatkan nilai 20. Bisakah kita menyimpulkan bahwa kinerja keduanya pada tes ini sama? Sama sekali tidak. Smith mungkin telah menyelesaikan 10 soal kosakata dengan benar, 10 soal kecepatan persepsi dan tidak satupun soal penalaran aritmetik dan hubungan ruang. Sebaliknya, jones mungkin telah menerima skor 20 dengan menyelesaikan 5 soal kecepatan persepsi, 5 hubungan ruang, 10 penalaran aritmetik, dan tidak satupun soal kosakata. Banyak kombinasi lain yang jelas bisa menghasilkan skor total sama 20. Skor ini akan memiliki arti yang berbeda jika didapatkan lewat kombinasi soal-soal yang tidak sama. Dalam tes kosakata yang relatif homogeny, di pihak lain, skor 20 barangkali akan berarti bahwa peserta tes telah berhasil dengan 20 kata pertama, jika soal-soalnya diatur dalam tingkat kesulitan yang meningkat. Ia bisa gagal pada dua atau tiga kata lebih mudah dan dengan tepat memberikan respons pada dua atau tiga soal lebih sulit di atas kata ke-20 ,tetapi variasi individu seperti ini agak berbeda dalam perbandingan dengan variasi yang ditemukan dalam tes yang lebih heterogen. Pertanyaan yang amat relevan dalam kaitan ini adalah apakah criteria yang sedang diprediksi oleh tes itu pada dirinya sendiri relatif homogen atau heterogen. Meskipun tes-tes homogeny lebih disukai karena skor-skornya memungkinkan interpretasi yang agak tidak ambisius, tes homogen jelas bukan predictor yang memadai menurut criteria yang amat heterogen. Lagi pula, dalam prediksi yang punya criteria heterogen, heterogenitas soal-soal tes tidak akan dengan sendirinya mewakili varian kesalahan. Tes-tes inteligensi tradisional memberikan contoh yang baik tentang tes-tes heterogen yang dirancang untuk memprediksi criteria heterogen. Akan tetapi, dalam kasus semacam ini, mungkin lebih baik menyusun berbagai tes yang relatif homogeny, masing-masing mengukur berbagai fase criteria heterogen. Jadi, interpretasi tidak ambigu atas skor-skor tes bisa dipadukan dengan cakupan criteria yang memadai.
D. RELIABILITAS YANG DIPERCEPAT
E. KETERGANTUNGAN KOEFISIEN RELIABILITAS
F. KESALAHAN STANDAR PENGUKURAN Interpretasi Skor-skor Individu (Standard Error of Measurement) SEM lebih banyak digunakan dalam pengetesan daripada koefisien reliabilitas. Kesalahan pengukuran standar bisa dihitung dengan rumus berikut: SEM = SDt SDt rtt = simpangan baku skor tes = koefisien reliabilitas
tt
Misalnya, jika IQ simpangan pada tes inteligensi tertentu memiliki simpangan baku 15 dan koefisien reliabilitas 0,89, SEM IQ pada tes ini adalah: 15 = 5. Kesalahan standar pengukuran dan koefisien reliabilitas merupakan cara-cara alternatif untuk mengungkapkan reliabilitas tes. Tidak seperti koefisien reliabilitas, kesalahan pengukuran bersifat independen terhadap variabilitas kelompok berdasarkan kesalahan pengukuran dihitung.Untuk menginterpretasikan skor individu, kesalahan standar pengukuran merupakan alat yang lebih tepat. Akan tetapi, perbedaan dalam koefisien-koefisien reliabilitas maupun kesalahan-kesalahan pengukuran tidak bisa diandaikan tetap konstan ketika tingkat kemampuan sangat bervariasi. SEM memberikan perlindungan terhadap penekanan yang tidak tepat pada skor numerik tunggal. Interpretasi Perbedaan Skor
tt =
15
= 15 (0,33)
Tiap skor dapat berfluktuasi, yang berfungsi sebagai alat pemeriksa penekanan yang ebrlebihan pada perbedaan-perbedaan kecil antara skor-skor. Sikap hati-hati seperti ini perlu ada, baik bila membandingkan skor tes dari orang yang berbeda maupun ketika membandingkan skor tes dari orang yang berbeda maupun ketika membandingkan skor individu yang sama dalam kemampuan yang berbeda. Pertanyaan yang sering diajukan tentang skor-skor tes berhubungan dengan posisi relatif individu pada berbagai area. Perbedaan yang ada dipengaruhi oleh kesalahan-kesalahan peluang yang ada dalam suatu skor. Kesalahan standar tentang perbedaan antara dua skor dapat ditemukan dari kesalahan standar perbedaan antara dua skor dan SEM1 dan SEM2 adalah kesalahan standar dari pengukuran skor-skor yang terpisah. SEdiff = SD Dengan mengganti SD
11 11-r22
untuk SEM1 dan SD
22
untuk SEM2, kita dapat
menuliskan rumus ini kembali secara langsung dalam kaitan dengan koefisien reliabilitas, sebagai berikut: Dalam substitusi ini, SD yang sama digunakan untuk tes 1 dan 1, karena skor-skornya harus diungkapkan dalam kaitan dengan skala yang sama sebelum dibandingkan. Hal ini terdapat dalam tes WAIS-R.
G. RELIABILITAS DITERAPKAN PADA TES PENGUASAAN DAN SKOR POTONG Implikasi utama dari pengetesan penguasaan adalah reduksi dalam variabilitas skor-skor di kalangan individu. Setiap korelasi yang ada, termasuk koefisien-koefisien reliabilitas, dipengaruhi oleh variabilitas kelompok tempat koefisien itu dihitung. Bila reliabilitas sampel menurun, koefisien korelasinya akan turut menurun. Dalam praktik sesungguhnya, tes-tes ini digunakan untuk membedakan antara orang yang memiliki dan orang yang tidak memiliki keterampilan dan pengetahuan yang dibutuhkan
untuk aktivitas tertentu. Tujuan khusus pengadaan tes ini dapat sangat bervariasi, dari memperoleh izin mengemudi atau penugasan pada pekerjaan khusus tertentu sampai maju ke unit berikut dalam program pengajaran yang dibuat khusus untuk individu atau penerimaan pada program belajar tertentu.
BAB III PENUTUP
A. KESIMPULAN
dengan uji reliabilitas maka penelitian yang dihasilkan akan memiliki sebuah mutu yang berkualitas. Karena penelitian yang sudah melalui uji penelitian sudah dianggap bagus dan memenuhi standart. Berikut adalah jenis-jenis uji reliabilitas yang dibagi menjadi 3 jenis yaitu : 1. Reliabilitas Stabil (Stability Reliability) 2. Reliabilitas Terwakili (Representative Reliability) 3. Reliabilitas Seimbang (Equivalence Reliability) Ada tiga teknik dasar yang dapat diterapkan oleh peneliti dalam menguji Reliabilitas suatu penelitian yaitu: 1. Teknik pengukuran ulang (test-retest) 2. Teknik belah dua 3. Teknik paralel (equivalent form) Ada dua Peranan Koefisien Reliabilitas yaitu : 1. Reliabilitas pada Gabungan Sekor (Komposit) 2. Reliabilitas pada Selisih Sekor Didalam pengujian sebuah hasil penelitian juga diperlukan sebuah rumus-rumus untuk menunjukkan bahwa hasil penelitian yang kita lakukan valid dan dapat dipertanggung jawabkan.
B. SARAN
Semoga dengan adanya makalah ini mampu membantu para peneliti dalam pengujian setiap hasil penelitian yang dilakukannya.
Dan diharapkan dengan adanya makalah ini tidak hanya berguna bagi para peneliti saja, namun bagi semua khalayak umum yang dimana mampu menunjang dalam hal pendidikan dan sosial.
DAFTAR PUSTAKA

Makalah Psikometri

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Makalah Psikometri

Uploaded by

Copyright:

Available Formats

KATA PENGANTAR

separuh (SD ) dan varian skor total ( SD

) dua nilai ini disubstitusikan dalam rumus

berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :

D. RELIABILITAS YANG DIPERCEPAT

E. KETERGANTUNGAN KOEFISIEN RELIABILITAS

untuk SEM1 dan SD

untuk SEM2, kita dapat

BAB III PENUTUP

You might also like