P. 1
Evaluasi Program Pembelajaran Full

Evaluasi Program Pembelajaran Full

|Views: 722|Likes:
Published by Dedi Mukhlas
pengertian, evaluasi dalam pembelajaran dimana pada artikel ini dijelaskan secara ditail dan lengkap...
pengertian, evaluasi dalam pembelajaran dimana pada artikel ini dijelaskan secara ditail dan lengkap...

More info:

Published by: Dedi Mukhlas on Mar 25, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

05/02/2013

pdf

text

original

Sections

Ini adalah model pertama evaluasi kurikulum yang dikembangkan oleh Stake. Dalam
tulisannya ia sendiri tidak memberikan nama khusus tehadap model ini. Nama countenance di
sini disesuaikan dengan judul artikel yang ditulis walaupun pengertian countenance itu
sendiri mempunyai makna ambigous. Dalam suatu pengertian ia adalah keseluruhan
sedangkan dalam pengertian lain kata itu bermakna sesuatu yang disenangi (favourable).
Dalam tulisan itu, Stake ingin mengemukakan keseluruhan kegiatan evaluasi yang harus yang
harus dilakukan dan cara yang diinginkannya bagaimana evaluasi tersebut dilakukan. Oleh
karena itu, walaupun beberapa penulis lain yang membicarakan model ini memprgunakan
judul seperti model concruence atau model contingency, nama –nama tersebut tidak
dipergunakan di sini karena baik congruence maupun contingency merupakan dua konsep
utama dalam model pengolahan data yang dikemukakan oleh Stake. Tetapi kedua konsep itu
tidak dapat mewakili keseluruhan ide Stake mengenai evaluasi kurikulum. Jadi nama
countenance dipertahankan sebagai nama model ini secara keseluruhan.
Dalam model ini, Stake mendasarkan dirinya pada evaluasi formal, di mana dikatakannya
sebagai suatu kegiatan evaluasi yang sangat tergantung pada pemakaian “checklist, structured
visitation by peers, controlled comparisons, and standardized testing of students” (Stake,
1972:93). Lebih lanjut, model ini dikembangkan atas keyakinan bahwa suatu evaluasi
haruslah memberikan deskripsi dan pertimbangan sepenuhnya mengenai evaluan. Dasat ini
masih menjadi keyakinannya ketika ia mengembangkan model-model evaluasi lain di
kemudian hari, yang memberikan tekanan pada pendekatan kualitatif.
Model ini dimasukkan dalam model kuantitatif, karena dalam model ini jelas Stake masih
mengutamakan data kuantitatif dan pendekatan kuantitatif dalam mengumpulkan data.
Bahkan mengenai peertimbangan yang duberikan berbagai kelompok sumber haruslah
dikumpulkan secara obyektif; suatu sikap yang berubah ketika ia kemudian lebih cenderung
mempergunakan model-model kualitatif. Seperti yang diungkapkannya ketika ia
menguraikan tentang pertimbangan (Stake, 1872:95):
Evaluation will seek out and record the opinions of persons of special qulification. These
opinion, though subjective, can be very useful and can be gathered objectively, independent
of the solicitor’s opinions.

Bahkan dalam model ini Stake sangat menekankan peran evaluator dalam mengembangkan
tujuan kurikulum menjadi tujuan khusus yang terukur, sebagaimana berlaku dalam tradisi
pengukuran yang behavioristik dan kuantitatif.
Dalam model ini, Stake mengemukakan bahwa suatu evaluasi forma harus memberikan
perhatian terhadap keadaan sebelum suatu kegiatan kelas berlangsung dan terhadap kegiatan
kelas itu sendiri, serta menghubungkan dengan berbagai bentuk hasil belajar. Keadaan
sebelum suatu kegiatan kelas berlangsung dinamakannya antecendent. Sedangkan kegiatan
interaksi yang terjadi di sekolah dinamakannya dengan istilah transactions.
Lebih lanjut dikemukakannya, bahwa ketiga tingkatan tersebut, antecendent, transaction dan
hasil (outcome), terbagi atas dua kategori. Kategori pertama ialah apa yang diinginkan

(intent) oleh pengembang program. Seorang guru, sebagai seorang pengembang program,
merencanakan mengenai keadaan (persyaratan) yang diingin-kannya, untuk suatu kegiatan
kelas tertentu. Apakah persyaratan tersebut berhubungan dengan siswanya seperti minat,
kemampuan, pengalaman, dan lain sebagainya yang biasa diisitilahkan dengan entry
behavior. Mungkin pula ersyaratan itu berhubungan dengan lingkungan di kelas. Lebih lanjut,
guru tersebut merencanakan apa yang diperkirakan akan terjadi pada waktu interaksi dikelas,
dan kemampuan apa yang diharapkan dimiliki siswa setelah proses interaksi berlangsung.
Dengan kata lain, perencanaan yang dilakukan guru dalam satuan pelajaran, merupakan apa
yang diingin-kan guru tersebut (intent).
Kategori kedua ialah kategori yang berhubungan dengan apa yang sesungguhnya terjadi,
bukan lagi apa yang diinginkan. Misalnya keadaan apa yang ada pada waktu suatu interaksi
kelas akan dilakukan; bagaimana dengan kemampuan siswa yang akan belajar; apakah siswa
telah belajar mengenai topik yang akan dibicarakan pada malam hari sebelum pelajaran
berlangsung. Apakah atlas yang akan digunakan guru memang tersedia; demikian pula
dengan OHP yang akan dipakai oleh guru yang bersangkutan? Bagaimana interaksi tersebut
berlangsung? Apakah setelah guru mencoba memberikan pertanyaan kepada siswa untuk
mengetahui kemajuan yang mereka peroleh dari proses interaksi yang terjadi? Karena Stake
membuat ketegorinya berdasarkan apa yang dilakukan evaluator, kategori kedua ini
dinamakan observasi. Jadi seperti juga dengan intent, data mengenai observasi ini meliputi
antecendent, transaction, dan hasil yang diperoleh.
Baik data yang dikelompokkan ke dalam intent maupun observasi adalah data yang
mengungkapkan tentang apa dan bagaimana kurikulum itu. Data ini baru merupakan sebagian
dari data yang harus dikumpulkan evaluator yang bekerja mempergunakan model evaluasi
ini. Oleh karena itu, pekerjan belumlah selesai. Ia baru menyelesaikan sebagian dari kegiatan
pengumpulan data yang harus dilakukannya.
Stake juga beranggapan bahwa, suatu evaluasi harus sampai kepada pemberian pertimbangan.
Stake yang menyadari banyak di antara evaluator yang enggan memberikan pertimbangan
dan untuk mengatasi hail tersebut, dalam model ini ia mengemukakan jalan keluar yaitu
evaluator harus mengumpulkan data mengenai pertimbangan tersebut dari sekelompok orang
yang dianggap memiliki kualifikasi untuk memberikan pertimbangan tersebut. Data
pertimbangan ini yang kemudian dimasukkan ke dalam matriks sebagai bagian dari model
ini.
Data pertimbangan ini meliputi tiga jenjang yang dikemukakan oleh Stake, yaitu
antecendent, transactions, dan hasil yang diperoleh. Di samping meliputi tiga jenjang ini, data
mengenai pertimbangan tersebut terbagi pula atas tiga kategori, yaitu standar dan
pertimbangan. Oleh karena itu matriks pertimbangan, seperti juga metriks deskripsi, terdiri
dari atas 6 kotak. Tiga kotak untuk data pertimbangan dan tiga kotak lagi mengenai data
standar.
Keseluruhan matriks yang mendukung model Stake ini terdiri dari 12 kotak. Di samping itu,
ada sebuat kotak lagi yang dinamakan kotak rasional. Setiap pengembang kurikulum/guru
harus memiliki rasional untuk setiap intent yang dikembangkan. Mungkin sekali mereka tidak
mempunyai rasional yang tertulis, dan mungkin pula mereka tidak dapat mengemukakannya
dalam susunan kalimat yang baik tapi mereka pasti memilikinya.
Cara kerja model evaluasi Stake ini adalah sebagai berikut. Evaluator mengumpulkan data
mengenai apa yang diinginkan pengembangan program baik yang berhubungan dengan
antecendents (persyaratan awal), transaksi (interaksi), dan juga hasil. Data dapat
dikumpulkan melalui studi dokumen tetapidapat pula dilakukan dengan jalan wawancara.
Cara terakhir ini dilakukan apabila dokumen tidak diperoleh karena sesuatu dan lain hal. Cara
terbaik tentulah melalui studi dokumen.

Bersamaan dengan pengumpulan data mengenai intents (tujuan) ini dapat pula dikumpulkan
resional dari setiap tujuan tersebut. Di sini Stake memperingatkan agar data mengenai
rasional janganlah dikumpulkan dengan jalan mendikte pengembang program/guru tersebut.
Biarkanlah mereka berbicara dengan pengertian dan bahasa yang ada pada diri mereka.
Evaluator mendengarkan dan mencatat apa yang dikemukakan oleh pengembang program.
Suatu hal yang perlu diperhatikan, walaupun dalam gambar kotak rasional berada di sebelah
kiri matriks deskripsi, hal itu tidaklah berarti bahwa pengumpulan data tentang rasional
dilakukan terlebih dahulu. Dalam kenyataannya, data tentang rasional tak mungkin
dikumpulkan sebelum data mengenai tujuan telah dikumpulkan. Oleh karena itu waktu yang
paling cepat untuk segera mengumpulkan data mengenai rasional adalah bersamaan dengan
waktu pengeumpulan data mengenai tujuan.
Kegiatan berikutnya ialah pengumpulan data observasi mengenai persyaratan awal, transaksi
dan hasil. Sesuai dengan namanya, data untuk bagian ini dikumpulkan melalui observasi.
Dan, seperti ditekankan Stake, observasi ini haruslah observasi formal. Maksudnya, observasi
tersebut haruslah dilakukan denga mepergunakan instrumen (alat pengumpul data yang
dikembangkan khusus). Stake (1972:98) mengemukakan bahwa instrumen yang dipakai
dapat meliputi “daftar inventori, daftar pertanyaan tentang data biografis, daftar wawancara,
daftar cek, pertanyaan tentang pendapat (optionares), dan semua jenis tes psikometrik”. Yang
penting, data tersebut berhubungan dengan apa yang dikembangkan dalam tujuan.
Dalam pengolahan data matriks deskripsi, Stake mengemukakan dua konsep yaitu
contingency dan cungruency. Kedua konsep ini berbeda dalam penggnnaannya. Contingency
dipegunakan untuk menganalisis data secara vertikal, mencari kesesuaian antara kotak di atas
dengan kotak di bawahnya. Ada dua analisis mengenai kesesuaian ini. Pertama adalah
kesesuaian secara logika, yaitu kesesuaian menurut pemikiran logika evaluator. Evaluator
mempertimbangkan apakah hubungan yang satu dengan lainnya masuk akal, apakah yang
satu itu mungkin tercapai melalui apa yang ada pada kotak lainnya.
Analisis logis ini dipergunakan Stake dalam memberikan pertimbangan mengenai
keterhubungan antara persyaratan awal, transaksi, dan hasil dari kotak-kotak tujuan (intent).
Evaluator harus dapat menentukan apakah persyaratan awal yang telah dikemukakan
pengembang program/guru. Ataukah sebetulnya ada model transaksi lain yang lebih efektif
untuk mencapai apa yang dikemukakan dalam prasyarat. Demikian pula mengenai hubungan
antara transaksi dengan hasil yang diharapkan.
Analisis kedua adalah analisis empirik kontingensi. Dasar bekerjanya adalah sama dengan
analisis logis tapi data yang dipergunakan adalah data empirik. Jadi, dalam analisis ini
evaluator harus mempertimbangkan keterhubungan tersebut berdasarkan data empirik yang
telah dikumpulkannya. Pertanyaan-pertanyaan yang diajukan untuk analisis logus
dipergunakan untuk analisis empirik ini.
Masih dalam analisis mengenai data deskriptif, pekerjaan evaluator berikutnya ialah
mengadakan analisis congruence (kesesuaian) antara apa yang dikemukakan dalam tujuan
(intent) dengan apa yang terjadi dalam kegiatan observasi. Pertanyaan yang dapat diajukan di
sini ialah apakah yang telah direncanakan dalam tujuan memang sesuai dalam
pelaksanaannya di lapangan (observasi). Apakah terjadi penyimpangan-penyimpangan antara
apa yang direncanakan (intent) dengan apa yang terjadi dan kalau ada penyimpangan faktor-
faktor apa yang berperan dalam penyimpangan tersebut.
Apabila analisis contingency dan concruency tersebut telah diselesaikan, adalah tugas
evaluator untuk menyerahkan hasilnya kepada tim yang terdiri dari para ahli dan orang yang
terlibat dalam program. Tim ini yang akan meneliti kasahihan hasil analisis evaluator
tersebut. Lebih lanjut tim ini pula yang akan memberikan persepsinya mengenai faktor
penting baik dalam contingency maupun congruency.

Tugas berikut evaluator ialah memberikan pertimbangan mengenai program yang sedang
dikaji. Untuk itu evaluator memerlukan standar. Dalam model keseluruhan digambarkan
bahwa dalam matriks pertimbangan ada yang dinamakan standar dan pertimbangan. Standar
dapat berbentuk standar mutlak dan relatif. Standar mutlak adalah standar yang dianggap
belaku untuk suatu kurikulum atau program. Katakanlah untuk program IPS ditentukan
adanya standar-standar tertentu baik mengenai tujuan yang akan dicapai, proses belajar
mengajar, dan hasil belajar. Mungkin saja standar itu datang dari individu para ahli tetapi
standar itu adalah standar yang diinginkan bagi setiap program studi IPS, terlepas dari
karakteristik khusus yang dimiliki program tersebut.
Standar relatif berhubungan dengan komparasi antara satu program dengan program lainnya
dalam satu bidang studi yang sama. Untuk konteks pendidikan di AS dan beberapa negara
lainnya, adanya beberapa program dalam satu bidang studi yang sama adalah jamak. Suatu
negara bagian tertentu atau bahkan satu lingkungan otoritas pendidikan tertentu memiliki
program IPA yang berbeda dengan negara bagian atau lingkungan otoritas pendidikan
lainnya. Dalam konteks pendidikan Indonesia perbedaan semacam itu mungkin tidak akan
terjadi. Oleh karena itu komparasi untuk konteks pendidikan di Indonesia hanya dapat
dilakukan antara program yang lama dengan program yang baru.
Menurut Stake (1972:101), evaluator yang harus mempergunakan kedua standar tersebut.
Jadi, evaluator harus memberikan pertimbangan baik yang bersifat mutlak maupun relatif.
Hanya dengan kedua pertimbangan tersebut arti dari kurikulum tersebut dapat ditetapkan
terlebih mantap. Dengan demikian, pada waktu evaluator memberikan umpan balik kepada
pembuat keputusan, pertimbangan yang diberikannya adalah pertimbangan yang bersifat
menyeluruh (komprehensif).
Model Stake ini lebih dapat dipergunakan untuk melakukan evaluasi mengenai pelaksanaan
implementasi kurikulum dalam konteks pendidikan Indonesia. Proses pengembangan
kurikulum di Indoensia sedemikian rupa sehungga kurikulum sebagai rencana dibuat di
tingkat basional dan bersifat “tidak siap pakai”. Guru masih harus mengembangkan rencana
besar tersebut menjadi rencana yang lebih operasional, yang dalam istilah kependidikan di
Indonesia disebut satuan pelajaran (SP). Satuan pelajaran inilah yang dapat dipergunakan
untuk mengisi matriks intent model yang dikemukakan Stake.
Mengenai standar yang diinginkan Stake dapat dikembangkan dari komponen yang ada
dalam rencana besar kurikulum tersebut. Meskipun demikian, tidak ada salahnya apabila
evaluator juga mempergunakan standar yang dikembangkan dari para ahli bidang studi
bersangkutan. Tentu saja masalah akan timbul apabila antara standar yang dikembangkan dari
rencana besar tidak bersesuaian dengan yang dikembangkan dari para ahli tadi. Tapi
persoalan yang demikian juga dihadapi setiap evaluator yang mempergunakan model Stake
ini, meskipun dalam konteks pendidikan di AS di mana model ini dilahirkan. Hal ini pula
kiranya yang menyebabkan mengapa Stake (1972:100) menganjurkan agar jangan
mengevaluasi kurikulum dengan mikroskop tetapi seharusnya dengan “a panoramic view
finder”. Adanya beragam standar akan memebrikan kesempatan kepada evaluator untuk
mempergunakan standar tersebut sebagai teorpong panorama dan buka mikroskop.
Meskipun demikian untuk konteks pendidiakn di Indonesia, selain untuk mengevaluasi
dimensi kurikulum sebagai kegiatan, model Stake ini dapat dipergunakan dalam
pengembangan kurikulum di tringkat nasional apabila eksperimen dilakukan. Pada waktu
eksperimen, pengembang kurikulum dapat menerapkan model ini sepenuhnya karena semua
persyaratan Stake terpenuhi.

3. Model CIPP

Model ini dikembangkan oleh suatu tim yang diketuai Stufflebeam. Pada waktu memimpin
tim ini ia bekerja di Ohio State University. Meskipun demikian, tim yang dipimpinnya
tersebut terdiri dari para sarjana yang berkerja di berbagai universitas dan salah seorang
anggotanya, Gephart, adalah sarjana yang bekerja di Phi Delta Kappa (PDK). Organisasi ini
pula yang menugaskan Stufflebeam dan kawan-kawannya berkarya mengembangkan
pemikiran tentang evaluasi pendidikan. Oleh karena itu, model yang mereka kembangkan itu
kadang-kadang dinamakan pula dengan model PDK.
Nama CIPP, dalam kenyataannya lebih dikenal masyarakat perguruan tinggi dan kalangan
evaluator. Hal ini mungkin sekali disebabkan CIPP adalah singkatan dari Context, Input,
Process dan Product. Memang keempat daerah kerja ini adalah komponen utama dari model
ini. Dalam buku yang mereka tulis, model tersebut dikemukakan dalam bab 7, setelah mereka
mendiskusikan pikiran mereka mengenai evaluasi dan hubungannya dengan pembuatan
keputusan. Dalam buku suntingan Madaus, Scriven dan Stufflebeam (1983) model ini
dibicarakan kembali dalam bab 7 pula, ditulis oleh Stufflebeam sendiri. Tetapi dalam buku
suntingan ini, Evaluation Model, Stufflebeam membuat semacam penyederhanaan yang
sebenarnya lebih mengena pada pokok ide tentang model itu sendiri.
Menurut Stufflebem (1983:117) model ini telah diterapkan di banyak tempat di A.S. dan
telah dibahas dalam beberapa disertasi doktor. Di antara beberapa disertasi dibuat oleh
mahasiswa di the Ohio State Universiry. Sayangnya, di universitas ini pada saat sekarang
sudah tidak menunjukkan bekas-bekas hasil kerja profesor tersebut. Seolah-olah hasil binaan
Stufflebeam di unversitas tersebut sirna begitu saja. Adalah wajar pula kalau model CIPP ini
berkembang di universitas Western Michigan di mana Stufflebeam sekarang ini bekerja.
Penyederhanaan model dalam bentuk diagram dilakukan setelah ia meninggalkan the Ohio
State Unversity.
Meskipun terjadi penyederhanaan, pokok-pokok pikiran CIPP yang dikembang-kan tim PDK
masih tetap merupakan dasar dari penyederhanaan yang dilakukan Stufflebeam. Oleh karena
itu, pembahasan mengenai model CIPP ini tidak akan membandingkan antara keduanya.
Pembahasan dilakukan berdasarkan model yang dikembangkan terakhir.
Sesuai dengan namanya, model ini terbentuk dari 4 jenis evaluasi yaitu evaluasi konteks
(Context), masukan (Input), proses (Process) dan hasil (Product). Keempat evaluasi ini
merupakan suatu rangkaian keutuhan. Tetapi seperti dikemukakan oleh Stufflebeam sendiri,
dalam pelaksanaan seorang evaluator dapat saja hanya melakukan satu jenis atau kombinasi
dari dua atau lebih jenis evaluasi itu (Stufflebeam, 1983:122). Artinya, seorang evaluator
tidak selalu harus mempergunakan keempatnya. Walaupun demikian, karena model ini
dikembangkan berdasarkan suatu pandangan tentang kegiatan kurikulum sebagai sesuatu
dalam dimensinya yang utuh, pelaksanaan ke empat jenis evaluasi model ini merupakan hal
yang diharapkan. Lagi pula kekuatan model sebetulnya terletak dari rangkaian kegiatan
keempat jenis evaluasi itu sendiri.
Sesuai dengan namanya, keempat jenis evaluasi Stufflebeam ini mempunyai obyek kejian
yang berbeda. Evaluasi konteks ditujukan untuk menilai keadaan yang sedang dilakukan oleh
suatu lembaga pendidikan. Jadi, evaluasi ini tidak mengharuskan lembaga pendidikan
mempunyai suatu kurikulum baru terlebih dahulu untuk melakukan kegiatan evaluasi.
Evaluasi justru dilakukan dari kegiatan awal sebelum suatu inovasi kurikulum direncanakan.
Bahkan adalah fungsi dari evaluasi konteks untuk melihat apakah diperlukan adanya suatu
inovasi atau tidak.
Tujuan evaluasi konteks yang utama ialah untuk mengetahui kekuatan dan kelemahan yang
dimiliki evaluan (Stufflebeam, 1983:128). Dengan mengetahui kekuatan dan kelemahan ini,
evaluator dapat memberikan arah perbaikan yang diperlukan. Dalam melakukan evaluasi ini
evaluator harus dapat menemukan kebutuhan yang diperlukan evaluan. Oleh karena itu,
evaluan konteks ini sebagian tigasnya adalah melakukan need assesment. Tetapi, selain dari

need asesment, evaluasi konteks ini harus pula dapat memberikan pertimbangan apakah
tujuan yang akan dicapai sesuai dengan kebutuhan yang telah ditentukan.
Dari tugas yang harus dilakukan terlihat nahwa evaluasi konteks mencoba untuk memberikan
pertimbangan mengenai nilai dan arti dari auatu keadaan. Nilai diperlihat-kan dengan
mengemukakan mengenai keadaan evaluan. Kekuatan dan kelemahan yang dimiliki evaluan
merupakan hasil pertimbangan evaluator tentang nilai evaluan. Sedangkan arti evaluan
diperlihatkan dengan memberikan pertimbangan apakah tujuan yang akan dicapai sesuai
dengan kebutuhan.
Dari evaluasi konteks ini terlihat perbedaan antara model CIPP ini dengan model-model
evaluasi yang telah dibahas terdahulu. Model-model lain mulai dengan adanya suatu inovasi
yang sedang dilaksanakan oleh suatu lembaga pendidikan. Inovasi itu yang kemudian
dijadikan evaluan. CIPP bahkan membantu evaluan untuk memutus-kan apakah inovasi
diperlukan atau tidak. Kalau perlu, evaluator yang mempergunakan model CIPP tidak lantas
berpangku tangan. Evaluator harus dapat menentukan skala inovasi yang dilakukan.
Dalam model aslinya dikenal ada tiga jenis skala inovasi yang mungkin dilakukan. Ketiganya
diberi label yang cukup klasik walaupun cukup jelas menggambarkan skala yang dimaksud.
Ketiganya ialah homeostatic, incremental, dan neobolistic. Homeostatic merupakan skala
terendah di mana inovasi yang akan dilakukan hanya memasukkan unsur baru yang tidak
berarti. Dapat dikatakan bahwa skala inovasi homeostatic tidak akan mengubah pola kegiatan
yang sudah ada. Hanya elemen tertentu dari pola yang ada yang harus diubah. Dampak
perubahan hanya bersifat mikro. Oleh karena itu, apabila inovasi yang akan dilakukan
bersifat homeostatic, evaluasi berikutnya tidak dapat dikatakan tidak diperlukan. Tetapi
apabila skala inovasi yang akan dilakukan bersifat incremental (penambahan), apalagi dalam
skala noebolistic, evaluasi berikutnya yaitu evaluasi masukan merupakan suatu yang
dipersyaratkan.
Mengapa demikian? Seperti dikemukakan oleh Stufflebeam (1983:130), bahwa “orientasi
utama evaluasi ialah mengemukakan suatu program yang dapat mencapai apa yang
diinginkan lembaga tersebut.” Program yang dimaksudkan ialah program yang membawa
perubahan yang membawa perubahan berskala penambahan dan pembaharu-an. Lebih lanjut,
Staufflebeam menulis:
This type of study should identify and rate relevant approaches (including any that are
already in operation) and assist and explicating and “shaking down” the one that is chosen for
instalation or continuation. It should also search the client’s environment for barriers,
constraints, and potentially available resources that need to be taken info account in the
process of activating the program.

Dengan demikian evaluasi masukan tidak hanya melihat apa yang ada pada lingkungan
lembaga tersebut ( baik material maupun personal) tetapi juga harus dapat memperkira-kan
kemungkinan-kemungkinan yang akan dihadapi di waktu mendatang ketika suatu inovasi
kurikulum dilaksanakan.
Dari apa yang telah dibicarakan mengenai evaluasi masukan ini, makin jelas bahwa CIPP
tidak hanya dilaksanakan dalam situasi di mana suatu inovasi sedang dilaksanakan tetapi
justru model ini dilakukan ketika inovasi itu akan atau belum dilaksanakan. Meskipun
demikian, tidaklah berarti bahwa CIPP tidak dapat dapat dilaksanakan apabila suatu inovasi
kurikulum sedang dalam proses pelaksanaan. CIPP tetap dapat dilakukan kendati suatu
lembaga pendidikan telah melaksanakan suatu inovasi kurikulum dalam waktu tertentu.
Seperti telah dikemukakan, Stufflebeam telah mengatakan CIPP tidak mutlak harus
digunakan dalam keseluruhan model, CIPP dapat digunakan dalam salah satu atau kombinasi
dari dua atau lebih kegiatan evaluasi. Jadi, CIPP dapat digunakan hanya dengan
menggunakan evaluasi proses saja. Mengingat obyek kajian dan tujuan yang akan dicapai

evaluasi proses, CIPP dapat digunakan walaupun bukan dari sejak awal ketika akan
menemukan ide inovasi.
Evaluasi proses adalah evaluasi mengenai pelaksanan dari suatu inovasi kurikulum. Jadi,
kalau evaluasi konteks adalah evaluasi kurikulum dalam dimensi pengertian sebagai ide,
evaluasi masukan adalah evaluasi kurikulum dalam dimensi pengertian sebagai rencana,
evaluasi proses adalah evaluasi kurikulum dalam dimensi pengertian sebagai realita atau
kegiatan. Artinya, evaluasi proses ini baru dapat dilakukan apabila inovasi kurikulum tersebut
telah dilaksanakan di lapangan, bukan pada waktu ia dirancang. Oleh karena itu, evaluator
dapat saja menggunakan model CIPP walaupun ia baru diminta berpartisipasi ketika suatu
program inovasi sedang dilaksanakan.
Dalam pelaksanaannya, model CIPP ini bertujuan memperbaiki keadaan yang ada. Evaluator
diminta untuk menentukan sampai sejauh mana rencana inovasi itu dilaksanakan di lapangan,
hambatan-hambatan apa yang ditemui yang tak dapat diperkirakan sebelumnya, dan
perubahan-perubahan apa yang harus dilakukan terhadap inovasi tersebut. Informasi yang
dikumpulkan disajikan sebagai umpan balik bagi para pengelola dan juga staf. Dengan
demikian, keputusan-keputusan yang diperlukan dalam usaha memperbaiki proses yang
sedang berlangsung dapat dilaksanakan.
Dari tujuan yang akan dicapai oleh evaluasi proses CIPP ini terlihat jelas bahwa CIPP
mempergunakan pendekatan pengembangan kriteria baik yang bersifat fidelity maupun yang
bersifat “mutual adaptive”. Kriteria yang bersifat fidelity terlihat dari tujuan untuk
menentukan sampai sejauh mana rencana inovasi yang dibuat telah tercapai. Pendekatan
“mutual adaptive” terlihat dari adanya usaha untuk memperbaiki keadaan lapangan agar
inovasi itu sendiri. Artinya, evaluator yang melaksanakan evaluasi proses ini harus pula dapat
memberikan informasi mengenai hal-hal apa dari lapangan yang harus diubah dan komponen
apa dari inovasi yang harus pula diubah. Dengan perubahan-perubahan tersebut diharapkan
inovasi dan lapangan mencapai kesesuaian.
Evaluasi hasil adalah kegiatan evaluasi berikutnya dalam model CIPP. Tujuan utama dari
evaluasi hasil ini adalah untuk menentukan sampai sejauh mana kurikulum yang
dimplementasikan tersebut telah dapat memenuhi kebutuhan kelompok yang
mempergunakannya (Stufflebeam, 1983:134). Dalam hal ini, diharapkan pula bahwa evaluasi
hasil memperlihatkan pengaruh program tidak hanya yang bersifat langsung tapi juga
pengaruh tidak langsung. Pengaruh tersebut tidak saja yang bersifat positif (biasanya evaluasi
hasil hanya melihat pengaruh dari sudut pandangan positif ini), tetapi juga pengaruh negatif
dari kurikulum tersebut.
Adanya pengaruh negatif ini kedengarannya aneh tetapi sebenarnya realistis. Bukankah suatu
hal yang mustahil bahwa suatu kurikulum menghasilkan pengaruh sampingan yang bersifat
negatif yang tidak pernah diperkirakan oleh para pengembang-nya. Misalnya, suatu
kurikulum yang dikembangkan berdasarkan tradisi intelektual. Hasilnya, mungkin
memberikan kemampuan intelektual tinggi bagi siswa tapi dapat pula kemampuan intelektual
tinggi tersebut menyebabkan siswanya menjadi ingkar terhadap agama. Dalam suatu studi di
AS, misalnya, ditemukan bahwa program yang dikembangkan berdasarkan pandangan
humanistik, memberikan pengaruh negatif dalam aspek disiplin. Evaluasi hasil dalam konsep
CIPP ini memberikan laporan komprehensif mengenai pengaruh dari program tersebut.
Untuk itu barangkali suatu perbandingan dengan kurikulum lainnya perlu dilakukan sehingga
pendekatan pengembangan kriteria “preordinate” yang dipergunakan.
Adanya ruang lingkup pengaruh yang luas sebagai fokus kajian evaluasi hasil CIPP
memberikan kesan ada pengaruh model evaluasi Goal Free dari Scriven. Sayangnya, hal
tersebut tidak dapat dinyatakan secara pasti. Paling tidak adanya pengaruh tersebut tidak
dapat diidentifikasi dari bacaan yang dipergunakan Stufflebeam. Kiranya korespondensi
pribadi dapat lebih menjelaskan persoalan. Sayangnya, korespondensi semacam itu belum

dapat dilakukan penulis buku ini. Hanya pada bagian awal tulisannya, dikatakan ia
berhubungan dengan Scriven. Bahkan mereka berdua pernah diminta untuk membicarakan
model masing-masing pada beberapa lembaga. Bukan tidak mungkin pengaruh tersebut
berkembang selama masa ini. Atau, ide tersebut memang muncul secara terpisah pada kedua
diri pengembang model tersebut walaupun keduanya sering berdiskusi.
Suatu hal yang pasti dan diakui oleh Stufflebeam bahwa terdapat perbedaan pandangan
mengenai peran evaluasi yang cukup prinsipil antara dia dengan Scriven. Sementara model
CIPP lebih menekankan pada peran formatif sedangkan model Scriven, baik formatif-sumatif
maupun Goal Free, sangat memberikan perhatian yang besar terhadap peran sumatif. Oleh
karena itu dalam evaluasi hasil inipun model CIPP memberikan posisi penting bagi peran
formatif. Artinya, informasi yang dihasilkan evaluasi hasil CIPP tidak dipergunakan untuk
menentukan apakah suatu program harus diganti. Informasi yang diberikan digunakan untuk
menetapkan apakah ada komponen kurikulum yang harus diperbaiki.
Karena sifatnya yang demikian, adalah sangat berbahaya kalau evaluasi hasil model CIPP ini
dilakukan secara terpisah. Keterbatasan ruang lingkup evaluasi hasil merupakan hambatan
sehingga informasi yang diberikan tidak cukup kuat untuk dipergunakan sebagai landasan
dalam memperbaiki program. Misalnya, katakanlah kalau evaluasi hasil menunjukkan bahwa
hasil belajar siswa sangat rendah dibanding-kan dengan apa yang direncanakan. Lantas,
kesimpulan apa yang dapat diambil? Apakah kelemahan tersebut disebabkan oleh faktor
masukan ataukah faktor proses.
Atau, mungkin kelemahan itu disebabkan kelemahan dalam kurikulum itu sebagai suatu ide?
Adanya kelemahan semacam ini bukannya tidak disadari oleh Stufflebeam. Oleh karena itu ia
menganjurkan, kalaulah jenis-jenis evaluasi yang ada dalam CIPP akan dilakukan tidak
seutuhnya, sebaiknya pekerjaan evaluasi meng-gabungkan dua atau lebih dari jenis evaluasi
yang ada. Dengan adanya penggabungan ini tentu saja kelemahan seperti yang diungkapkan
di atas tidak perlu dikhawatirkan. Keunggulan suatu jenis evaluasi dapat menutupi kelemahan
jenis evaluasi lainnya.
Tampaknya, kalau model CIPP ini diperhatikan, yang paling dapat diper-tanggungjawabkan
ialah evaluasi konteks di sati pihak, evaluasi masukan, proses, dan hasil di lain pihak.
Pemisahan semacam ini merupakan suatu penyelesaian terutama apabila evaluasi hasil akan
dilakukan. Apabila evaluasi hasil tidak diikutsertakan, persoalannya tidaklah begitu
mengkhawatirkan. Setiap gabungan lainnya tidak akan membawa persoalan yang
mengandung resiko tinggi bagi pengambil keputusan.
Sudah tentu yang terbaik ialah apabila keseluruhan model CIPP dapat dilaksana-kan. Gambar
6 memperlihatkan alur kerja keseluruhan model tersebut. Seperti terlihat dalam gambar
tersebut, dalam model ini perbedaan kegiatan dinyatakan dengan perbedaan bentuk. Bentuk
kotak persegi empat digunakan untuk menggambarkan kegiatan pelaksanaan. Bentuk belah
ketupat digunakan untuk menggambarkan keputusan yang harus diambil. Oleh karena itu
dalam setiap keputusan itu ada garis ya yang berarti keputusan yang diambil mengiyakan
pertanyaan ayanga ada dalam bentuk belah ketupat itu. Sedangkan tidak berarti menolak
pertanyaan yang diajukan. Bentuk lonjong (oval) menunjukkan kegiatan evaluasi yang
dilakukan. Bagi pembaca yang kenal dnegan program komputer tentu saja bentuk-bentuk
tersebut bukanlah sesuatu yang baru.
Dalam diagram asli mengenal CIPP kotak untuk kegiatan evaluasi proses dan hasil
dipisahkan. Dalam diagram terbaru ini Stufflebeam menggabungkan kedua kegiatan evaluasi
itu dalam satu kotak. Kiranya, penggabungan ini merupakan sesuatu yang sugestif bahwa
paling tidak evaluasi hasil harus digabungkan dalam pelaksanaan-nya dengan evaluasi proses.
Gambar 6 yang memperlihatkan alur kerja model CIPP itu sangat jelas memperlihatkan
kapan suatu evaluasi diadakan dan jenis keputusan apa diharapkan, serta tindak lanjut apa
yang dapat dilakukan berdasarkan keputusan yang diambil. Sebagai contoh, evaluasi konteks

secara berkala melakukan kajian terhadap pelaksanaan sistem yang berlaku. Dari hasil kajian
itu harus dapat diputuskan apakah suatu inovasi diperlukan. Kalau tidak, kembali
melaksanakan apa yang sedang dilakukan oleh lembaga pendidikan itu. Kalau suatu inovasi
diperlukan (ya), masalah yang dihadapi harus diidentifikasi dan tujuan yang akan dicapai
harus pula dirumuskan. Setelah itu, keputusan yang harus diambil adalah apakah pemecahan
masalah sudah memuaskan. Kalau sudah, solusi itu dilaksanakan. Kalau tidak, evaluasi
masukan dilaksanakan. Demikian seterusnya.
Model CIPP ini memiliki keunggulan terutama apabila keseluruhan model dilaksanakan.
Keempat dimensi kurikulum, seperti yang dibicaraan dalam buku ini dapat dilayani dengan
baik oleh model ini. Kurikulum dalam dimensi ide dapat dievaluasi meklakui evaluasi
konteks. Pertnyaan keputusan tentang apakah suatu ide inovasi kurikulum mempunyai
kekuatan justifikasi adalah pertanyaan dasar dalam kajian dimensi ide. Evaluasi masukan
dapat ditujukan kepada kurikulum dalam dimensi sebagai rencana. Seperti diketahui dalam
pendekatan sistem, yang juga sebenarnya merupakan dasar pemikiran model CIPP ini,
kurikulum sebagai rencana adalah suatu masukan (kadang-kadang disebut dengan istilah
“instrumental input”. Sedangkan evaluasi proses dan hasil, sesuai dengan namanya, ditujukan
untuk mengkaji dimensi proses dan hasil suatu kurikulum.
Keunggulan lain dari model ini ialah peran aktif evaluator sejak awal. Seperti telah
dikemukakan, evaluasi konteks dilaksanakan bahkan sebelum suatu ide inovasi dirumuskan
secara kongkrit. Evaluator harus melihat keadaan yang barlaku dan kemudian, berdasarkan
hasil kajian tersebut, mempertanyakan apakah suatu inovasi diperlukan. Di sini evaluator
bertindak sebagai orang yang mempunyai posisi penting dalam membantu memberikan
penyelesaian terhadap masalah yang dihadapi suatu lembaga pendidikan. Sepanjang
pengetahuan penulis, model lain tidak memberikan pesan yang sedemikian penting bagi
evaluator terkecuali kejian “need assessment” yang biasanya dimasukkan dalam ruang
lingkup kajian perencanaan. Tetapi model CIPP menempatkan kajian “need assessment”
sebagai salah satu teknik evaluasi konteks dan memberikan kedudukan yang penting bagi
evaluator dalam suatu usaha inovasi.
Kelemahan model ini ialah apabila ia diterapkan secara bagian demi bagian (partial).
Penerapan yang demikian melemahkan ide dasar model. Pelaksanaan kombinasi antar dua
atau lebih jenis evaluasi menyebabkan alur kegiatan evaluasi menjadi tidak utuh. Dengan
pelaksanaan yang demikian, hubungan antara satu keputusan dengan keputusan lain dapat
kehilangan kesinambungan.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->