You are on page 1of 15

Penilaian dalam musik: bendera Merah di matahari terbenam

Pembaca perlu tahu bahwa aku tidak bisa mengingat pertemuan tes aku tidak
suka. Tentu saja, ada yang lebih baik dan lebih miskin instrumen penilaian, tapi
semua tes memiliki nilai untuk mengajar dan belajar. Jika seseorang dapat menjadi
"testaholic," maka saya salah. Cintaku pada perangkat penilaian telah berkembang
selama bertahun-tahun, dan ini terutama kuat pada saat ini, karena saya melihat siswa
yang tidak menerima umpan balik yang konstruktif segera gagal. (Konstruktif adalah
kata penting di sini; siswa musik apa menerima beralasan, pujian kelompok
ditangguhkan) Saya sering tersinggung oleh FairTest, sebuah organisasi pengawas
dengan niat baik tentang penilaian sekolah, yang sering menyerang tes dan program
pengujian yang kekurangan adalah karena keterbatasan dalam. waktu dan uang,
faktor-faktor di luar kendali mereka penyelenggara tes.

Nasional tahun 1997 Kemajuan Penilaian Pendidikan (NAEP) kajian musik


adalah yang ketiga dari jenisnya. The NAEP pertama di musik, yang diberikan dalam
1971-1972 (selanjutnya disebut sebagai tes 1971), adalah tes yang baik yang dapat
dijadikan sebagai dasar untuk perbandingan (penelitian semua harus memiliki garis
dasar). Tahun 1971 NAEP meminta siswa untuk menyanyikan sendiri; bernyanyi
dengan orang lain; instrumen bermain, berimprovisasi melodically, berirama, dan
harmonik; bernyanyi pada pandangan; bermain pada pandangan, dan melakukan solo
siap-semua karena mereka telah tepat, bukan karena beberapa tugas-tugas sesuai
agenda sudah ada sebelumnya. Hanya sedikit dari 150 item musik dikembangkan
untuk tes 1971 adalah dari berbagai-kertas tradisional dan - pensil (NAEP 1974, 1).
Telah banyak belajar tentang penilaian sejak saat itu, dan jadi saya bersemangat
diantisipasi NAEP tahun 1997. Pada "hari rilis," 10 November 1998, saya menonton
berita malam, tetapi tidak menyebutkan melihat hasil tes. The New York Times
mengambil news release Departemen Pendidikan, yang hanya disebutkan persentase
sekolah yang menawarkan musik, seni visual, tari, dan teater di Amerika Serikat.
Tidak ada laporan tentang kompetensi siswa, tidak ada untuk menangkap kepentingan
publik Amerika. Kami tidak membutuhkan penilaian nasional untuk
menginformasikan kepada kami bahwa 81 persen sekolah menengah Amerika yang
ditawarkan musik setidaknya sekali seminggu dan bahwa musik ditawarkan di 91
persen sekolah menengah (NCES 1998, 146) .1 Pendidikan Seni Pusat Penelitian
Urbana, Illinois, serta Dinas Pendidikan, memberikan data tersebut beberapa tahun
yang lalu (Leonhard 1991, 48; Carey et. al 1995, 4) 0,2

The NAEP 1997 Seni Report Card, yang sebagian dokumen hasil penilaian,
tidak menunjukkan sejauh mana musik yang diperlukan dan / atau pilihan di sekolah-
sekolah menengah dan SMP, bagaimana peluang atau persyaratan mungkin berbeda di
K-8 konfigurasi, apa pengalaman musikal memenuhi semua persyaratan yang ada,
atau apa persen sekolah bertemu Music Educators National Conference (MENC)
kesempatan-untuk-belajar standar periode 45minute, setiap hari (MENC 1995, 18).
Masalah yang lebih besar, bagaimanapun, adalah bertentangan seluruh data Seni
Report Card. Satu tabel menunjukkan bahwa 2 persen dari sekolah tidak mengajarkan
musik, sementara negara lain 7 persen (153, 157). Yang penting adalah bukan jumlah
instruksi musik yang ditawarkan (musik yang diajarkan di hampir setiap sekolah di
Amerika Serikat) tetapi kualitas instruksi itu. Ketika persentase tersebut mencerna,
pembaca Seni Laporan Kartu hati-hati harus membedakan antara apakah data
mengacu pada sekolah-sekolah atau siswa, tetapi bahkan perbedaan ini tidak akan
menghapus beberapa kontradiksi. Kontradiksi yang saya percaya sangat penting
dalam menginterpretasikan laporan ini adalah bahwa, menurut mahasiswa, antara 34
dan 40 persen dari mereka yang dinilai tidak terdaftar dalam musik (38-39), tapi para
pelaku melaporkan pendaftaran 91 persen (146).

Aku menerima kenyataan bahwa penilaian seni dan pendidikan seni tidak item
prioritas tinggi di Amerika Serikat dan tidak membuat berita utama. Sebuah instrumen
penilaian yang baik, namun dibangun di atas tahun 1971 dan 1978 NAEP baik
instrumen, bisa menjadi model bagi para guru individu maupun bagi sekolah
kabupaten dan negara, dan dengan demikian akan berita. pemeriksaan dekat saya Seni
Laporan Kartu membuat saya percaya bahwa pendidik musik akan sangat kecewa
dengan hasil pengujian, yang meskipun cukup positif tak terduga yang tidak rata.
Advance publisitas telah memimpin kita untuk percaya bahwa tujuan dari penilaian
seni ini adalah sama dengan tujuan semua tes NAEP: untuk menentukan kompetensi
musik siswa di kelas empat, delapan, dan dua belas. Karena masalah anggaran,
evaluasi menyeluruh terhadap hanya kelas delapan mungkin (Ringkasan Eksekutif, ii,
186); tes pilot hanya yang diberikan kepada siswa kelas empat dan dua belas.
Penilaian berikutnya dijadwalkan untuk tahun 2007. Penilaian ini juga didukung
sebesar 1,2 juta dolar dari National Endowment for Seni (Nea) dan Lembaga
Pendidikan Getty Seni untuk memastikan perencanaan yang memadai dan penilaian
(NAGB 1998).

Tes berlaku dinilai terutama dengan tujuan, bukan oleh kualitas setiap item.
Suatu pemeriksaan yang seksama terhadap musik tahun 1997 item penilaian tes
menunjukkan kepada saya bahwa tujuannya tidak untuk menilai apa yang siswa tahu
dan bisa dilakukan, tetapi untuk menentukan sejauh mana standar nasional pendidikan
sukarela dalam seni musik telah dilaksanakan dan untuk mempromosikan
pembelajaran yang dipilih tujuan. (Mereka yang "tersembunyi" tujuan juga tidak
tercapai karena hasil NAEP sangat dipengaruhi oleh out-of - pengalaman sekolah.
Saya menggunakan "istilah yang dipilih," karena tidak semua tujuan dalam standar
nasional sukarela telah memadai dan karena dinilai penilaian ini berbeda dari
pemeriksaan NAEP lain di sebagian besar tujuan program musik ini tidak termasuk.)
Ada beberapa kesulitan dengan hubungan antara standar nasional dan penilaian
nasional. Pada bulan November 1998, Charles Leonhard dikutip mengatakan bahwa
penilaian seharusnya berdasarkan pada tujuan utama dari seni, "untuk
mengembangkan bakat dan kasih untuk seni," bukan pada standar nasional sukarela
(Manzo 1998, 9) . Leonhard benar percaya bahwa disayangkan bahwa, meskipun
usaha keras MENC untuk memusatkan perhatian pada standar, mereka tidak menjadi
sasaran perdebatan nasional yang kuat dengan prioritas yang musisi dan guru dapat
menerima. kerangka Negara tidak mencerminkan tujuan nasional, dan beberapa
perguruan tinggi mengakui standar dalam kurikulum pendidikan guru, tetapi prioritas
belum ditetapkan, dan program musik yang sehat, terutama yang mana kinerja adalah
penting, tidak dianggap menangani semua sembilan standar. Saat ini tidak ada
perjanjian untuk tingkat kompetensi yang diharapkan semua siswa, tetapi penting
bahwa kinerja dan kesempatan - untuk-belajar standar menyertai suatu standar isi.
kesempatan MENC's-tolearn dan kinerja standar itu tampaknya tidak dipertimbangkan
dalam membangun item atau dalam menafsirkan data penilaian musik (MENC 1995;
MENC 1996).

Deborah Haimo (1998, 48) menyatakan sentimen serupa dengan Charles


Leonhard ketika ia berpendapat bahwa dalam upaya untuk mencapai setiap
mahasiswa, esensi dari subjek yang hilang dan bahwa standar biasanya kurang
keringkasan dan panjang, jelas, dan terbuka untuk keliru dan salah tafsir. Diane
Ravitch (1995, 5) tegas menyatakan bahwa tujuan memiliki standar adalah sinyal
kepada para siswa dan guru jenis prestasi yang mungkin dengan kerja keras.
Pandangan sekilas kasual pada pertanyaan NAEP dirilis sudah cukup untuk
menunjukkan kepada pembaca (atau mahasiswa) bahwa banyak tujuan diuji dapat
dengan mudah dicapai tanpa instruksi formal. Siswa kekurangan suatu tugas tidak
indikator bahwa tugas yang sesuai sebagai standar kelas delapan atau tes item.

Data teknis dan semua item tes belum dirilis pada saat tenggat waktu untuk
jurnal ini, jadi saya terpaksa fokus pada keterbatasan tes sebagai indikator penilaian
nasional berdasarkan data dalam Seni Report Card. Ujian ini mencakup item yang
ditulis dengan baik, baik yang sesuai dan cocok untuk kelas delapan. Perhatian perlu
dilakukan, Namun, dalam membuat koneksi antara keterampilan dinilai dan instruksi
musik di sekolah-sekolah. Ada indikator yang menunjukkan bahwa penilaian itu tidak
menyeluruh sebagai salah satu akan menyukai. Seni Laporan Kartu menunjukkan
kecerobohan yang cukup besar dalam rancangan, administrasi, dan pelaporan. Ruang
tidak mengijinkan saya untuk memberikan contoh yang memadai dalam soal tes,
sampling matriks, dan individu teori respon (IRT), tapi saya berkaitan dengan
pemesanan masing-masing. Para pemimpin profesi perlu tahu sejauh mana hasil
penilaian NAEP dapat digunakan untuk mendukung atau memandu perubahan
kurikuler atau penilaian dalam musik mengajar dan belajar.

Sebuah artikel halaman depan 18 November 1998 Pendidikan Minggu,


berjudul "NAEP Paints Miskin Picture of Arts Savvy," menggambarkan kompetensi
siswa musik negatif dan berakhir dengan pernyataan anggota Kongres Jay Dickey
bahwa "] w [e perlu melakukan investasi yang dasar pertama, dan mereka membantu
anak-anak membaca dan menulis "(Manzo 1998). Para anggota Kongres, seperti
banyak orang lain, menawarkan simpati tapi tidak mendukung. Hasil penilaian musik
yang positif-jauh lebih baik daripada hasil dalam studi sosial, misalnya, di mana
hanya 2 persen dari siswa bisa nama keadilan ketua Mahkamah Agung dan lebih tahu
bahwa Leonardo DiCaprio merupakan bintang Titanic dari tahu nama presiden-wakil
dari Amerika Serikat. Jauh lebih siswa mengidentifikasi rumah Beavis and Butthead
(Springfield) dari rumah Abraham Lincoln (Springfield, Illinois) (Pusat Konstitusi
Nasional 1998). Hasil tes tentang pengetahuan siswa tentang geografi dan sejarah
telah lebih mengatakan dari hasil penilaian pengetahuan musik dan kinerja.
Deborah Haimo (1998, 64) menunjukkan bahwa "membenarkan standar memerlukan
lebih daripada deskripsi bersinar dari mereka yang secara langsung terlibat dalam
penciptaan mereka." Itu adalah sisi bawah untuk memiliki individu yang sama
membuat kedua kerangka dan tes berisiko tinggi. Selanjutnya, para penulis NAEP
1997 Seni Report Card tidak konsisten dalam alasan mereka, berusaha untuk memiliki
yang terbaik dari dua dunia, seperti filsuf eklektik. Meskipun mereka tidak diuji,
keterampilan extramusical ditekankan lebih dari keterampilan musik ekspresif dalam
laporan.

Seni Laporan Kartu menyebutkan studi Rauscher, yang dilakukan di


University of California di Irvine, dengan Gordon Shaw, pada kesadaran temporal-
spasial ditingkatkan. Hal ini juga menyebutkan perbaikan verbal dan nilai matematika
di SAT, indikator keberhasilan perguruan tinggi. (Ada putuskan antara hasil tes yang
menekankan keterampilan komposisi dan klaim atas nilai SAT tinggi yang dihasilkan
dari empat tahun pengalaman kinerja di sekolah tinggi) Satu juga bertanya-tanya
seberapa baik komposisi dinilai ketika siswa tidak bisa membaca musik tidak ingat.
melodi mereka sendiri. Mungkin tanggung jawab pendidikan seni, keterampilan yang
telah diidentifikasi oleh Sekretaris Komisi untuk Mencapai Diperlukan Keterampilan
(SCANS) menjadi penting bagi dunia kerja, juga disebutkan. The Arts NAEP 1997
Laporan Kartu, setidaknya sebagian, dokumen advokasi untuk pendidikan seni,
mengkonfirmasikan pendekatan yang diambil oleh Menteri Pendidikan Richard Riley
ketika ia merilis dokumen dan komentar dalam presentasi 1 Desember interaktif
tentang hasil penilaian seni. Untuk Sekretaris Riley tujuan penting dari musik adalah
nonmusical: untuk belajar memecahkan masalah, berpikir kreatif, dan
mengembangkan disiplin mental.

Seni Report Card penulis menyatakan bahwa penilaian seni NAEP 1997
dirancang dalam hubungannya dengan Standar Nasional sukarela yang baru
dikembangkan untuk Seni Pendidikan (11). Beberapa standar konten digunakan,
namun kinerja MENC's standar yang sepenuhnya diabaikan. Standar isi telah diterima
dengan baik dan kurang kontroversial daripada kinerja dan kesempatan-tolearn
standar. Standar kinerja yang diterbitkan membedakan antara semua siswa dan
mahasiswa yang berpartisipasi dalam ansambel paduan suara atau instrumental.
Standar kinerja yang menyarankan bahwa mulai tahun lima kelas, mahasiswa mahir
dapat mempertahankan bagian-nya dalam sebuah lagu tiga bagian dengan tingkat
kesulitan grade 2 (MENC 1996, 64). Salah satu tugas NAEP dalam musik meminta
siswa untuk melihat-membaca "Amerika," lagu kebanyakan pelajar sudah tahu
dengan telinga. Prestasi dalam tugas seperti itu hampir tidak setara dengan standar
kinerja yang bernyanyi untuk grade 5-8 yang menyarankan bahwa siswa memiliki
kemampuan menyanyi dan musik dua-tiga-bagian dan akrab dengan luas repertoar
lagu. Standar yang digunakan dalam tahun 1997 untuk siswa kelas delapan NAEP
paling dekat menyamai standar kinerja MENC itu untuk tingkat 4-K (MENC 1996,
29).

Sangat menarik untuk melihat bahwa NAEP 1997 Seni Report Card berisi
agenda yang jelas untuk mempromosikan metode khusus penilaian; tidak ada
argumen yang mendasari seperti itu merupakan bagian dari laporan pada tahun 1971
dan 1978 penilaian. Tidak ada yang salah dengan salah satu metode yang digunakan
pada tahun 1997, hanya dilema yang mereka bawa ke atas. Seni Kartu Laporan
menyatakan bahwa "Menciptakan, Pertunjukan, dan Merespon semua ditekankan,
walaupun pendidik musik memiliki penekanan yang lebih besar biasanya ditempatkan
pada kinerja pekerjaan yang ada dan tanggapan siswa terhadap kinerja" (penekanan
ditambahkan) (3). Tes penulis di sini mengakui pengujian apa yang umumnya tidak
diajarkan, namun mereka mengklaim itu adalah "asli." Mereka bertentangan sendiri
ketika mereka mengutip Grant Wiggins definisi tentang "penilaian otentik" sebagai
"latihan [yang] lebih erat yang mencerminkan pengalaman siswa ketika mereka
belajar dan terlibat dalam kegiatan kelas" (10).

Sejarah NAEP di Musik

Jelas, tujuan tahun 1997 NAEP adalah berbeda dari tahun 1971 dan 1978
penilaian. Adegan pendidikan pada tahun 1997 diakui berbeda dari yang tahun 1971,
walaupun masih ada kesamaan lebih dari perbedaan. Pendidikan merupakan prioritas
tinggi pada tahun 1971, dan modernisasi kurikulum adalah prioritas tertinggi. Federal
dolar mengalir ke proyek-proyek kurikulum, dan kesuksesan mereka adalah prioritas
nasional. Gerakan penilaian nasional karena itu dirancang untuk membantu
pengembang kurikulum dengan jelas pelaporan Amerika apa yang pada usia empat
puluh sembilan tingkat, tiga belas, tujuh belas, dan dewasa muda tahu dan bisa
lakukan. Perbedaan utama antara 1971 dan hari ini adalah politisasi dari kehidupan di
Amerika, termasuk pendidikan. Hari ini, advokasi, politik, dan kebijakan utama
intrusi ke dalam keputusan pendidikan.

Laporan penilaian 1971 musik terutama menarik bahwa terasa bebas dari
agenda politik. Tidak ada upaya untuk menghubungkan penilaian terhadap
pengalaman sekolah, siswa tidak ditanya tentang instruksi musik sekolah mereka
tetapi hanya pertanyaan-pertanyaan umum seperti (Apakah Anda memainkan alat
musik?) Sebagaimana yang diperlukan untuk memilih mana individu-individu yang
harus mengambil bagian dari tes. Laporan akhir adalah dokumen objektif yang
diberikan persentase langsung pada kompetensi dan keterampilan yang diajarkan
secara luas di sekolah-sekolah dan diterima sebagai penting oleh masyarakat. Tujuan
rinci tes didistribusikan secara luas di publikasi, kecil terpisah; mereka mengikuti
praktek profesional yang berlaku saat itu.

Dalam skala penilaian turun 1978 (itu tidak termasuk penilaian kinerja) usaha
kecil hanya dibuat untuk berhubungan dengan hasil tes pada kurikulum sekolah. Data
menunjukkan bahwa 28 persen dari peserta ujian tidak punya instruksi musik, 48
persen tidak berpartisipasi dalam paduan suara, dan 50 persen tidak berpartisipasi
dalam band (NAEP 1981, 37). Situasi musik mungkin telah membaik sejak saat itu.
1991 Leonhard laporan mengindikasikan musik yang dibutuhkan dalam sekitar 30
persen sekolah menengah (48, 73). Kartu 1.997 laporan menunjukkan bahwa 91
persen dari siswa kelas delapan Amerika menerima beberapa instruksi musik dan
bahwa 43 persen menerima instruksi tiga sampai empat kali seminggu (146). Ini
adalah hanya salah satu tokoh dalam Seni Report Card yang saya pertanyaan.
Tidak adanya penilaian musik selama sembilan belas tahun 1997 membuat penilaian
politik penting. subyek Core, seperti sains dan matematika, secara teratur dinilai. Oleh
karena itu, keputusan untuk menerangkan isi dari instruksi sekolah musik melalui
penilaian nasional bobot politik. Tes itu secara longgar didasarkan pada sembilan
standar nasional untuk musik. Semua standar adalah untuk semua siswa. Berdasarkan
deskripsi isi penilaian 1997 musik (12), saya telah memastikan bahwa standar konten
yang dipilih untuk pengujian ini adalah standar 3 (improvisasi), standar 4 (menulis),
standar 6 (mendengarkan dan menganalisis musik), dan standar 7 (mengevaluasi
pertunjukan musik). Terbatas perhatian diberikan untuk menilai 5 standar isi (notasi
musik) dan tidak ada terhadap kinerja individu semua siswa. (Menilai efektifitas
sekolah dalam musik merupakan tugas yang rumit, karena siswa dapat belajar musik
di luar sekolah, mendengarkan musik selama berjam-jam setiap hari, dan mengajar
diri sendiri untuk bermain instrumen) Ada kesenjangan memutuskan antara
interpretasi saya dari standar nasional dan itu. dari mereka yang membangun NAEP.
Misalnya, karena bernyanyi dan bermain alat musik adalah dua standar pertama dan
merupakan inti dari instruksi musik di sekolah umum, orang akan diharapkan tahun
1997 NAEP untuk memiliki lebih autentik menilai kemampuan setiap siswa untuk
menyanyi dan memainkan melodi dan instrumen harmonis.

Bendera Merah

Karena, pada batas waktu untuk jurnal ini, data teknis belum dirilis, data dari
studi pilot belum dirilis, CD-ROM tidak tersedia secara umum, dan hanya pilih
sampel pertanyaan dan hasil yang tersedia dalam Seni Report Card, membuat
komentar tentang tes ini untung-untungan. (Seni Report Card adalah dokumen
penilaian yang tidak biasa di selektivitas pengungkapan-nya) Berdasarkan data yang
tidak lengkap., Analisis saya mungkin salah. Untuk siapa pun akrab dengan angka,
tetapi, ada banyak bendera merah untuk sinyal keraguan untuk kegunaan umum data
untuk kurikulum atau penilaian. Salah satu isu yang menjadi perhatian adalah apakah
uang itu benar-benar cukup untuk administrasi yang komprehensif dari penilaian di
tingkat kelas satu yang dipilih, sebagai penulis laporan menyatakan. Ada sejumlah
kekhawatiran lainnya.

Jenis Pertanyaan

Penilaian ini mencakup 21 pertanyaan pilihan ganda, yang terdiri hanya sekitar
5 persen dari waktu pengujian. Seni Kartu Laporan berisi hasil untuk lima orang. Pada
pertanyaan-pertanyaan siswa yang "sangat sukses," mencetak persentase yang benar
dari 66, 79, 55, 52, dan 42-optimum untuk tes yang dirancang untuk melakukan
diskriminasi. Menentukan meter dari sebuah lagu ("Wade in the Water") adalah
pertanyaan yang paling banyak-pilihan yang sulit bagi siswa kelas delapan, meskipun
ini adalah tugas yang sering digunakan dengan siswa kelas empat. Multiple - soal
pilihan yang tidak baik atau buruk keputusan pada jenis pertanyaan yang dibuat pada
apa yang ingin mengetahui dalam anggaran dan kendala waktu.

Test Desain

Para desainer uji memutuskan bahwa musik menggunakan 40 persen dari


tradisi Barat, (Renaisans melalui periode kontemporer); blues 35 persen, Injil, jazz,
negara, dan musik teater, dan 25 persen dari luar tradisi Barat itu sesuai dengan
"otentik penilaian "seperti yang didefinisikan oleh Wiggins. Meskipun persentase
sekolah data tertentu di dalam - yang kurang, ada alasan untuk meragukan bahwa 60
persen materi pembelajaran terletak di luar Renaissance ke masa kontemporer dan
terutama bahwa 25 persen berasal dari luar tradisi Barat.

Kesempatan untuk Belajar

Seni Report Card memberikan perhatian kepada konteks pendidikan siswa


untuk meyakinkan pembaca bahwa penilaian yang tepat telah dilakukan. Item
kontekstual penting yang seharusnya ditanyakan adalah apakah ini adalah pertama
kalinya mahasiswa yang pernah mengambil ujian musik. Saya akan berharap bahwa
siswa yang tidak pernah dinilai dalam musik menemukan penilaian pengalaman baru.
Pada tahun 1997, tampaknya ada upaya untuk menghubungkan kesempatan untuk
belajar hasil penilaian. Informasi dikumpulkan tentang jumlah instruksi kali seminggu
ditawarkan, apakah kurikulum yang diterbitkan ada, apakah sekolah menggunakan
mengunjungi seniman, jika sekolah mensponsori artis-dalam program-theschools,
situasi kerja dan pelatihan instruktur musik utama, apakah mahasiswa telah
menghadiri konser, dan bahkan fasilitas fisik untuk kamar mengajar musik, kehadiran
panggung, musik diajarkan di panggung atau di ruang kelas. Namun, banyak
pertanyaan yang tidak mencerminkan pengalaman sekolah tetap dianalisis dalam hal
kesempatan untuk belajar. Valid kesimpulan tentang hasil instruksi musik di sekolah
tidak dapat berasal dari data yang termasuk siswa yang memiliki instruksi musik
pribadi. Siswa dalam musik ensemble juga harus diperlakukan secara terpisah. Messy
data membuat interpretasi sulit atau bahkan tidak mungkin. Pernyataan bahwa 43
persen dari siswa menerima instruksi musik tiga atau empat kali seminggu
menyesatkan. Informasi ini, tampaknya disediakan oleh prinsipal di sembilan puluh
delapan sekolah di mana musik dinilai, menyiratkan bahwa musik yang dibutuhkan
adalah menawarkan tiga atau empat kali seminggu. Siswa dapat memiliki musik tiga
atau empat kali seminggu selama sembilan minggu atau satu semester di sekolah
menengah, tetapi musik tiga atau empat kali seminggu sepanjang tahun untuk seluruh
delapan - siswa kelas akan langka. Angka tersebut mungkin termasuk siswa yang
berpartisipasi dalam band, paduan suara, dan orkestra, patut dipertanyakan.

Contoh
Mereka dan data lainnya meragukan pada Educational Testing Service (ETS)
rumus matriks untuk menilai musik. (Sampling Matrix memungkinkan tes yang
panjang harus dibagi dengan asumsi bahwa subset sampel siswa yang dibandingkan)
Pengambilan sampel matriks digunakan oleh ETS. Dilaporkan ke sekolah swasta dan
sekolah oversample di mana lebih dari 15 persen dari siswa minoritas. Seperti hampir
40 persen dari anak-anak sekolah Amerika yang minoritas, oversampling apapun tidak
terlihat dalam laporan jumlah instruksi musik (kesempatan untuk belajar) siswa
disediakan. Mayor US kota dengan populasi mahasiswa lebih besar minoritas dikenal
untuk memberikan instruksi musik kurang dari sistem sekolah pinggiran dan
pedesaan. Musik instruksi berbeda dari sekolah ke sekolah lebih daripada matematika
atau pengajaran bahasa Inggris, meningkatkan keraguan serius tentang kecukupan
atau sifat wakil dari sampel. Kami menunggu laporan data teknis.
Pada tahun 1971, baik 80.000 atau 90.000 siswa yang diuji (ETS dokumen berbeda)
(ECS 1974, v), memberikan sampel sebanyak 25.000 siswa pada usia tiga belas tahun
(usia siswa kelas delapan 1997) .3 Untuk sampling matriks ada sepuluh buklet pada
tahun 1971, pada tahun 1997 ada sembilan booklet. Pada tahun 1971, 2,200-2,700
siswa setiap selesai booklets.4 Sepuluh skala penilaian kembali 1978, ketika dana itu
pendek, diberikan untuk 67.000 siswa, ternyata jumlah minimum yang dianggap
memadai. Sekali lagi, 25.000 siswa kelas delapan dinilai (2.400 untuk 2.800 siswa
menyelesaikan setiap buku). ETS yang diperlukan ukuran sampel untuk pengambilan
contoh matriks konsisten selama dua penilaian pertama. Tapi tidak sempurna ETS
(ETS praktek baru-baru ini ditanyai oleh Dewan Riset Nasional dan FairTest [Hoff
1998, 24]). Uji 1971 melibatkan 890 sekolah; para-turunkan 1978 uji terlibat 650
sekolah.
Pada tahun 1997, hanya 2.275 siswa yang diuji, tersebar di sembilan buklet,
ukuran sampel sekitar sepersepuluh bahwa penilaian awal, dan hanya 98 sekolah yang
terlibat. Siswa tidak dipilih secara acak pada tahun 1997; kelas atau kelompok 30
telah selected.5 Ukuran sampel yang digunakan untuk membuat dan melakukan blok
(sebagian besar dari uji) adalah 565 pada tahun 1997 dibandingkan dengan 25.000
pada tahun 1971. Itu adalah perubahan signifikan dalam matriks sampel, terutama jika
indikator lain menunjukkan bahwa siswa tubuh kita dan instruksi musik yang diterima
pada tahun 1997 lebih, tidak kurang, beragam dari pada tahun 1971.
The Arts NAEP 1997 Laporan Kartu mengakui perubahan bahwa: "Hasil penilaian
untuk tahun 1997 dibahas dalam laporan ini tidak sebanding dengan hasil dari
penilaian sebelumnya ..... (3) sampling tahun 1997 telah. Perbedaan jelas, namun
perbandingan yang mungkin Semua penilaian bertanya. siswa untuk menyanyi
"Amerika." Pada tahun 1997, 78 persen dari siswa menyanyikan ritme yang tepat
untuk "Amerika"; pada tahun 1971, 93 persen memiliki kemampuan ini. Nilai di
lapangan kecukupan adalah 35 persen pada tahun 1997, 52 persen pada tahun 1971;
untuk kualitas nada diterima mereka adalah 24 persen dan 38 persen. Angka-angka ini
merupakan salah satu penurunan kemampuan pasti di 1971-1997, atau sampling tidak
memadai untuk tahun 1997 timbre Menyadari. mengikuti pola yang sama. Pada tahun
1971, 89 persen diakui sebuah seruling, dan 60 persen mengidentifikasi biola dan
cello dalam sepotong Bach. Pada tahun 1997, 66 persen bisa mengidentifikasi
saksofon Pada tahun 1971, 35 persen dari siswa memainkan alat musik;. pada tahun
1997 jumlah tersebut sekitar 27 persen. Seperti 1971, mahasiswa solo dilakukan
mudah, namun sampel pada tahun 1997 adalah terlalu kecil untuk menilai siswa
dengan tingkat kesulitan musik, seperti yang telah direncanakan Melakukan
improvisasi jazz mungkin untuk tahun 1997 siswa.; kurang dari 10 persen dianggap
"tidak memadai" di irama, pitch, kalimat, gaya, dan minat musik. Sight-reading juga
terhambat oleh ukuran sampel, tetapi menurut sampel kecil keterampilan ini
tampaknya telah meningkatkan Lima puluh dua. persen dari instrumentalis
memainkan pitches akurat di setidaknya enam dari delapan tindakan; 29 persen dari
mereka, Namun, gagal memainkan irama dengan benar. Sight-baca adalah mencetak
pada skala sembilan-titik (titik skala bervariasi dari pertanyaan pertanyaan, membuat
komentar umum dan membandingkannya dengan kinerja lainnya tugas sulit terbaik)
Penilaian 1997 itu menggunakan campuran lebih kaya karya seni bagi siswa untuk
merespon dan lebih beragam tugas,. tapi tes itu tidak lebih komprehensif daripada
penilaian 1971. Penggunaan musik etnis membuat stimulus tes "kaya" tapi mungkin
mempengaruhi statistik uji reliabilitas dan validitas. pertanyaan A tidak secara
otomatis menjadi sah hanya karena berhubungan dengan "isi asli". Jika tidak,
konstruksi tes akan sangat disederhanakan.

Seni Kartu Laporan menyatakan bahwa sampel itu terlalu kecil untuk
generalisasi bagi siswa vokal (begitu banyak untuk kepentingan relatif dari standar
nasional, sukarela 1 menyanyi) atau untuk anggota orkestra. Dan ada banyak
subsamples ukuran tidak memadai. Rupanya pianis, gitaris, dan drumer garasi-band
yang disertakan dengan sampel instrumental untuk membuatnya cukup besar untuk
nilai pengumuman. Jika seperempat dari siswa kelas delapan menyanyi atau
memainkan alat musik, penilaian hanya 565 siswa dalam dua blok improvisasi,
membaca penglihatan, dan bermain ensemble adalah, memang, disayangkan. hipotesis
saya adalah bahwa sampel terlalu kecil untuk menggeneralisasi untuk di-sekolah
pengalaman musik instrumental: Seni Kartu Laporan menunjukkan bahwa 27 persen
dari siswa memainkan alat musik, namun hanya 20 persen bermain dengan kelompok
(grup musik atau orkestra); sehingga pasti ada sejumlah besar siswa piano dan gitar.
Selanjutnya, meskipun fakta bahwa instruksi di kelas musik dan ansambel sering
berfokus pada kelompok, bukan individu, tujuan, item tes secara eksklusif didasarkan
pada tujuan individu.

Rincian Teknis

Matrix sampling dipromosikan sebagai alat generalisasi untuk populasi dari


hati-hati dipilih (matriks) sampel. Para penulis Seni Kartu Laporan menunjukkan
bahwa 62 siswa untuk setiap subgrup adalah ukuran sampel yang memadai, selama 62
yang dipilih dari lima unit sampling yang berbeda primer. Tak perlu dikatakan,
penelitian empiris yang cukup diperlukan untuk membentuk matriks yang valid, dan
penelitian tersebut belum dilakukan untuk musik kelas delapan. Musik mungkin atau
mungkin tidak sama dengan mata pelajaran lain, itu mungkin akan lebih bervariasi.
Para IRT dalam musik dibangun pada dua jenis pertanyaan yang berbeda, satu untuk
tanggapan dibangun, dengan skor yang benar rata-rata 65 persen, dan satu lagi untuk
pertanyaan pilihan ganda, dengan skor yang benar rata-rata 74 persen. Divisi ini
mengejutkan mengingat terbatasnya jumlah pertanyaan dan ukuran sampling yang
tidak memadai. Tampaknya beberapa keputusan yang sewenang-wenang dibuat:
pertama, yang hasilnya harus dilaporkan dalam tiga kategori pencapaian (atas,
menengah, dan rendah), dan kedua, bahwa mean dan deviasi standar yang diinginkan.
"Pada masing-masing dari tiga mata pelajaran seni, rata-rata 150 dan deviasi standar
adalah 35 [sic] didirikan sehingga sebagian besar siswa memiliki skor antara 45 dan
255 menggunakan model kredit umum parsial" (NCES 1998, 186 -7) .6 Ini adalah
"menjawab" skala yang digunakan untuk perbandingan, terutama kesempatan-untuk-
belajar perbandingan, yang sering tidak berarti. ETS biasanya menggunakan skala
Soo-titik untuk melaporkan hasil NAEP. Dalam penilaian ini jangkar poin untuk
mendirikan tiga kategori yang sewenang-wenang. Set item jangkar seharusnya dikaji
oleh para ahli kurikulum untuk memastikan bahwa mereka mewakili suatu skala
pertumbuhan intelektual (sifat laten unidimensional) dari pengetahuan sederhana
untuk pengetahuan lebih abstrak. Prosedur ini tampaknya tidak pernah diikuti dengan
penilaian musik. Karena hanya satu tingkat kelas yang diuji, ini proses validasi
kurikulum untuk membangun skala akan sulit. Anchor poin yang lazim didirikan
dengan mencari tingkat di mana setidaknya 65 persen dari peserta ujian merespon
dengan benar untuk item tersebut dan peserta ujian sekurang-kurangnya 30 persen
lebih sedikit mendapatkan jawaban yang benar untuk item tersebut di tingkat yang
lebih rendah yang berdekatan, tidak lebih bahwa 50 persen dari siswa di tingkat
menengah harus dapat menjawab item dengan benar, dan perkiraan nilai p didasarkan
pada ukuran sampel paling sedikit 100 peserta ujian. penilai musik NAEP tampaknya
percaya bahwa mereka dapat menyelesaikan tugas yang sama dengan sekitar setengah
jumlah peserta ujian, dan tidak jelas apakah praktek umum lainnya diikuti.
Bendera Merah Lainnya

Sebuah bunga rampai bendera merah lain harus ditunjukkan. Tampaknya


bahwa instruksi tes sering memungkinkan siswa untuk menentukan jawaban yang
benar: "Instruksi dibuat dengan hati-hati untuk memimpin siswa melalui langkah demi
langkah latihan yang kompleks, dan untuk memberikan siswa informasi sebanyak
mungkin tentang apa pengetahuan dan keterampilan mereka diminta untuk
menunjukkan "(5). Memang tidak ada alternatif bila konten yang dinilai tidak pernah
diajarkan.
Tes ini termasuk banyak tugas mudah, yang tujuan khas di tingkat sekolah
dasar. Sebagai contoh, siswa mendengarkan sebuah fragmen dari "Au Clair de la
Lune" dan kemudian dijelaskan apakah pola dalam irama itu langkah turun (yang
benar), langkah-langkah naik, melompat naik, atau melompat turun. Satu pertanyaan
mencetak dengan kredit parsial meminta siswa untuk mengidentifikasi nama-nama
catatan dalam skala C mayor. Empat puluh persen siswa tidak bisa nama nada
tunggal. Jelas tidak bahkan hubungan antara skala musik dan alfabet diajarkan. Sejak
55 persen dari sampel dapat menambahkan nilai catatan untuk menentukan tanda
tangan meter (tanda waktu yang disebut dalam ujian), kita dapat menyimpulkan
bahwa instruksi lebih harus diberikan untuk durasi daripada derajat skala atau bahwa
arah membantu . Menurut "menanggapi skala" (31), mengidentifikasi setengah -
simbol catatan adalah tugas tingkat atas, lebih sulit daripada menentukan meteran dari
sepotong musik.

Penilaian tanggapan siswa dibangun adalah rubrik-jenis masalah bagaimana


merancang rubrik yang jelas dan scorable yang cukup menggambarkan tugas
ditunjukkan dalam satu tugas: The "Washington Post" maret dimainkan, dan siswa
diminta untuk memutuskan apakah musik yang paling sesuai untuk parade, konser
rock, pernikahan, atau pemakaman; mahasiswa kemudian diminta untuk
menggambarkan satu fitur musik yang akan membuat musik berguna untuk acara
yang dipilih. "Musik ini memiliki terdengar ceria dan memiliki suasana hati gembira
dan nada" baik dinilai "cukup." "Ia memiliki mengalahkan marching baik dan
menyenangkan" dihukum "dikembangkan."

Nilai persentase dikutip juga menimbulkan pertanyaan menarik. Sebagai


contoh, siswa memperoleh skor 34 (dari 100) dalam menciptakan dan skor identik
dalam melaksanakan. (Jika sebagian besar instruksi pada kinerja, apakah ada bedanya
instruksi) Dengan siswa tingkat atas?, Menciptakan nilai adalah 52, dan melakukan
nilai 56, perbedaan kecil ketika siswa tingkat atas mungkin sudah instruksi swasta di
kinerja dan, kita bisa berasumsi, sangat sedikit jika ada dalam menciptakan.
Pembelajaran

Pelajaran penting yang harus dipelajari dari Seni Kartu Laporan bahwa seni
tidak dapat dinilai dalam skala besar, seperti diklaim dalam laporan. (Seperti yang
dibuktikan oleh penundaan, jenis penilaian ini tidak mudah dilakukan bahkan dengan
bantuan dari organisasi-organisasi terbaik bangsa evaluasi) Kenyataan itu didirikan
dengan penilaian musik pada tahun 1971, yang benar-benar dikelola dalam skala
besar.. Kredit harus diberikan kepada Paul Lehman dan Joann Baird, wawasan yang
membuat penilaian 1971 begitu mendalam dan begitu berharga. Satu pelajaran adalah
bahwa prioritas seni tidak cukup tinggi bahwa penilaian dapat dilakukan tanpa
bantuan dari Nea dan lembaga Getty, dan itu masih belum cukup tinggi untuk
melakukan penilaian kualitas di bahkan satu tingkat kelas. Kabar baiknya adalah
bahwa seni masih dalam agenda penilaian NAEP itu, membenarkan klaim untuk
musik sebagai subjek inti.

Meskipun saya skeptis terhadap kecukupan sampel dan akurasi dari banyak
laporan, saya menemukan beberapa hasil pengujian yang akan kepentingan. Excellent
item tes individu dapat ditemukan di seluruh penilaian musik, masing-masing yang
sepenuhnya sesuai dengan sendirinya. pendidik musik akan sedikit kecewa jika siswa
yang kompeten di semua item. Item harus merangsang guru musik untuk
bereksperimen dengan standar nasional sukarela sebagai waktu memungkinkan.
Sayangnya, tes tidak dapat dinilai terhadap standar penilaian banyak, dan tentu saja,
advokasi tersembunyi / standar tujuan membuat komentar, termasuk tambang, lemah.
Seni Laporan Kartu tidak dapat digunakan untuk mendukung atau memandu
perubahan kurikuler dalam musik mengajar dan belajar karena tidak sepenuhnya
menilai apa yang diketahui siswa dan dapat melakukan dan karena beberapa hasil
tampaknya didasarkan pada satu item. Ia menawarkan, namun kemungkinan untuk
upaya advokasi tambahan sekali prioritas yang ditetapkan dan kita tahu apa yang
sumber daya yang diperlukan untuk memenuhi standar kinerja profesi kita.

You might also like