Jumat, 01 Juni 2012


MERANCANG EVALUASI HASIL BELAJAR
Disajikan Oleh: Kelompok IV
Pascasarjana PAK STT Baptis Medan-2012


Anggota Kelompok:


1. Roimanson Panjaitan
2. Senni H. Situmorang
3. Tambun Siringoringo
4. Melsa Yohana Purba
5. Anike Ruipha
6. Paian Bakti H. S
7. David Sitepu
8. Dewi Sari Simamora



A. TENTANG PENGUKURAN, PENILAIAN DAN EVALUASI HASIL BELAJAR

Hasil Belajar 
a. Hasil belajar siswa pada hakikatnya merupakan perubahan tingkah laku setelah melalui proses belajar mengajar. Tingkah laku sebagai hasil belajar dalam pengertian luas mencakup bidang kognitif, afektif dan psikomotorik. Penilaian dan pengukuran hasil belajar dilakukan dengan menggunakan tes hasil belajar, terutama hasil belajar kognitif berkenaan dengan penguasaan bahan pengajaran sesuai dengan tujuan pendidikan dan pengajaran.
b. Hasil belajar merupakan hal yang dapat dipandang dari dua sisi yaitu sisi siswa dan dari sisi guru. Dari sisi siswa, hasil belajar merupakan tingkat perkembangan mental yang lebih baik bila dibandingkan pada saat sebelum belajar. Tingkat perkembangan mental tersebut terwujud pada jenis-jenis ranah kognitif, afektif, dan psikomotor. Sedangkan dari sisi guru, hasil belajar merupakan saat terselesikannya bahan pelajaran. Hasil juga bisa diartikan adalah bila seseorang telah belajar akan terjadi perubahan tingkah laku pada orang tersebut, misalnya dari tidak tahu menjadi tahu, dan dari tidak mengerti menjadi mengerti.
c. Hasil belajar merupakan suatu puncak proses belajar. Hasil belajar tersebut terjadi terutama berkat evaluasi guru. Hasil belajar dapat berupa dampak pengajaran dan dampak pengiring. Kedua dampak tersebut bermanfaat bagi guru dan siswa.


Kesimpulan: 
Hasil belajar merupakan perubahan tingkah laku sebagai akibat dari proses belajar. Dengan kata lain hasil belajar adalah kemampuan aktual yang diukur secara langsung. Hasil pengukuran belajar inilah akhirnya akan mengetahui seberapa jauh tujuan pendidikan dan pengajaran yang telah dicapai. 

1. Pengukuran
Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas, sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes.  Dengan demikian di artikan bahwa pengukuran memiliki dua karakteristik utama yaitu: 1) penggunaan angka atau skala tertentu; 2) menurut suatu aturan atau formula tertentu.   Pendapat ini sejalan dengan pendapat Suharsimi Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Arikunto menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat kuantitatif. 
Selanjutnya menurut Menurut Cangelosi yang dimaksud dengan pengukuran (Measurement) adalah suatu proses pengumpulan data melalui pengamatan empiris untuk mengumpulkan informasi yang relevan dengan tujuan yang telah ditentukan. Dalam hal ini guru menaksir prestasi siswa dengan membaca atau mengamati apa saja yang dilakukan siswa, mengamati kinerja mereka, mendengar apa yang mereka katakan, dan menggunakan indera mereka seperti melihat, mendengar, menyentuh, mencium, dan merasakan.  
Dengan demikian dapat disimpulkan bahwa pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu standar atau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapat diperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian, atau kepercayaan konsumen. Sederhananya bahwa pengukuran adalah proses pemberian angka-angka atau label kepada unit analisis untuk merepresentasikan atribut-atribut konsep. Proses ini seharusnya cukup dimengerti orang walau misalnya definisinya tidak dimengerti. Hal ini karena antara lain kita sering kali melakukan pengukuran.

2. Penilaian
Penilaian merupakan bagian penting dan tak terpisahkan dalam sistem pendidikan saat ini. Peningkatan kualitas pendidikan dapat dilihat dari nilai-nilai yang diperoleh siswa. Tentu saja untuk itu diperlukan sistem penilaian yang baik dan tidak bias. Sistem penilaian yang baik akan mampu memberikan gambaran tentang kualitas pembelajaran sehingga pada gilirannya akan mampu membantu guru merencanakan strategi pembelajaran. Bagi siswa sendiri, sistem penilaian yang baik akan mampu memberikan motivasi untuk selalu meningkatkan kemampuannya.
Dalam sistem evaluasi hasil belajar, penilaian merupakan langkah lanjutan setelah dilakukan pengukuran. informasi yang diperoleh dari hasil pengukuran selanjutnya dideskripsikan dan ditafsirkan. Karenanya, menurut penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran. Selanjutnya penilaian adalah keputusan tentang nilai. Oleh karena itu, langkah selanjutnya setelah melaksanakan pengukuran adalah penilaian. Penilaian dilakukan setelah siswa menjawab soal-soal yang terdapat pada tes. Hasil jawaban siswa tersebut ditafsirkan dalam bentuk nilai.
Menurut Djemari Mardapi ada dua acuan yang dapat dipergunakan dalam melakukan penilaian yaitu acuan norma dan acuan kriteria. Dalam melakukan penilaian dibidang pendidikan, kedua acuan ini dapat dipergunakan. Acuan norma berasumsi bahwa kemampuan seseorang berbeda serta dapat digambarkan menurut kurva distribusi normal. Sedangkan acuan kriteria berasumsi bahwa apapun bisa dipelajari semua orang namun waktunya bisa berbeda.  Dengan demikian penggunaan acuan norma dilakukan untuk menyeleksi dan mengetahui dimana posisi seseorang terhadap kelompoknya. Misalnya jika seseorang mengikuti tes tertentu, maka hasil tes akan memberikan gambaran dimana posisinya jika dibandingkan dengan orang lain yang mengikuti tes tersebut. Adapun acuan kriteria dipergunakan untuk menentukan kelulusan seseorang dengan membandingkan hasil yang dicapai dengan kriteria yang telah ditetapkan terlebih dahulu. Acuan ini biasanya digunakan untuk menentukan kelulusan seseorang. Seseorang yang dikatakan telah lulus berarti bisa melakukan apa yang terdapat dalam kriteria yang telah ditetapkan dan sebaliknya. Acuan kriteria, ini biasanya dipergunakan untuk ujian-ujian praktek.

3. Evaluasi
Evaluasi Menurut Suharsimi Arikunto adalah kegiatan untuk mengumpulkan informasi tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk menentukan alternatif yang tepat dalam mengambil keputusan.  Dalam bidang pendidikan, evaluasi berarti proses yang sistematis tentang mengumpulkan, menganalisis dan menafsirkan informasi untuk menentukan sejauhmana tujuan pembelajaran telah dicapai oleh siswa. Dengan kata lain evaluasi adalah proses mengumpulkan informasi untuk mengetahui pencapaian belajar kelas atau kelompok.
Dari uraian di atas, ada beberapa hal yang menjadi ciri khas dari evaluasi yaitu: (1) sebagai kegiatan yang sistematis, pelaksanaan evaluasi haruslah dilakukan secara berkesinambungan. Sebuah program pembelajaran seharusnya dievaluasi disetiap akhir program tersebut, (2) dalam pelaksanaan evaluasi dibutuhkan data dan informasi yang akurat untuk menunjang keputusan yang akan diambil. Asumsi-asumsi ataupun prasangka. bukan merupakan landasan untuk mengambil keputusan dalam evaluasi, dan (3) kegiatan evaluasi dalam pendidikan tidak pernah terlepas dari tujuan-tujuan pembelajaran yang telah ditetapkan sebelumnya. Karena itulah pendekatan goal oriented merupakan pendekatan yang paling sesuai untuk evaluasi pembelajaran.

4. Kesimpulan Perbedaan Evaluasi, Penilaian dan Pengukuran
Berdasarkan pengertian di atas dapat disimpulkan bahwa penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pengukuran adalah membandingkan hasil tes dengan standar yang ditetapkan. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah kegiatan mengukur dan mengadakan estimasi terhadap hasil pengukuran atau membanding-bandingkan dan tidak sampai ke taraf pengambilan keputusan.Penilaian bersifat kualitatif.
Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing :
a. Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan kuantitas sesuatu yang bersifat numerik. Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana adalah proses pengumpulan data melalui pengamatan empiris.
b. Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai informasi secara berkala, berkesinambungan, dan menyeluruh tentang proses dan hasil dari pertumbuhan dan perkembangan yang telah dicapai oleh anak didik melalui program kegiatan belajar.
c. Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai, kriteria-judgment atau tindakan dalam pembelajaran.

Dengan demikian pengukuran, penilaian dan evaluasi merupakan kegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut dalam kaitannya dengan proses belajar mengajar tidak dapat dipisahkan satu sama lain dan dalam pelaksanaannya harus dilaksanakan secara berurutan.


B. FUNGSI UJIAN SEBAGAI INSTRUMEN EVALUASI

Pelaksanaan ujian mempunyai tiga fungsi, yakni mengukur, menilai dan mengevaluasi. Karena macam ujian tergantung pada objek pengajaran yang akan dievaluasi.
Suatu ujian akan dikatakan bermutu apabila ujian tersebut:
1) Menguji apa yang hendak diuji. Dengan perkataan lain, rancangan ujian harus relevan dengan fungsi evaluasi mana yang diinginkan
2) Terdiri atas rangkaian soal yang baik. 
Soal yang baik adalah soal yang berkualitas baik, yakni soal yang valid, reliable, objektivitas, efisien, dan praktis (berguna)

C. STRUKTUR SOAL UJIAN
Dalam pembuatan soal ujian, yang perlu diperhatikan adalah kaidah pembuatan soal. Kaidah – kaidah umum yang penting diperhatikan di dalam pembuatan soal antara lain:
1) Yakinkan bahwa setiap soal dapat diduga jenis jawabannya tanpa harus melihat pilihan jawaban atau yakinkan bahwa pilihan jawaban adalah 100 % benar atau salah. 
2) Usahakan agar data atau informasi penting seoptimal mungkin dicantumkan pada  soal (stem), sedangkan pilihan jawaban usahakan sesingkat mungkin.
3) Hindari informasi berlebihan pada soal. 
4) Hindari soal-soal yang bersifat menjebak dan terlalu kompleks serta tidak relevan.
5) Gunakan pilihan jawaban yang secara gramatikal konsisten dan secara logis kompatibel dengan soal.  
6) Hindari kata-kata absolut seperti, selalu, tidak pernah, dan semua pada pilihan jawaban, dan hindari pula istilah yang tidak jelas (meragukan) seperti biasanya atau sering. 
7) Hindari kalimat atau frase negatif seperti KECUALI, TIDAK, atau BUKAN.
8) Fokuskan soal pada konsep-konsep penting, dan hindari hanya menguji kemampuan mengingat fakta. 
9) Fokuskan soal-soal pada konsep penting dan kasus-kasus yang sering serta memiliki potensi masalah serius.
10) Setiap soal diusahakan agar menilai aplikasi pengetahuan, tidak hanya menguji daya ingat terhadap fakta terisolasi.  
11) Setiap soal tidak terlalu menekankan aspek klinik yang subspesialis.
12) Setiap soal lebih baik menekankan pada pertanyaan mengenai pengambilan keputusan klinik. 

Hindari Kesalahan Struktur Soal Ujian

Pada bagian ini akan dijelaskan berbagai kesalahan struktur soal yang harus dihindari karena mengarah pada dua hal, yakni, “testwiseness” dan “irrelevant difficulty”. “Testwiseness” adalah suatu keadaan di mana peserta ujian dapat menjawab soatu soal bukan karena penguasaannya terhadap isi materi yang ditanyakan pada soal tersebut, tetapi karena kepintarannya dalam menebak jawaban yang benar. Sementara itu “irrelevant difficulty” berkaitan dengan kesulitan yang dihadapi peserta ujian untuk menjawab suatu soal, bukan karena sulitnya materi yang diujikan, namun lebih ke arah sulitnya mahasiswa menjawab, yang ditimbulkan oleh struktur soal tersebut. Jenis kesalahan yang dimaksud adalah sebagai berikut:
1. Kesalahan yang berkaitan dengan testwiseness:
Grammatical Cues. 

Contoh soal :
Seorang pria, berusia 60 tahun, dibawa ke bagian gawat darurat oleh seorang polisi, yang menemukannya dalam keadaan tergeletak tidak sadarkan diri di sisi jalan. Setelah memastikan bahwa saluran pernafasan dalam keadaan tidak tersumbat, langkah pertama dalam manajemen adalah administrasi intravena: 
A. pemeriksaan cairan serebrospinal
B. glukosa dengan vitamin B1 (thiamine)
C. CT scan kepala
D. Fenitoin
E. diazepam

Logical Cues. 

Contoh soal :
Kejahatan adalah 
A. terjadi secara merata pada berbagai kelas social 
B. lebih sering muncul pada golongan orang miskin 
C. lebih sering muncul pada kelompok masyarakat menengah sampai kaya. 
D. pada dasarnya merupakan suatu indikasi psychosexual maladjustment
E. mencapai keadaan toleransi yang plateau terhadap negara

Istilah yang absolute. 

Contoh soal :
Pada pasien dengan demensia lanjut,tipe Alzheimer, defek memori yang terjadi
A. dapat diberikan terapi secara adekuat dengan fosfatidilkolin (lesitin) 
B. dapat merupakan sekuel dari parkinsonism dini 
C. tidak pernah terjadi pada pasien dengan neurofibrillary tangles pada otopsi
D. tidak pernah menjadi berat
E. mungkin melibatkan sistem kolinergik

Jawaban benar yang panjang. 

Contoh soal :
Secondary gain adalah…
A. synonym dengan malingering
B. Problem yang biasa timbul pada orang dengan gangguan obsessive-compulsive
C. Komplikasi dari berbagai penyakit dan cenderung untuk memperlama waktu penyakit 
D. Tidak pernah timbul pada gangguan otak organic 

Pengulangan kata dari badan soal ke jawaban. 

Contoh soal:
Seorang pria berusia 58 tahun dengan riwayat penggunaan alkohol yang berat dan sebelumnya pernah dirawat karena gangguan psychiatric mengalami kebingungan dan agitasi. Dia mengatakan bahwa dunia ini tidak nyata (unreal). Keadaan ini disebut: 
A. depersonalisasi
B. derailment
C. derealisasi
D. focal memory deficit
E. tanda anxietas

Konvergensi soal. 

Contoh soal:Anestesi lokal akan bekerja paling efektif pada kondisi:
A. dalam bentuk anionic, bekerja dari dalam membrane syaraf dalam bentuk 
B. . dalam bentuk cationic, bekerja dari luar membrane syaraf 
C. dalam bentuk tidak bermuatan, bekerja dari dalam membrane syaraf
D. dalam bentuk tidak bermuatan, bekerja dari luar membrane syaraf


2. Kesalahan yang berkaitan dengan kesulitan yang tidak perlu/relevan
Pilihan jawaban yang panjang, kompleks, atau duplikasi
Pilihan yang berupa angka tidak diurut sesuai dengan besarnya
Pilihan yang mengandung unsur frekuensi suatu kejadian bersifat multi interpretasi
Pilihan jawaban tidak parallel dan urutan tidak logis
Penggunaan BSSD (bukan salah satu diatas) pada pilihan jawaban
Badan soal terlalu panjang, sulit, dan kompleks

Untuk memberikan kejelasan poin – poin di atas, berikut ini dipaparkan contoh – contoh soal yang mengandung kesalahan struktur beserta uraiannya.

Keterangan:
  Pilihan jawaban yang panjang, kompleks, atau duplikasi. 
Contoh soal:
Komite Peer review di HMO bisa menolak  keputusan dokter dalam penanganan kesehatan anggotanya. Berkaitan dengan hal ini dokter sebelumnya harus telah menerima proses klarifikasi. Proses kalrifikasi tersebut termasuk apa saja? 
A. Peringatan, sebuah forum tertutup, pengadilan, kesempatan untuk didengar dan ditunjukkan bukti yang memberatkan. 
B. Peringatan yang tepat, pengadilan pengambilan keputusan, kesempatan untuk bertemu di pengadilan dengan saksi yang memberatkan dan kesempatan untuk menunjukkan bukti yang meringankannya. 
C. Peringatan yang tepat waktu dan dipercaya, pengadilan tertutup untuk pengambilan keputusan, kesempatan untuk mendengarkan bukti yang memberatkan dan bertatap muka dengan saksi yang memberatkan dan kesempatan untuk menunjukkan bukti yang meringankan. 


  Pilihan yang berupa angka tidak diurut sesuai dengan besarnya. 
Contoh soal:
Apabila terjadi  infeksi pada rongga pelvis yang berulang ( kedua kalinya), berapa kemungkinan seorang wanita mengalami keadaan infertile? 
A. kurang dari 20%
B. 20 - 30%
C. Lebih dari 50%
D. 90%
E. 75%

  Pilihan yang mengandung unsur frekuensi suatu kejadian bersifat multi interpretative
Contoh soal:
Penderita obesitas berat dewasa muda:
A. biasanya berrespon secara dramatis terhadap regimen diet
B. sering berkaitan dengan kelainan hormon
C. memiliki kemungkinan 75 % untuk kembali normal secara spontan
D. mempunyai prognosis yang buruks
E. biasanya berrespon terhadap terapi obat dan psikoterapi intensif 

  Pilihan jawaban tidak parallel dan urutan tidak logis
Contoh soal:
Pada penilitian terhadap suatu vaksin, 200 anak laki – laki yang berusia 2 tahun diberikan vaksin terhadap suatu penyakit tertentu kemudian diikuti selama 5 tahun untuk melihat apakah penyakit tersebut muncul atau tidak. Dari kelompok ini, 85 % tidak pernah bersinggungan dengan penyakit ini. Manakah dari pernyataan di bawah ini yang benar untuk hasil penelitian tersebut? 
A. Tidak ada kesimpulan yang dapat diambil karena follow – up dilakukan terhadap anak – anak yang tidak divaksinasi. 
B. Jumlah kasus yang diteliti (30 kasus selama 5 tahun) terlalu sedikit untuk menghasilkan kesimpulan yang secara statistic bermakna 
C. C.Tidak ada kesimpulan yang dapat diambil karena percobaan hanya melibatkan anak laki – laki. 
D. Vaccine efficacy (%) dihitung dengan  85-15/100

  Penggunaan BSSD (bukan salah satu di atas) pada pilihan jawaban
Contoh soal:
Kota apa yang terdekat dengan kota New York?
A. Boston
B. Chicago
C. Dallas
D. Los Angeles
E. bukan salah satu di atas

  Badan soal terlalu panjang, sulit, dan kompleks
Contoh soal:
Di bawah ini merupakan orang tua yang memiliki anak dengan Sindroma Down dengan urutan risiko muncul dari yang tertinggi sampai terendah. Diasumsikan umur wanita pada waktu hamil pada semua kasus adalah 22 tahun dan kehamilan terjadi dengan jarak lima tahun.  Karyotype anak perempuan adalah: 
I: 46, XX, -14, +T (14q21q) pat
II: 46, XX, -14, +T (14q21q) de novo
III: 46, XX, -14, +T (14q21q) mat
IV: 46, XX, -21, +T (14q21q) pat
V: 47, XX, -21, +T (21q21q) (orang tua tidak  karyotyped)
A. III, IV, I, V, II
B. IV, III, V, I, II
C. III, I, IV, V, II
D. IV, III, I, V, II
E. III, IV, I, II, V


D. YANG HARUS DIPERHATIKAN DALAM MERANCANG EVALUASI HASIL BELAJAR
1. Pentingnya Memperhatikan Sasaran Evaluasi Hasil Belajar, yang mencakup:
  Ranah Kognitif (Pengetahuan/pemahaman)
Penilaian terhadap pengetahuan pada tingkat satuan pelajaran menuntut perumusan secara lebih khusus setiap aspek pengetahuan, yang dikategorikan sebagai: konsep, prosedur, fakta, dan prinsip. Tiap kategori dirinci menjadi suatu struktur dan urutan tertentu, misalnya dari konsep yang sederhana menuju ke konsep-konsep yang lebih kompleks. Dengan struktur tersebut dapat ditentukan urutan pelajaran dan isi pelajaran, sebagaimana dirumuskan dalam satuan pelajaran. Teknik penilaian terhadap pengetahuan dalam kontek ini dikembangkan dalam tes tertentu.
Evaluasi akhir pengajaran terhadap ketercapaian tujuan-tujuan aspek pengetahuan perlu dilakukan secara terpisah di samping evaluasi terhadap perilaku sebagaimana telah dikemukakan di atas. Untuk menilai pengetahuan dapat kita pergunakan pengujian sebagai berikut
a. Sasaran penilaian aspek pengenalan (recognition)
Caranya, dengan memberikan pertanyaan-pertanyaan bentuk pilihan berganda, yang menuntut siswa agar melakukan identifikasi tentang fakta, definisi, contoh-contoh yang betul (correct).
b. Sasaran penilaian aspek mengingat kembali (recal)
c. Caranya, dengan pertanyaan-pertanyaan terbuka tertutup langsung untuk mengungkapkan jawaban-jawaban yang unik.
d. Sasaran penilaian aspek pemahaman (komprehension)
Caranya, dengan mengajukan pertanyaan-pertanyaan yang menuntut identifikasi terhadap pernyataan-pernyataan yang betul dan yang kelim konklusi atau klasifikasi; dengan daftar pertanyaan matching (menjodohkan) yang berkenaan dengan konsep, contoh, aturan, penerapan, langkah-langkah dan urutan, dengan pertanyaan bentuk essay (open ended) yang menghendaki uraian, perumusan kembali dengan kata-kata sendiri, contoh-contoh.
  Ranah Afektif
Sasaran evaluasi ranah afektif (sikap dan alat) meliputi aspek-aspek, sebagai berikut :
Aspek penerimaan, yakni kesadaran peka terhadap gejala dan stimulus serta menerima atau menyelesaikan stimulus atau gejala tersebut.
Sambutan, yakni aktif mengikuti dan melaksanakan sendiri suatu gejala di samping menyadari/menerimanya.
Aspek penilaian, yakni perilaku yang, konsisten, stabil dan mengandung kesungguhan kata hati dan kontrol secara aktif terhadap perilakunya.
Aspek organisasi, yakni perilaku menginternalisasi, mengorganisasi dan memantapkan interaksi antara alat-alat dan menjadikannya sebagai suatu pendirian yang teguh.
Aspek karakteristik diri dengan suatu alat atau kompleks alat, ialah menginternalisasikan suatu nilai ke dalam sistem nilai dalam diri individu, yang berperilaku konsisten dengan sistem nilai tersebut.

Ranah dan aspek tiap ranah yang akan diukur, masing-masing dirinci menjadi sejumlah karakteristik, selanjutnya tiap karakteristik dijabarkan menjadi sejumlah atribut. Tiap atribut diberikan indikator sebagai petunjuk perubahan perilaku. Berdasarkan atribut-atribut ter-sebut dapat disusun pertanyaan-pertanyaan untuk pengukuran.
  Ranah Keterampilan
Sasaran evaluasi keterampilan reproduktif:
Aspek keterampilan kognitif, misalnya masalah-masalah yang familier untuk dipecahkan dalam rangka menentukan ukuran-ukuran ketepatan dan kecepatan melalui latihan-latihan (drill) jangka panjang, evaluasi dilakukan dengan metode-metode objektif tertutup.
Aspek keterampilan psikomotorik dengan tes tindakan terdapat pelaksanaan tugas yang nyata atau yang disimulasikan, dan berdasarkan kriteria ketepatan, kecepatan, kualitas penerapan secara objektif. Contoh : latihan mengetik, keterampilan menjalankan mesin, dan lain-lain.
Aspek keterampilan reaktif, dilaksanakan secara langsung dengan pengamatan objektif terhadap tingkah laku pendekatan atau penghindaran; secara tak langsung dengan kuesioner sikap.
Aspek keterampilan interaktif, secara langsung dengan menghitung frekuensi kebiasaan dan cara-cara yang baik yang dipertunjukkan pada kondisi-kondisi tertentu.
Evaluasi Keterampilan Produktif :
a. Aspek keterampilan kognitif, misalnya masalah-masalah yang tidak familier untuk dipecahkan dan pemecahannya tidak begitu rumit, dengan menggunakan metode terbuka tertutup (open ended methods).
b. Aspek keterampilan psikomotorik, yakni tugas-tugas produktif yang menuntut perencanaan strategi. Evaluasi terhadap hasil dan proses perencanaan ialah dengan observasi dan diskusi.
c. Aspek keterampilan reaktif, secara langsung mengamati sistem nilai masyarakat dalam tindakannya di luar sekolah.
d. Aspek keterampilan interaktif dengan observasi keterampilan dalam situasi senyatanya.

Tambahan:
Dalam penyelenggaraan evaluasi maka kita harus memperhatikan faktor-faktor sebagai berikut :
  Keterpaduan antara tujuan intrusional pengajaran, materi pembelajaran dan metode pengjaran.
  Keterlibatan peserta didik, Prinsip ini merupakan suatu hal yang mutlak, karena keterlibatan peserta didik dalam evaluasi bukan alternatif, tapi kebutuhan mutlak.
  Koherensi, evaluasi harus berkaitan dengan materi pengajaran yang telah dipelajari dan sesuai dengan ranah kemampuan peserta didik yang hendak diukur.
  Pedagogis, perlu adanya tool penilai dari aspek pedagogis untuk melihat perubahan sikap dan perilaku sehingga pada akhirnya hasil evaluasi mampu menjadi motivator bagi diri siswa.
  Akuntabel, hasil evaluasi haruslah menjadi alat akuntabilitas atau bahan pertanggungjawaban bagi pihak yang berkepentingan seperti orangtua siswa, sekolah, dan lainnya.
  Evaluasi bertujuan membantu pemerintah dalam mencapai tujuan pembelajaran bagi masyarakat.
  Evaluasi adalah seni, tidak ada evaluasi yang sempurna, meski dilakukan dengan metode yang berbeda.
  Pelaku evaluasi atau evaluator tidak memberikan jawaban atas suatu pertanyaan tertentu. Evaluator tidak berwennag untuk memberikan rekomendasi terhadap keberlangsungan sebuah program. Evaluator hanya membantu memberikan alternatif. 
  Penelitian evaluasi adalah tanggung jawab tim bukan perorangan. 
  Evaluator tidak terikat pada satu sekolah demikian pula sebaliknya. 
  Evaluasi adalah proses, jika diperlukan revisi maka lakukanlah revisi.
  Evaluasi memerlukan data yang akurat dan cukup, hingga perlu pengalaman untuk pendalaman metode penggalian informasi.
  Evaluasi akan mntap apabila dilkukan dengan instrumen dan teknik yang applicable.
  Evaluator hendaknya mampu membedakan yang dimaksud dengan evaluasi formatif, evaluasi sumatif dan evaluasi program.
  Evaluasi memberikan gambaran deskriptif yang jelas mengenai hubungan sebab akibat, bukan terpaku pada angka soalan tes.

2. Prosedur Perancangan Evaluasi Hasil Belajar 
Pada tahap ini, guru menyusun kisi-kisi (blue print).
Pekerjaan semacam ini sebenarnya sangat menolong sekali demi keberhasilan tujuan pengajaran, tetapi di samping hal tersebut sangat banyak menyita waktu dan tugas tambahan yang dibebankan kepada guru. Blue print inipun dapat dianggap sebagai guide dalam pengembangan pola belajar lebih lanjut, melalui instrumen evaluasi yang direvisi terus sesuai dengan kebutuhan dalam proses belajar mengajar.
Melalui cara ini, tes evaluasi dapat berfungsi sebagai bagian integral dalam sistem mengajar dan bersifat langsung. Bentuk item yang dapat disusun bisa dalam bentuk pilihan berganda, bentuk essay atau berbagai bentuk lainnya. Tetapi bentuk/tipe item apa saja yang akan digunakan, guru perlu mempertimbangkan, mempertimbangkan berapa jumlah waktu yang tersedia dan berapa item dan luas skopnya pada tes yang akan diberikan.
Dalam penyusunan kisi-kisi (blue print) tersebut ditempuh langkah-langkah, sebagai berikut :
Langkah 1.
Menetapkan ruang lingkup materi pelajaran yang akan diujikan berdasarkan pokok bahasan, satuan bahasan, atau topik yang telah ditetapkan dalam Garis-garis Besar Pro-gram Pembelajaran.
Langkah 2.
Merumuskan tujuan pengajaran khusus sesuai dengan tujuan pembelajaran dalam GBPP (biasanya telah dirumuskan pada waktu penyusunan PPSI/Satuan Pelajaran), dengan memperhatikan ranah-ranah kognitif, afektif, dan keterampilan.
Langkah 3.   
Menetapkan jumlah butir soal berdasarkan topik-topik dan aspek tujuan/ranah, yang disusun dan tersebar secara proposional.
Langkah 4.
Mengidentifikasi bentuk-bentuk soal, berupa tes objektif (B–S, Pilihan Berganda, Isian, Menjodohkan), atau bentuk essay (terbuka atau terbatas).
Langkah 5. 
Menetapkan proporsi tingkat kesulitan butir-butir soal yang mencakup keseluruhan perangkat instrumen penilaian tersebut. Sebagai ancang-ancang dapat digunakan proporsi : Sulit (25%), Sedang (50%), dan Mudah (25%). Persentase tersebut supaya disebarkan secara normal.

Setelah kelima langkah tersebut ditempuh, maka akan diperoleh suatu kisi-kisi penilaian yang lengkap dan menyeluruh.


E. KRITERIA EVALUASI
Sebagaimana telah disinggung pada uraian sebelumnya bahwa evaluasi adalah merupakan kegiatan yang meliputi pengumpulan bukti-bukti yang kemudian dijadikah dasar dalam pengambilan keputusan tentang keberhasilan siswa mengikuti pelajaran. Agar pengambilan keputusan tidak merupakan perbuatan yang subyektif, maka diperlukan patokan tertentu. Kriteria tersebut berfungsi sebagai ukuran, apakah seseorang telah memenuhi persyaratan untuk digolongkan sebagai siswa yang berhasil, pandai, baik, naik kelas, lulus atau tidak. Kriteria penilaian itu disebut dengan istilah “Standar Penilaian”. Dan standar penilaian yang dimaksud dibedakan menjadi 2 (dua) jenis, yaitu:
a. Standar Penilaian Yang mutlak.
b. Standar Perilaian Yang Relatif.

Standar Penilaian Yang Mutlak.

Kriteria ini lebih dikenal dengan istilah “Penilaian Acuan Patokan” atau disingkat PAP. Dan istilah ini merupakan terjemahan dari istilah asing “Criterion Referenced”. Standar ini bersifat tetap atau bahkan tidak dapat ditawar. Dalam artian bahwa kriteria keberhasilan siswa itu tidak dipengaruhi oleh prestasi suatu kelompok siswa. Apabila kita menggunakan standar ini, maka keberhasilan atau kegagalan siswa dalam mengikuti pelajaran ditentukan berdasarkan kriteria yang telah ditetapkan sebelumnya (sebelum evaluasi dilaksanakan). Pelaksanaan standar PAP ini dapat diberikan contoh sebagai berikut:
Misalnya untuk dapat dinyatakan lulus, siswa harus dapat menjawab dengan betul paling sedikit 70% dari pernyataan yang disediakan. Ini berarti bahwa siswa yang menjawab benar kurang dari 70% dari jumlah soal yang disediakan, dinyatatan tidak berhasil atau tidak lulus.

Langkahnya dapat didiskripsikan sebagai berikut:

a. Menetapkan kualifikasi nilai minimal yang dapat diterima, misalnya: 5,50; 6,0; atau 7,0 dan sebagainya, sebagai batas lulus atau passing grade. Atau batas kesalahan minimal yang masih dapat dimaafkan dalam suatu penilaian. Ketentuan tersebut terserah kepada guru.
b. Membandingkan angka nilai (prestasi) setiap siswa dengan nilai passing grade tersebut. Secara teoritis maka mereka yang angka nilai prestasinya berada di bawah batas lulus, dinyatakan tidak berhasil.

Standar Yang Relatif

Kriteria ini lebih dikenal dengan istilah “Penilaian Acuan Normal”atau disingkat PAN. Dan istilah ini merupakan alih bahasa dari istilah asing “Norm Referenced”. Berbeda dengan standar mutlak, pada standar yang relatif ini keberhasilan siswa ditentukan oleh posisinya di antara kelompok siswa yang mengikuti evaluasi. Dengan lain perkataan, bahwa keberhasilan seseorang siswa dipengaruhi oleh tempat relatifnya dibandingkan dengan prestasi rata-rata kelompok. Dengan menggunakan standar relatif, dapat terjadi bahwa siswa yang prosentasi (%) jawaban yang benar hanya 50% dapat dinyatakan lulus atau berhasil, karena kebanyakan teman-teman yang lain mencapai angka prosentasi yang lebih rendah. Sebagai contoh misalnya:

Dalam suatu kelas, ujian tulis IPS yang diikuti oleh 30 orang siswa diberikan 100 buah soal. Ternyata kebanyakan siswa hanya berhasil menjwab 56 soal dengan betul, dan dapat dinyatakan lulus. Pada kelas lain, dari 100 soal yang diujikan rata-rata siswa berhasil menjawab dengar benar 90 soal, sehingga si A yang berhasil menjawab dengan benar 65 soal, dinyatakan tidak berhasil atau gagal.

Dengan demikian kriteria keberhasilan masing-masing kelas tidak sama. Sehingga keberhasilan seseorang siswa baru dapat ditentukan setelah prestasi kelompoknya diketahui. Dan jenis standar ini tepat dipakai oleh guru, apabila ia akan mengetahui kedudukan siswa dalam kelompok/ kelasnya. Mengingat karakteristik dari masing-masing standar itu, dan sesuai dengan prinsip ketuntasan belajar,  bahwa “pengolahan skor yang diperoleh siswa diperlakukan dengan menggunakan standar mutlak atau Penilaian Acuan Patokan (PAP)”.

Misalnya:

Item soal yang harus dikerjakan siswa adalah 40 buah. Setiap butir soal yang dapat dijawab benar oleh siswa diberi skor 1 (satu). Jadi skor maksimal yang mungkin dicapai adalah 40. Ani memperoleh skor 24. Ini berarti Ani menguasai

tujuan/bahan pelajaran, maka nilai untuk Ani adalah 6,00

tujuan/bahan pelajaran, maka Budi akan mendapat nilai 9,00

Disamping itu penulis informasikan pula, bahwa skala nilai yang dipergunakan dalam buku raport dan Ijazah adalah skala 0 – 10. Sehingga taraf penguasaan 60% sama dengan nilai 6,00 (enam), dan taraf penguasaan 90% sama dengan nilai 9,00 (sembilan), dan seterusnya.


F. BEBERAPA KONSEP YANG BERKAITAN DENGAN EVALUASI

Penilaian yang akan dilaksanakan harus memenuhi persyaratan atau kriteria sebagai berikut  (1). Memiliki validitas, (2). Mempunyai reliabilitas, (3). Objektivitas, (4). Efisiensi, dan (5). Kegunaan/ Kepraktisan.
1. Validitas. 
Artinya penilaian harus benar-benar mengukur apa yang hendak diukur. Misalnya, barometer adalah alat pengukur tekanan udara dan tidak tepat bila digunakan untuk mengukur temperatur udara. Demikian pula suatu tes memiliki suatu validitas bila tes itu benar-benar mengukur hal yang hendak di tes. 
Sebuah tes inteligensi, validitasnya dapat diperkirakan dengan kriteria lain, yakni dengan ukuran yang diprakirakan oleh guru. Misalnya seorang guru telah lama bergaul dengan siswa tertentu. Dia dapat melihat kapasitas siswa itu berada di bawah pengawasannya. Apabila antara hasil tes dengan pendapat guru tak seberapa berbeda (korelasinya tinggi), maka dapat dinyatakan bahwa tes itu mempunyai validitas yang tinggi.
Kriteria lain yang dapat digunakan untuk mengukur validitas tes itu ialah membandingkannya dengan hasil yang telah diperoleh oleh seorang ahli lain. Jadi validitas suatu tes menunjukkan ukuran/tingkat di mana tes itu dapat dipergunakan untuk mengukur suatu tujuan objek tertentu.
2. Reliabilitas. 
Suatu alat evaluasi memiliki reliabilitas, bila menunjukkan ketetapan hasilnya. Dengan kata lain, orang yang akan dites itu akan mendapat skor yang sama bila dia dites kembali dengan alat uji yang sama.
Reliabilitas suatu tes biasanya dinyatakan dengan koefisien korelasi. Suatu alat evaluasi yang tinggi bila reliabilitasnya menunjukkan koefisien korelasi 1.00, sedangkan tes yang reliabilitasnya rendah mempunyai koefisien korelasi 0.00.
Untuk mengetahui besar kecilnya reliabilitas suatu tes dapat ditempuh berbagai cara, yakni dengan cara mengulangi kembali tes itu (test-retest), atau dengan cara comparable forms atau split halves method. Pendek kata, semua alat evaluasi yang digunakan oleh guru harus cukup reliabel sekalipun tidak begitu tinggi.
3. Objektivitas. Suatu alat evaluasi harus benar-benar mengukur apa yang diukur, tanpa adanya interpretasi yang tidak ada hubungannya dengan alat evaluasi itu. Guru harus menilai siswa dengan kriteria yang sama bagi setiap pekerjaan tanpa membeda-bedakan si A atau si B dan seterusnya.
Selain dari itu, interpretasi siswa terhadap instruksi dalam alat evaluasi harus sama, instruksinya harus jelas dan tegas, tidak menimbulkan interpretasi yang berbeda-beda.
Objektivitas dalam penilaian sering diperlukan dalam menggunakan : questioner, essay test, observation, rating scale, check list dan alat-alat lainnya.
Sering terjadi suatu alat evaluasi yang dibuat oleh seorang guru menimbulkan berbagai interpretasi, sehingga hasilnya sangat berbeda-beda, karena setiap siswa mempunyai interpretasinya masing-masing terhadap alat tersebut. Perbedaan interpretasi itu mungkin disebabkan adanya istilah-istilah yang sulit dipahami. Untuk menghindarkan kesalahpahaman ini, perlu dilakukan percobaan terlebih dulu dan menetapkan kriteria untuk mengontrol hasilnya.
Objektivitas juga diperlukan pada waktu membuat skor hasil tes. Guru harus menggunakan kriteria yang sama.
4. Efisiensi. Suatu alat evaluasi sedapat mungkin dipergunakan tanpa membuang waktu dan uang yang banyak. Ini tidak berarti, bahwa evaluasi yang memakan waktu, usaha dan uang sedikit dianggap alat evaluasi yang baik. Hal ini tergantung pada tujuan penggunaan alat evaluasi dan banyaknya siswa yang dinilai dan sebagainya.
Suatu alat evaluasi diharapkan dapat digunakan dengan sedikit biaya dan usaha yang sedikit, dalam waktu yang singkat, dan hasil yang memuaskan. Efisiensi dapat dicapai dengan cara :
a. Si penilai mampu memilih alat yang tepat untuk tujuan tertentu.
b. Si penilai dapat mempertimbangkan perlu tidaknya mempergunakan beberapa macam alat penilai.
c. Si penilai hanya memperhatikan hal-hal yang berhubungan dengan tujuan yang sama.
5. Kegunaan/Kepraktisan. Ciri lain dari alat evaluasi ialah usefulness (harus berguna). Untuk memperoleh keterangan tentang siswa, sehingga guru dapat memberikan bimbingan sebaik-baiknya bagi para siswanya.


SEKEDAR TAMBAHAN: MACAM-MACAM EVALUASI 

Formatif
Evaluasi formatif adalah evaluasi yang dilakukan pada setiap akhir pembahasan suatu pokok bahasan / topik, dan dimaksudkan untuk mengetahui sejauh manakah suatu proses pembelajaran telah berjalan sebagaimana yang direncanakan. Winkel menyatakan bahwa yang dimaksud dengan evaluasi formatif adalah penggunaan tes-tes selama proses pembelajaran yang masih berlangsung, agar siswa dan guru memperoleh informasi (feedback) mengenai kemajuan yang telah dicapai. Sementara Tesmer menyatakan formative evaluation is a judgement of the strengths and weakness of instruction in its developing stages, for purpose of revising the instruction to improve its effectiveness and appeal. Evaluasi ini dimaksudkan untuk mengontrol sampai seberapa jauh siswa telah menguasai materi yang diajarkan pada pokok bahasan tersebut. Wiersma menyatakan formative testing is done to monitor student progress over period of time. Ukuran keberhasilan atau kemajuan siswa dalam evaluasi ini adalah penguasaan kemampuan yang telah dirumuskan dalam rumusan tujuan (TIK) yang telah ditetapkan sebelumnya. TIK yang akan dicapai pada setiap pembahasan suatu pokok bahasan, dirumuskan dengan mengacu pada tingkat kematangan siswa. Artinya TIK dirumuskan dengan memperhatikan kemampuan awal anak dan tingkat kesulitan yang wajar yang diperkiran masih sangat mungkin dijangkau/ dikuasai dengan kemampuan yang dimiliki siswa. Dengan kata lain evaluasi formatif dilaksanakan untuk mengetahui seberapa jauh tujuan yang telah ditetapkan telah tercapai. Dari hasil evaluasi ini akan diperoleh gambaran siapa saja yang telah berhasil dan siapa yang dianggap belum berhasil untuk selanjutnya diambil tindakan-tindakan yang tepat. Tindak lanjut dari evaluasi ini adalah bagi para siswa yang belum berhasil maka akan diberikan remedial, yaitu bantuan khusus yang diberikan kepada siswa yang mengalami kesulitan memahami suatu pokok bahasan tertentu. Sementara bagi siswa yang telah berhasil akan melanjutkan pada topik berikutnya, bahkan bagi mereka yang memiliki kemampuan yang lebih akan diberikan pengayaan, yaitu materi tambahan yang sifatnya perluasan dan pendalaman dari topik yang telah dibahas.

Sumatif

Evaluasi sumatif adalah evaluasi yang dilakukan pada setiap akhir satu satuan waktu yang didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit ke unit berikutnya. Winkel mendefinisikan evaluasi sumatif sebagai penggunaan tes-tes pada akhir suatu periode pengajaran tertentu, yang meliputi beberapa atau semua unit pelajaran yang diajarkan dalam satu semester, bahkan setelah selesai pembahasan suatu bidang studi.

Diagnostik
Evaluasi diagnostik adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan dan kelemahan-kelemahan yang ada pada siswa sehingga dapat diberikan perlakuan yang tepat. Evaluasi diagnostik dapat dilakukan dalam beberapa tahapan, baik pada tahap awal, selama proses, maupun akhir pembelajaran. Pada tahap awal dilakukan terhadap calon siswa sebagai input. Dalam hal ini evaluasi diagnostik dilakukan untuk mengetahui kemampuan awal atau pengetahuan prasyarat yang harus dikuasai oleh siswa. Pada tahap proses evaluasi ini diperlukan untuk mengetahui bahan-bahan pelajaran mana yang masih belum dikuasai dengan baik, sehingga guru dapat memberi bantuan secara dini agar siswa tidak tertinggal terlalu jauh. Sementara pada tahap akhir evaluasi diagnostik ini untuk mengetahui tingkat penguasaan siswa atas seluruh materi yang telah dipelajarinya.







Perbandingan Tes Diagnostik, Tes Formatif, dan Tes Sumatif

Ditinjau dari Tes Diagnostik Tes Formatif Tes Sumatif
Fungsinya mengelompokkan siswa berdasarkan kemampuannya
  menentukan kesulitan belajar yang dialami Umpan balik bagi siswa, guru maupun program untuk menilai pelaksanaan suatu unit program Memberi tanda telah mengikuti suatu program, dan menentukan posisi kemampuan siswa dibandingkan dengan anggota kelompoknya
cara memilih tujuan yang dievaluasi memilih tiap-tiap keterampilan prasarat
  memilih tujuan setiap program pembelajaran secara berimbang
  memilih yang berhubungan dengan tingkah laku fisik, mental dan perasaan Mengukur semua tujuan instruksional khusus Mengukur tujuan instruksional umum
Skoring (cara menyekor) menggunakan standar mutlak dan relatif menggunakan standar mutlak menggunakan standar relatif

Prinsip Evaluasi
Terdapat beberapa prinsip yang harus diperhatikan dalam melaksanakan evaluasi, agar mendapat informasi yang akurat, diantaranya:
1. Dirancang secara jelas abilitas yang harus dinilai, materi penilaian, alat penilaian, dan interpretasi hasil penilaian. 
patokan : Kurikulum/silabius.
2. Penilaian hasil belajar menjadi bagian integral dalam proses belajar mengajar.
3. Agar hasil penilaian obyektif, gunakan berbagai alat penilaian dan sifatnya komprehensif.
4. Hasilnya hendaknya diikuti tindak lanjut.
Prinsip lain yang dikemukakan oleh Ngalim Purwanto adalah:
1. Penilaian hendaknya didasarkan pada hasil pengukuran yang komprehensif.
2. Harus dibedakan antara penskoran (scoring) dengan penilaian (grading)
3. Hendaknya disadari betul tujuan penggunaan pendekatan penilaian (PAP dan PAN)
4. Penilaian hendaknya merupakan bagian integral dalam proses belajar mengajar.
5. Penilaian harus bersifat komparabel.
6. Sistem penilaian yang digunakan hendaknya jelas bagi siswa dan guru.



KEPUSTAKAAN:

1. Anas Sudijono, 2004. Pengantar Evaluasi Pendidikan, Penerbit: Rajawali Pers
2. Asmawi Zainul & Noehi Nasution. 2001. Penilaian Hasil belajar. Jakarta: Dirjen Dikti
3. Djemari Mardapi, 2004. Teknik Penyusunan Instrumen Tes Nontes. Yogyakarta: Mitra Cendikia
4. J.S. Calongesi, 1995. Merancang Tes untuk Menilai Prestasi Siswa. Bandung : ITB
5. Suharsimi Arikunto. 2004. Dasar-dasar Evaluasi Pendidikan,  Jakarta: Bumi Aksara


Demikian sajian ini, kiranya bermanfaat. Terima Kasih!


TUHAN YESUS MEMBERKATI
--ooOOoo--

0 komentar :

Poskan Komentar

Blogger templates