Minggu, 18 Desember 2011

The Many Faces of Evaluation

THE MANY FACES OF EVALUATION

Faiqotur Rosidah
(09745005)
Evaluasi pembelajaran merupakan hal yang esensial dalam proses mendesain pembelajaran . Proses desain evaluasi dilakuakn setelah mempelajari karakteristik pembelajar, mengidentifikasi tujuan pembelajaran dan menyeleksi prosedur pembelajaran agar mencapai tujuan yang telah ditetapkan. Alat tes dan materi yang akan dibuat seharusnya tidak hanya mampu mengukur tingkat penguasaan pengetahuan siswa, memperlihatkan kemahiran siswa, namun juga untuk memperlihatkan perubahan sikap sesuai dengan tujuan yang telah dirumuskan.
Sebelum evaluasi pembelajaran diberikan pengajar harus menentukan tujuannnya. Tujuan umumnya adalah untuk menentukan tingkat kesuksesan pembelajaran siswa. Namun demikian apakah hasil evaluasi dapat digunakan untuk meningkatkan bagaimana pembelajaran itu diajarkan. Dengan kata lain, evaluasi digunakan untuk mengetahui efektivitas suatu pembelajaran. Dua fungsi ini berjalan beriringan, tapi tujuan dari proses evaluasi bisa berbeda bergantung pada fungsi mana yang memegang peranan lebih penting. Pendekatan ini dikenal dengan istilah evaluasi formatif dan evaluasi sumatif.
Evaluasi formatif menjadi bagian penting dalam proses mendesain pembelajaran. Fungsinya untuk memberikan informasi pada guru tentang seberapa baik program pembelajaran itu mencapai tujuan seiring dengan masih berlangsungnya pembelajaran. Evaluasi formatif sangat berguna ketika dilaksanakan pada saat pengembangan dan uji coba. Jika dalam rencana pembelajaran tersebut terdapat kelemahan, kelemahan tersebut dapat segera diidentifikasi dan diatasi sebelum pelaksanaan pembelajaran secara menyeluruh. Hasil tes, reaksi dari siswa, observasi terhadap pekerjaan, review oleh ahli, dan saran dari kolega dapat menunjukkan devisiensi dalam tingkatan pembelajar, prosedur maupun materi.
Tes formatif dan revisinya penting untuk kesuksesan rencana pembelajaran.tes formatif dan revisi ini tidak hanya mencakup kesesuaian tujuan pembelajaran, isi pembelajaran, metode pembelajaran, dan materinya. Akan tetapi, juga berhubungan dengan peran guru, fungsi fasilitas-fasilitas dan peralatan yang ada, jadwal, dan juga faktor-faktor lain yang kesemuanya saling berhubungan dalam mempengaruhi performa optimum untuk pencapaian tujuan pembelajaran. Hal yang perlu diingat bahwa proses perencanaan pembelajaran saling berhubungan dan setiap elemen-elemen mempengaruhi elemen lainnya.
Data yang dapat digunakan saat proses evaluasi adalah (1) berdasarkan tujuan pembelajaran yang sudah ditetapkan, apakah tahapan pembelajaran dapat diterima dengan baik? Apa saja kelemahannya? (2) Apakah para siswa dapat menerima pelajaran yang diberikan atau dapat menampilkan keahlian yang diajarkan pada tahapan yang diharapkan? (3) Berapa lama waktu yang diperlukan untuk proses belajar-mengajar tersebut? Apakah jangka waktu tersebut dapat diterapkan? (4) Apakah aktivitas yang ditampilkan sesuai dan dapat dilaksanakan dengan baik oleh para guru dan siswa? (5) Apakah materi pelajaran yang disampaikan nyaman, mudah ditemukan, digunakan dan disimpan? (6) Bagaimana reaksi siswa terhadap metode, aktifitas, materi dan evaluasi pembelajaran yang telah diberikan? (7) apakah unit tes dan hasil-hasil lain dapat mengukur kepuasan pengajar akan pencapaian tujuan pembelajaran? (8) Apakah diperlukan revisi dalam program pembelajaran tersebut? (9) Apakah konteks pembelajaran yang disampaikan sesuai?
Evaluasi Sumatif dilaksanakan untuk mengukur tingkatan keberhasilan yang diperoleh pada saat proses pembelajaran telah selesai. Informasi kuncinya didapat dari hasil postes dan ujian akhir. Adapun tujuan evaluasi sumatif adalah untuk mengetahui efiesiensi pembelajaran (pemahaman materi dan waktu), biaya pengembangan program, biaya lain-lain sehubungan dengan pelaksanaan pembelajaran, hasil program, dan manfaat jangka panjang program tersebut. Manfaat jangka panjang dapat ditentukan dengan cara mengikuti perkembangan siswa dalam menyelesaikan program tersebut.
Hubungan antara evaluasi formatif dan sumatif dapat dijelaskan sebagai berikut. Hal-hal yang dievaluasi dalam kedua evaluasi ini ditentukan langsung oleh tujuan instruksional. Contoh: jika salah satu tujuannya adalah untuk mengajarkan siswa bagaimana cara mendeskripsikan sebuah laporan kecelakaan dengan benar, memperkirakan bagaimana mereka melaksanakan tugas tersebut dengan baik merupakan bagian penting dari evaluasi di luar aspek apakah fokus utama dari proses tersebut adalah untuk meningkatkan perintah atau instruksi (formatif) atau menilai keefektivannya (sumatif). Jika meningkatkan ’perilaku’ siswa terhadap proses pelaporan kecelakaan bukan merupakan tujuan instruksional, maka sedikit tidak masuk akal untuk memasukkan pengukuran perilaku siswa (meskipun menurut kita, pengukuran perilaku siswa dapat bermanfaat dalam mengartikan mengapa tujuan-tujuan tertentu dapat dicapai dengan sukses atau tidak)..
Ukuran keberhasilan atau kemajuan siswa dalam evaluasi fomatif adalah penguasaan kemampuan yang telah dirumuskan dalam rumusan tujuan instruksional yang telah ditetapkan sebelumnya. Dengan kata lain, evaluasi formatif dilaksanakan untuk mengetahui seberapa jauh tujuan yang telah ditetapkan tercapai. Sementara itu, evaluasi sumatif bertujuan untuk menentukan tingkat pencapaian siswa selama periode tertentu. Evaluasi sumatif akan berdaya guna jika didukung oleh evaluasi formatif.
Dalam evaluasi formatif, tes penting dilaksanakan di semua fase pembelajaran. Pretes dilaksanakan sebelum proses pembelajaran, tes sisipan (embedded test) selama pembelajaran masih berlangsung, dan postes setelah pembelajaran. Meskipun ketiga jenis ini mungkin digunakan dalam evaluasi sumatif, posteslah yang lebih kritis dan sebagai dasar utama untuk mengambil kesimpulan tentang pembelajaran.
Ada hubungan langsung antara tujuan instruksional dan ukuran penilaian. Dalam hal mengetes pengetahuan misalnya, beberapa otoritas bahkan menyarankan agar segera setelah subjek daftar isi dan rincian analisis tugas yang pertama selesai, guru sesegera mungkin membuat pertanyaan yang berkaitan dengan isi. Pada gilirannya, pertanyaan-pertanyaan itu bisa dijadikan imbal balik (tolak ukur?) sebagai tujuan intruksional. Prosedur ini sepertinya terbalik dari perencanaan, namun poin inilah yang penting untuk menjelaskan hubungan langsung antara evaluasi dan tujuan pembelajaran.
Faktor-faktor yang mempengaruhi ukuran evaluasi adalah biaya, waktu, keterampilan dalam mengadministrasi tes, keberadaan instrumen, dan latihan-latihan yang pernah diterima dalam konteks pendidikan. Contoh tes untuk mengukur pengetahuan dapat digunakan beberapa model tes, baik tes objektif maupun constructed-response test. Tes objektif hanya memiliki satu jawaban yang benar dan dalam pemeriksaannya dilakukan secara objektif, misalnya bentuk pilihan ganda, benar-salah, ataupun mencocokkan. Constructed-response test berupa melengkapi, esai pendek, esai panjang, ataupun problem solving /pemecahan masalah. Untuk test keterampilan dan perilaku disarankan tes yang langsung mengukur performansi/praktek, menganalisis aktivitas atau kegiatan siswa secara alamiah, memberi rating dan ceklis dari perilaku, dan tes autentik. Untuk mengukur sikap pada umunya dilakukan dengan penilaian observasi selama pembelajaran, observasi perilaku, menggunakan skala rating, survey, dan interview.
Kriteria tes yang baik antara lain memiliki tingkat validitas dan realibilitas yang tinggi. Validitas berarti bahwa tes mengukur perilaku atau sifat yang ditentukan sesuai dengan tujuan pembelajaran. Suatu alat ukur tes dikatakan valid apabila alat ukur tes tersebut mampu mengukur apa yang hendak diukur secara tepat sehingga mampu memberikan informasi yang akurat tentang hasil belajar siswa, misalnya kita mempunyai sebuah tes kemampuan apresiasi sastra, apakah tes itu mampu mengukur kemampuan apresiasi sastra siswa yang mendekati sesungguhnya? Artinya, siswa yang mendapat nilai baik memang benar-benar lebih baik apresiasi sastranya daripada siswa yang mendapat
Jenis-jenis validitas dapat dibedakan menjadi 5, face validity, content validity, predictive validity, concurrent validity dan construct validity. Face validity didukung oleh penilaian -oleh para ahli- yang muncul pada saat pembelajaran langsung yang tampak dengan jelas untuk mengukur minat siswa dalam belajar. Content validity mirip dengan face validity, content validity atau kesahihan isi merujuk pada pengertian apakah alat tes itu sesuai dengan tujuan dan deskripsi bahan ajar. Jika butir-butir tes secara jelas mengukur sesuai tujuan dan bersifat mewakili bahan yang diajarkan tes tersebut dikatakan memiliki kesahihan isi. predictive validity atau kesahihan ramalan merujuk pada pengertian apakah sebuah alat tes mempunyai kemampuan untuk meramalkan prestasi yang akan dicapai kemudian.
Concurrent validity atau kesahihan sejalan merujuk pada pengertian apakah tingkat kemampuan seseorang pada suatu bidang yang diteskan mencerminkan atau sesuai dengan skor-skor bidang-bidang yang lain yang mempunyai persamaan katakteristik.Construct validity atau kesahihan konstruk merujuk pada pengertian apakah tes yang disusun sesuai dngan konsep ilmu yang diteskan itu.
Reliabilitas tes merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen yang berbeda, atau pada kondisi pengujian yang berbeda. Dengan kata lain, criteria reliabilitas tes mengacu pada ‘apakah suatu tes dapat mengukur secara konsisten sesuatu yang akan diukur dari waktu ke waktu? Konsisten dalam hal ini berarti (1) tes dapat memberikan hasil yang relative tetap terhadap sesuatu yang diukr, (2) jawaban siswa terhadap butir-butir tes relative tetap, (3) hasil tes diperiksa oleh siapapun juga akan menghasilkan skor yang kurang lebih sama. Untuk mendapatkan reliabilitas suatu tes, beberapa metode yang dapat dipakai adalah sebagai berikut: test-retest (tes ulang uji), parallel forms (butir parallel), split-half (belah dua), dan internal consistency (konsistensi internal).
Standar pencapaian yang dapat dipakai untuk menginterpretasi skor tes dan penentuan level adalah standar relative dan absolute. Standar relatif dalam mengevaluasi pembelajaran tercermin dari penilaian acuan norma (PAN) , artinya tiap siswa dibandingkan antara satu dengan yang lainnya juga dalam tujuan seleksi kemampuan siswa. Standar obsolut tercermin dari penilaian acuan kriteria (PAK) dimana performansi siswa dinilai relatif sesuai dengan kriteria yang dibuat tanpa mempertimbangkan bagaimana siswa lainnya memperoleh nilai.
Tes mandiri siswa bertujuan untuk mengetahui tingkat pemahaman pembelajaran dan peningkatannya selama proses pembelajaran. Adapun pretes digunakan untuk (1) menentukan kesiapan siswa dalam memulai proses pembelajaran atau unit pembelajaran tertentu, (2) untuk memberikan performansi dasar sebagai acuan peningkatan pembelajaran, (3) untuk memotivasi siswa dalam mempelajari topik dengan menggerakkan keingintahuan dan minat mereka (4) memberikan informasi pada siswa tentang topik yang akan dipelajarinya, (6) menunjukkan metode tes yang akan dipakai oleh guru dalam ujian akhir karena adanya keterkaitan antara pretest dan posttest; (7) memberikan data untuk menunjukkan kemajuan siswa dalam pembelajaran dengan membandingkan skor pretest dan posttest, dan (8) memberikan informasi tentang evaluasi formatif yang berguna untuk membantu pengajar/instruktur memodifikasi bagian-bagian program pembelajaran (menambahkan atau menghilangkan tujuan dan atau kegiatan) sehingga program bisa dimulai pada poin yang sesuai dengan kesiapan pembelajar.