Oleh: Anindito Aditomo
Pengajaran boleh dibilang sebagai salah satu proses paling penting yang berlangsung di sekolah. Pengajaran adalah wahana utama bagi proses belajar siswa. Sebagian besar waktu siswa di sekolah digunakan untuk mengikuti pelajaran di kelas. Sebagian besar waktu guru juga didedikasikan untuk merancang, melaksanakan, dan mengevaluasi pengajaran di kelas.
Mengingat peran pentingnya, kualitas pengajaran seharusnya menjadi salah satu indikator utama mutu sebuah sekolah. Persoalannya, mengukur kualitas pengajaran secara valid bukan hal yang mudah. Bahkan pengukuran kualitas pengajaran adalah sebuah topik yang tergolong cutting edge dan juga kontroversial dalam riset pendidikan.
Dalam tulisan ini, pengukuran kualitas pengajaran saya pakai sebagai ilustrasi untuk menjelaskan beberapa konsep dasar pengukuran variabel laten. Saya mulai dengan membahas konsep konstruk laten dan eror pengukuran.
Kualitas pengajaran sebagai konstruk laten
Tidak seperti meja atau kursi, kualitas pengajaran bukan barang fisik yang bisa langsung dihitung jumlahnya dan diukur dimensinya dengan meteran. Kualitas pengajaran adalah sebuah gagasan, sebuah deskripsi mengenai karakteristik dari fenomena sosial-psikologis yang disebut pengajaran.
Dalam istilah psikologi, kualitas pengajaran disebut sebagai konstruk laten. Disebut konstruk karena merupakan hasil konstruksi pemikiran. Disebut laten karena tidak tampak secara nyata alias tersembunyi. Sebagian besar variabel yang menjadi topik penelitian ilmu sosial adalah konstruk laten. Sebagai contoh, berikut adalah konstruk-konstruk laten yang populer di bidang psikologi dan pendidikan: kompetensi, kepribadian, motivasi, prestasi akademik, kecerdasan, harga diri, kesejahteraan psikologis, efikasi diri, strategi belajar, dst.
Karena bersifat laten, konstruk-konstruk tersebut hanya bisa diukur secara tidak langsung melalui hal-hal yang diasumsikan sebagai indikatornya. Indikator dari konstruk-konstruk dalam ilmu psikologi dan pendidikan adalah perasaan, pemikiran, dan perilaku.
Sebagai contoh sederhana, kepribadian ekstrover bisa diukur melalui frekuensi mengikuti acara-acara sosial bersama teman. Motivasi instrinsik bisa diukur dari frekuensi mengalami perasaan gembira ketika mempelajari sesuatu. Efikasi diri bisa diukur melalui kuat lemahnya keyakinan (pemikiran) tentang kemampuan menyelesaikan sebuah tugas dengan baik. Kecerdasan bisa diukur dari perilaku ketika mengerjakan soal-soal tes yang menuntut pemikiran logis. Dan seterusnya.
Bias respon dan eror pengukuran
Bagaimana dengan kualitas pengajaran? Indikator apa saja yang relevan untuk mengukurnya? Untuk mengidentifikasi indikator yang tepat untuk mengukur pengajaran, hal pertama yang sebenarnya kita butuhkan adalah sebuah teori yang kuat dan relevan. Teori-teori ini akan saya bahas dalam tulisan lain. Di sini saya akan ambil jalan pintas untuk mengilustrasikan konsep eror pengukuran.
Tanpa teori yang kuat, salah satu jalan pintas yang bisa kita ambil adalah dengan meminta guru untuk menilai kualitas pengajarannya sendiri. Dengan kata lain, kita sedang berasumsi bahwa penilaian diri ini merupakan sebuah indikator yang bisa digunakan untuk mengetahui konstruk laten.
Misalnya, guru bisa diminta untuk menjawab pertanyaan semacam ini:
Seberapa baik kualitas pengajaran anda dalam seminggu terakhir?
Opsi jawabannya bisa berupa skala dengan label yang mencerminkan tingkatan kualitas, misalnya:
Nol („hancur lebur") sampai 10 („sempurna tanpa cela“)
Data bisa dikumpulkan tiap hari Jumat sehingga pada akhir semester kita akan memperoleh sebuah angka yang mewakili kualitas pengajaran tiap guru.
Mudah dibayangkan bahwa penilaian diri semacam ini mengandung bias. Sebagian besar guru tentu ingin menampilkan diri sebagai pengajar yang baik. Bias ini akan semakin kuat jika skornya dipakai untuk keperluan resmi seperti penilaian kinerja dan kenaikan pangkat.
Selain keinginan sadar untuk tampil positif, manusia juga punya kebutuhan intrinsik untuk merasa sebagai orang baik. Ini adalah hal yang wajar. Namun dalam konteks pengukuran, kebutuhan psikologis ini menjadi sumber bias. Guru yang berusaha jujur pun akan secara tidak sadar memberi penilaian yang positif mengenai dirinya. [Baca artikel berikut untuk lebih paham tentang bias-bias ini: artikel 1, artikel 2, artikel 3.]
Bias-bias ini merupakan sumber eror sistematis dalam pengukuran. Disebut eror karena indikator yang kita lihat tidak mencerminkan konstruk laten secara akurat. Disebut sistematis karena eror tersebut memiliki arah tertentu. Dalam contoh, erornya memiliki arah positif sehingga indikator yang kita peroleh (penilaian diri) merupakan estimasi yang terlalu tinggi dari konstruk yang ingin diukur (kualitas pengajaran).
Penilaian siswa sebagai indikator kualitas pengajaran
Selain dari penilaian diri guru, kualitas pengajaran sering diukur dari persepsi atau penilaian siswa. Pada dasarnya, persepsi siswa merupakan hasil observasi. Siswa diasumsikan sebagai pengamat atas proses pengajaran. Dibanding pihak lain, siswa sebenarnya tahu lebih banyak tentang apa yang terjadi sehari-hari di kelas. Karena itu penilaian siswa memang bisa digunakan untuk mengukur kualitas pengajaran.
Aspek apa saja dari proses pengajaran yang perlu diperhatikan dan dilaporkan oleh siswa? Di sini lagi-lagi kita perlu teori. Tapi jika mau mengambil jalan pintas dan sekadar mengandalkan common sense, kita bisa meminta siswa menjawab pertanyaan-pertanyaan semacam:
„Apakah cara mengajar guru X membuat anda mengerti materi pelajaran?“
„Secara keseluruhan, seberapa efektifkah metode pengajaran guru X?“
Sebagaimana laporan diri guru, jawaban siswa terhadap pertanyaan semacam ini juga rentan mengandung bias dan karena itu bukan indikator yang baik untuk mengukur kualitas pengajaran.
Salah satu sumber eror ini adalah ketidakmampuan siswa untuk mengukur tingkat pemahamannya sendiri. Persepsi siswa seringkali lebih dipengaruhi oleh gaya penyampaian informasi guru daripada tingkat pemahaman yang benar-benar dimiliki siswa. Jika guru menyampaikan materi secara satu arah dengan lancar dan menyenangkan, siswa cenderung merasa paham. Sebaliknya, jika guru sering melontarkan pertanyaan dan tugas yang menuntut siswa berpendapat dan berpikir, siswa akan cenderung merasa kurang memahami materi.
Akibatnya, guru yang pandai dan gemar berceramah cenderung dinilai siswa secara lebih positif dibanding guru yang menggunakan metode interaktif. Masalahnya, apakah benar bahwa guru yang pandai ceramah itu memang lebih efektif dalam mengembangkan pemahaman siswa? Justru sebaliknya: riset menunjukkan bahwa metode interaktif seringkali lebih efektif dibanding metode ceramah. Dengan demikian, sebagaimana kecenderungan guru untuk menilai diri secara positif, bias dalam penilaian siswa juga bersifat sistematis. Pengajaran yang sebenarnya lebih efektif justru cenderung dinilai negatif oleh siswa.
Eror acak dan sistematis
Uraian di atas menunjukkan bahwa penilaian diri dan penilaian siswa tentang kualitas pengajaran seringkali mengandung bias. Bias-bias yang saya contohkan di atas adalah sumber eror yang bersifat sistematis. Ini berbeda dari eror yang sifatnya acak. Eror yang acak kadang positif dan kadang negatif. Karena itu, eror acak bisa diatasi dengan mudah, yakni dengan menambah indikator atau frekuensi pengukuran.
Agar lebih jelas, saya analogikan dengan lemparan dadu. Eror pengukuran yang acak sama seperti peluang munculnya angka tertentu dari lemparan dadu. Jika kita hanya melempar tiga atau empat kali, mungkin saja kita memperoleh angka tertentu secara berturut-turut.
Tapi jika kita lemparkan terus, lama-kelamaan kita akan memperoleh semua angka dengan frekuensi yang kurang lebih sama. Dalam jangka (sangat) panjang, rata-rata peluang tiap angka adalah 1/6, yakni peluang sesungguhnya dari lemparan dadu. [Tentu saja, ini mengasumsikan lemparan dadunya adil.]
Kembali ke pengukuran kualitas pengajaran: jika erornya bersifat acak, solusinya mudah. Ukur saja dengan sebanyak mungkin indikator, dari sebanyak mungkin siswa, dengan frekeunsi yang sesering mungkin. Rata-rata dari seluruh pengukuran itu akan mencerminkan tingkat kualitas pengajaran yang „sesungguhnya.“
Gagasan menambah indikator dan frekuensi hasil pengukuran untuk memperoleh skor murni (true score) ini adalah asumsi dasar dalam teori tes klasik. Sayangnya, cara ini tidak bisa mengatasi eror yang sistematis. Upaya untuk mengidentifikasi dan mengatasi sumber eror sistematis ini adalah persoalan validitas konstruk.
Penutup
Bagaimana cara meningkatkan dan mengevaluasi validitas konstruk dalam pengukuran kualitas pengajaran? Konsep validitas konstruk akan saya uraikan dalam tulisan lain. Di sini, yang ingin saya tekankan adalah bahwa upaya meningkatkan validitas bertumpu pada teori tentang konstruk yang ingin diukur.
Kalau pembahasan di atas menunjukkan bahwa penilaian guru dan siswa mengandung bias, bukan berarti bahwa kedua sumber informasi tersebut tidak boleh dipakai untuk mengukur kualitas pengajaran. Sekali lagi, poinnya adalah bahwa penentuan indikator harus didasarkan pada teori yang kuat dan relevan tentang kualitas pengajaran.