Wednesday 8 December 2021

Pengembangan Dan Pengolahan Tes Hasil Belajar

Pengembangan Tes Hasil Belajar

Penyusunan Tes Hasil Belajar

Menyusun spesifikasi tes

Spesifikasi tes mencakup : menentukan tujuan tes, menyusun kisi-kisi tes, memilih bentuk tes, menentukan panjang tes. Dan kisi-kisi tes memenuhi persyaratan berikut:

mewakili isi kurikulum yang akan diujikan, 

komponennya rinci, jelas, dan mudah dipahami,

indikator soal harus jelas dan dapat dibuat soalnya sesuai dengan bentuk soal yang telah ditetapkan.

Menulis soal

Menelaah soal tes

Setelah soal disusun perlu dilakukan telaah atas soal tersebut. Diperlukan untuk memperbaiki soal yang diamati terdapat kekurangan. Butir yang disusun diamati dari segi konstruksi, content (isi) dan bahasanya.

Melakukan ujicoba tes

Melakukan analisis butir soal

Memperbaiki tes

Merakit tes

Melaksanakan tes

Menafsirkan hasil tes

Analisis Butir Soal

Analisis butir soal yaitu menganalisis butir dari taraf sukar, daya beda, fungsi distraktor. Taraf sukar menganalisis tingkat kesukaran soal apakah terlalu sukar atau sebaliknya dan daya beda menganalisis apakah butir soal tersebut mempunyai kemampuan untuk membedakan antara siswa yang rajin dan yang malas, sedangkan fungsi distractor mempunyai fungsi sebagai pengecoh terhadap siswa yang malas belajar. 

Analisis Butir Soal Secara Kualitatif

Sebelum dilakukan analisis butir soal secara empririk atau uji coba instrumen ke lapangan maka dilakukan analisis butir soal secara teoretik atau rasional yaitu meliputi analisis secara konstruksi, content (isi) dan bahasa. 

Analisis Butir Soal Secara Empirik

Setelah dilakukan analisis butir soal secara kualitatif selanjutnya dilakukan proses uji coba instrumen ke lapangan, yang kemudian dianalisis taraf sukar, daya beda dan fungsi distraktor. 

Bentuk Soal Obyektif

Tingkat Kesukaran

Proposi testee yang menjawab benar disebut tingkat kesukaran atau taraf sukar. Tingkat kesukaran soal berkisar antara 0,00 sampai dengan 1,00, artinya tingkat kesukaran soal paling rendah 0,00 dan paling tinggi 1,00. Tingkat kesukaran 0,00 menunjukan bahwa butir soal tersebut termasuk sukar, artinya tidak ada seorang testeepun yang menjawab betul dari butir soal tersebut. Sedangkan tingkat kesukaran 1,00 menunjukan bahwa butir soal tesrsebut terlalu mudah artinya seluruh testee dapat menjawab betul dari butir soal tersebut. Tingkat kesukaran soal dapat diperoleh melalui perhitungan dengan rumus:

P=  R/T

Keterangan : 

P = Tingkat kesukaran butir soal 

R = Jumlah yang menjawab benar 

T = Jumlah seluruh peserta tes


Kriteria Tingkat Kesukaran Butir Soal

– 0.30 = Sukar

0.31 – 0.70 = Sedang

0.71 – 1.00 = Mudah

Daya Pembeda

Daya pembeda soal yang baik adalah butir soal yang dapat membedakan antara kelompok atas yaitu kelompok testee yang berkemampuan tinggi (rajin belajar) dan kelompok bawah yaitu kelompok testee yang berkemampuan rendah (malas belajar). 

Indeks daya pembeda soal berkisar antara -1 sampai dengan +1. Indeks daya pembeda bertanda plus (positif) hal ini merupakan petunjuk bahwa butir soal tersebut sudah memiliki daya pembeda, dalam arti testee yang berada pada kategori kemampuan tinggi (kelompok atas) lebih banyak dapat menjawab betul terhadap butir sol tersebut, sedangkan testee yang berada pada kategori kemampuan rendah (kelompok bawah) lebih banyak menjawab salah. 

Jika indeks daya pembeda 0,00, keadaan ini menunjukkan bahwa butir soal tidak memiliki daya pembeda sama sekali. jika indeks daya pembeda bertanda minus (negatif), keadaan ini menunjukkan bahwa butir soal tersebut lebih banyak dijawab betul oleh testee kelompok bawah dari pada kelompok atas. Daya pembeda soal obyektif diperoleh melalui perhitungan dengan menggunkan rumus:

D=  (FTI (X=1))/MT-  (FRI (X=1))/MR


Keterangan: 

D = Daya Beda 

FTI = Kelompok Tinggi 

FRI = Kelompok Rendah 

MT = Jumlah responden kelompok tinggi 

MR = Jumlah responden kelompok rendah


Indeks Daya Pembeda

<0.20 = Daya Pembeda Lemah (poor)

0.20–0.39 = Daya Pembeda cukup (satisfactory)

0.40 – 0.69 = Daya Pembeda baik (good)

0.70 – 1.00 = Daya Pembeda baik Sekali 

Negatif = Daya Pembeda jelek


Dengan menghitung tingkat kesukaran dan daya beda soal tester dapat mengetahui kualitas butir soal yang disusun, sehingga dapat dihindari ketimpangan skor dalam bentuk ketidakwajaran skor. Selain dari ketidakwajaran skor dalam ketimpangan skor terdapat bias butir. 

Instrumen valid akan mengukur apa yang hendak diukur sesuai dengan materi atau kisi-kisi instrumen, sehingga dapat diketahui apakah instrumen atau alat ukur tersebut sudah melakukan fungsi ukurnya dengan baik, 

Instrumen reliabel yaitu tester dapat memperoleh data atau informasi yang tepat tentang kemampuan atau keadaan sebenarnya dari testee tersebut.

Fungsi Distraktor

Fungsi pengecoh terdapat pada tes objektif dalam bentuk alternatif pilihan jawaban (option). Pilihan jawaban dalam tes obyektif berkisar antara 3 sampai 5 buah, dan dari kemungkinan jawaban yang terpasang pada setiap butir item itu salah satunya adalah jawaban betul dan sisanya adalah jawaban salah, jawaban salah dikenal dengan istilah pengecoh atau distractor. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik (testee) yang menjawaB salah. Distraktor berfungsi jika : 

Sekurang kurangnya dipilih oleh 5% peserta tes atau siswa 

Lebih banyak dipilih oleh kelompok bawah

Distraktor=  (Jumlah Jawaban)/(Jumlah siswa) X 100%

Bentuk Soal Uraian

Tingkat Kesukaran Soal

Tingkat kesukaran soal dipergunakan untuk mengetahui seberapa besar tingkat kesukaran suatu soal. Tingkat kesukaran berkisar antara 0 sampai dengan 1. Makin besar tingkat kesukaran maka makin mudah soal begitu pula sebaliknya. Dengan rumus:

TK=  Mean/(Skor Maksimum)

TK = tingkat kesukaran soal uraian 

Mean = rata-rata skor testee 

Skor Maksimum = skor maksimum yang ada pada pedoman penskoran

Kriterian Tingkat Kesukaran

0.00-0.30 = Sukar

0.31-0.70 = Sedang

0.71-1.00 = Mudah

Daya Beda

Indeks yang menunjukan tingkat kemampuan butir soal yang membedakan kelompok atas dari kelompok bawah diantara para peserta tes. Indeks daya pembeda soal berkisar antara -1 sampai dengan +1. Daya pembeda soal uraian diperoleh melalui perhitungan dengan menggunkan rumus:

DP=  (Mean A (Kel.Atas)-Mean B (kel.Bawah))/(Skor Maksimum)

DP = daya pembeda soal uraian 

Mean A = rata-rata skor testee kelompok atas 

Mean B = rata-rata skor testee kelompok bawah

Skor maksimum = skor maksimum yang ada pada pedoman penskoran.


< 0, 20 =Daya pembeda lemah 

0, 20 – 0, 39 Daya pembeda yang cukup  

0, 40 – 0, 69 Daya pembeda yang baik 

0, 70 – 1,00 Daya pembeda yang baik sekali 

(-)  Daya pembeda negatif (jelek sekali)

Analisis Perangkat Soal

Instrumen yang berkualitas adalah instrumen yang valid dan reliabel. Instrumen yang valid yaitu sahih, yang mampu mengukur sejauh mana ketepatan suatu alat ukur dalam melakukan fungsi ukurnya. Sedangkan reliabilitas adalah untuk mengetahui sejauh mana hasil suatu pengukuran dapat dipercaya yang memiliki daya keajegan yang tinggi.

Pengujian Validitas Tes Hasil Belajar

Validitas suatu instrumen didalamnya mempermasalahkan apakah tes atau instrumen tersebut benar-benar mengukur apa yang hendak diukur. Penganalisisan tes hasil belajar dapat dilakukan melalui validitas rasional dan validitas emprik.

Pengujian Tes Secara Rasional

Validitas rasional diperoleh atas dasar hasil pemikiran, atau berdasarkan hasil pemikiran yang logis. Apabila secara rasional setelah dianalisis bahwa tes hasil belajar tersebut secara rasional memang benar-benar telah dapat mengukur apa yang hendak diukur.

Validitas Isi

Validitas isi untuk mengetahui sejauh mana suatu tes mampu mengukur tingkat penguasaan terhadap isi atau materi tertentu sesuai dengan tujuan pengajaran atau sejauh mana pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan proposional perilaku sampel yang dikenai tes tersebut.

Validitas Konstruk

Validitas Konstruk adalah untuk mengetahui sejauh mana butir instrumen mampu mengukur apa yang benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual. Validitas konstruk didalamnya mengukur variabel konsep dan perumusan konstruk dimulai berdasarkan sintesis dari teori mengenai konsep variabel yang hendak diukur melalui proses analisis.

Validitas Prediktif

Validitas prediktif adalah prestasi belajar siswa yang akan datang, karena validitas prediktif bermaksud melihat bagaimana suatu tes dapat dapat memprediksi atau memperkirakan perilaku siswa pada masa yang akan datang.

Validitas Konkuren

Validitas konkuren ialah jika kriteria standarnya adalah sama sama saat atau saat ini, dan bukan masa yang akan datang.

Validitas Empiris

Validitas Empiris adalah validitas yang ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria. Sedangkan kriteria eksternal yaitu hasil ukur instrumen atau tes lain di luar instrumen yang menjadi kriteria, contoh validitas ramalan (predictive validity) dan validitas bandingan (concurrent validity).

Pengujian Validitas Item Tes Hasil Belajar

Validitas butir dari suatu tes adalah ketepatan mengukur yang dimiliki oleh sebuah item yang merupakan bagian tak terpisahkan dari tes sebagai suatu totaliats. Validitas butir adalah validitas internal dan yang dijadikan kriteria skor total di dalam instrumen (tes itu sendiri). Sebutir item dikatakan memiliki validitas tinggi jika telah memiliki kesesuaian atau kesejajaran arah dengan skor totalnya atau ada korelasi positif yang signifikant antara skor item dengan skor totalnya.

Pengujian Realibilitas Tes Hasil Belajar

Uji reliabilitas untuk mengetahui sejauhmana tingkat kepercayaan atau konsistennya dalam mengukur sehinnga dapat ditentukan apakah tes hasil belajar yg disusun telah memiliki daya keajegan atau kepercayaan yang tinggi, sehingga instrumen (tes hasil belajar) yang disusun dapat dikatakan adalah reliabel yang mempunyai tingkat konsisten hasil ukur atau dapat mengukur keadaan yang sebenaranya dari keadaan siswa atau subyek yang diukur. Dan dalam menghitung reliabilitas antara lain dapat menggunakan rumus Alpha Cronbach untuk tes uraian sedangkan untuk tes obyektif menggunakan rumus Kuder Richardson. Dan tingkat reliabilaitas yang diterima apabila ≥ 0,70.

Pengolahan Hasil Penilaian Tes Hasil Belajar

Pengolahan hasil penilaian tes tertulis

Hasil penilaian tes tertulis adalah skor yang diperoleh peserta didik dari hasil tes yang diikuti peserta didik, apakah itu pilihan ganda, benar salah, menjodohkan, jawaban singkat, uraian. 

Tes Bentuk Pilihan Ganda

Cara menskor tes bentuk pilihan ganda ada dua, yaitu: pertama tanpa menerapkan sistem denda, dan yang kedua adalah dengan menerapkan sistem denda.

Tanpa menerapkan sistem denda

S = R

Diketahui : 

S : Skor yang sedang dicari 

R : Right (jumlah jawaban betul)

Penskoran dengan menerapkan denda

S=R-  W/(O-1)

S : Skor yang sedang dicari 

R : Right (jumlah jawaban betul) 

W : Wrong (jumlah jawaban salah) 

O : Banyaknya option (pilihan) yang terdapat pada soal 

1 : Bilangan konstan (tetap)

Tes bentuk jawaban singkat dan menjodohkan

Pemberian skor untuk kedua bentuk tes ini umumnya tidak memperhitungkan sangsi berupa denda, rumus yang digunakan adalah : 

S = R

Tes obyektif bentuk matching, fill in, dan completion, perhitungan skor akhirnya pada umumnya tidak memperhitungkan sistem denda

Tes Uraian

Pada umumnya tes uraian menggunakan sistem bobot ( weight) yang diberikan untuk setiap butir soal, atas dasar taraf kesukarannya, atau atas dasar banyak sedikitnya unsur yang harus terdapat dalam jawaban.

Pengolahan Hasil Penilaian Unjuk Kerja

Berdasarkan hasil penilaian unjuk kerja siswa maka diperoleh data atau skor yang menunjukan kemampuan siswa dalam mencapai kompetensi yang menunutut peserta didik melakukan tugas tertentu.

Rumus yang digunakan:

Nilai=  (Skor Sesungguhnya)/(Skor Maksimum ideal)  x 100

Keterangan : 

Skor sesuangguhnya : Skor yang dicapai siswa 

Skor Maksimum Ideal : Skor yang dicapai jika dijawab dengan benar 

100 : Skala yang dipakai


No comments:

Post a Comment