Statistika otkriva kad studenti koriste ChatGPT na ispitu

Ova strategija koristi Raschov model i fit statistiku i može se lako primijeniti na sve generativne AI chatbotove

Mladen Smrekar petak, 16. kolovoza 2024. u 20:15
Obrazac odgovora koje daje ChatGPT jasno se razlikuje od odgovora koje na pitanja s višestrukim izborom daju  učenici 📷 Freepik
Obrazac odgovora koje daje ChatGPT jasno se razlikuje od odgovora koje na pitanja s višestrukim izborom daju učenici Freepik

Posljednjih mjeseci puno se pričalo o tome kako se uz pomoć generativne umjetne inteligencije može varati prilikom pisanja eseja i raznih narativnih zadataka. istovremeno, korištenje AI alata kao što je ChatGPT za varanje na ispitima s višestrukim izborom uglavnom je prolazilo ispod radara. No, sad su se tog posla prihvatili istraživači Državnog sveučilišta na Floridi (FSU) koji su otkrili kako se upotreba ChatGPT-a za varanje na ispitima s višestrukim izborom iz opće kemije može otkriti uz pomoć specifičnih statističkih podataka. Njihova zapažanja opisana su časopisu Journal of Chemical Education.

Generator odgovora

Istraživači su prikupili odgovore studenata s ispita održanih u posljednjih pet semestara, u ChatGPT unijeli gotovo 1000 pitanja i potom usporedili rezultate. Prosječna ocjena i neobrađena statistika nisu bili dovoljni za prepoznavanje ponašanja sličnog ChatGPT-u jer postoje pitanja na koja je ChatGPT uvijek odgovarao točno ili je uvijek odgovarao netočno pa se ukupni rezultat umjetne inteligencije nije mogao razlikovati od odgovora studenata. 

Prosječna ocjena i neobrađena statistika nisu dovoljni za prepoznavanje odgovora koje daje ChatGPT  📷 Benjamin Sorenson, Kenneth Hanson
Prosječna ocjena i neobrađena statistika nisu dovoljni za prepoznavanje odgovora koje daje ChatGPT Benjamin Sorenson, Kenneth Hanson

"To je stvar kod ChatGPT-a, on može generirati sadržaj, ali ne mora nužno generirati točan sadržaj. To je jednostavno generator odgovora. Pokušava izgledati kao da zna odgovor, a nekome tko ne razumije gradivo to vjerojatno izgleda kao točan odgovor", objašnjavaju istraživači. 

Fiskiranje parametara

Korištenjem prilagođenog statističkog modela istraživači su fiksirali parametre i ponovno prilagodili rezultate, otkrivši da se obrazac odgovora ChatGPT-a jasno razlikuje od onog učenika. Naime, odlični studenti na ispitima često točno odgovaraju na teška i laka pitanja, dok prosječni studenti obično točno odgovore na neka teška i većinu lakih pitanja. Loši studenti obično točno odgovaraju samo na laka pitanja. 

Kenneth Hanson i Ben Sorenson i sami su bili iznenađeni kad su otkrili kako se lako obrasci umjetne inteligencije mogu identificirati uz pomoć statistike 📷 FSU
Kenneth Hanson i Ben Sorenson i sami su bili iznenađeni kad su otkrili kako se lako obrasci umjetne inteligencije mogu identificirati uz pomoć statistike FSU

Ali pri ponovljenim pokušajima ChatGPT-a da završi test, AI alat ponekad je na svako lakše pitanje odgovorio netočno, a na svako teže pitanje točno. Istraživači su upotrijebili ove razlike u ponašanju kako bi otkrili korištenje ChatGPT-a s gotovo 100-postotnom točnošću.

Ova strategija koristi Raschov model i fit statistiku i može se lako primijeniti na sve generativne AI chatbotove. Vjerojatnost točnog odgovora pritom ovisi o težini pitanja i sposobnosti učenika da odgovori na njega. U ovom slučaju, sposobnost učenika odnosi se na to koliko znanja ima i koliko je potrebnih komponenti potrebno da bi se odgovorilo na postavljeno pitanje, objašnjavaju istraživači koji su i samo ostali iznenađeni lakoćom kojom se obrasci umjetne inteligencije mogu identificirati uz pomoć statistike.