Softver za detekciju lažnih znanstvenih radova

STM Integrity Hub Međunarodnog udruženja znanstvenih, tehničkih i medicinskih izdavača razvija alate koji će omogućiti provjeru vjerodostojnosti svakog rada

Mladen Smrekar utorak, 6. prosinca 2022. u 16:21
Izdavači kažu da čak polovica svih etički spornih slučajeva sa znanstvenim radovima otpada  na
Izdavači kažu da čak polovica svih etički spornih slučajeva sa znanstvenim radovima otpada na "tvornice papira" i njihove lažne znanstvene radove storyset

Izdavači testiraju prototipove automatskih sustava za označavanje predanih rukopisa koji nose obilježja "tvornica papira", (paper mills) profitno orijentiranih, neslužbenih i potencijalno ilegalnih organizacija koje proizvode i prodaju lažne istraživačke radove. Ovi alati su rezultat su jednogodišnje suradnje između 24 izdavača i znanstvenih analitičara. Zajedno, oni će pokušati iskorijeniti pošast lažnih znanstvenih članaka.

Borba protiv lažne znanosti

Posljednjih su godina časopisi povukli stotine radova zbog straha da sadrže izmišljene podatke i lažne slike. No u sad se pojavilo nekoliko privatnih tvrtki koje izdavačima nude softver koji može uočiti potencijalno manipulirane slike ili karakteristične detalje koji sugeriraju da je navodni znanstveni rad izašao iz neke "tvornice papira".

Neobične fraze ukazuju na upotrebu softvera za automatizirani prijevod
Neobične fraze ukazuju na upotrebu softvera za automatizirani prijevod

Od 2020. Međunarodno udruženje znanstvenih, tehničkih i medicinskih izdavača (STM) sa sjedištem u Haagu surađuje s izdavačkima na razvoju zajedničkih standarda za softver koji može detektirati potencijalne probleme sa slikama. Prije godinu dana udruženje je objavilo da razvija STM Integrity Hub koji će urednicima pružiti alate koji će omogućiti provjeru vjerodostojnosti rada.

U inicijativu su uključeni izdavači znanstvenih radova kao što su BMJ, Elsevier, Frontiers, IOP Publishing, JAMA Network, Sage Publishing, Taylor & Francis, Wiley i Springer Nature, a trenutno se testiraju prototipovi za dva od tri predložena alata. 

Vrh ledenog brijega

Izdavači kažu da čak polovica svih etički spornih slučajeva sa znanstvenim radovima otpada upravo na "tvornice papira". Problem nije samo količina nego i šarolikost lažnih znanstvenih radova koji dolaze iz različitih izvora. Pretpostavlja se da su otkriveni slučajevi tek vrh ledenog brijega. Najgore je to što jedan lažni rad, objavljen kod jednog izdavača, može utjecati na desetke, stotine ili čak tisuće članaka kod više izdavača.

Softver za provjeru slika uspoređuje dijelove slika (crveni pravokutnici, lijevo) i označava identične dijelove čak i na rastegnutim ili rotiranim slikama. Plave linije pokazuju da UI vidi stotine identičnih značajki
Softver za provjeru slika uspoređuje dijelove slika (crveni pravokutnici, lijevo) i označava identične dijelove čak i na rastegnutim ili rotiranim slikama. Plave linije pokazuju da UI vidi stotine identičnih značajki

Prvi alat STM Integrity Huba skenira rad u potrazi za više od 70 signala koji bi mogli ukazivati na to da je rukopis generirala "tvornica papira". Tvorci alata ne otkrivaju o kojim je signalima riječ no pretpostavlja se da je riječ o formularnim naslovima i izgledu članka, trakastim dijagramima s identičnim profilima koji navodno predstavljaju podatke iz različitih eksperimenata, zatim sumnjive adrese e-pošte autora i neobične fraze koje bi mogli ukazivati na upotrebu softvera za automatizirani prijevod.

Jedan rad na više adresa

Drugi alat upozorava urednike da je isti rad istovremeno poslan u nekoliko časopisa; ova taktika koristi se kako bi se povećale šanse za objavu rada, a u znanstvenom svijetu to se inače smatra neprikladnim. Pronalaženje takvih radova bit će, kažu izdavači, velik i važan korak u borbi protiv tvornica radova. Dosad, naime, časopisi nisu mogli znati je li rad koji su primili na razmatranje bio na recenziji i na nekoj drugoj adresi.

Jedan lažni rad može utjecati na desetke, stotine ili čak tisuće članaka kod više izdavača 📷 Freepik
Jedan lažni rad može utjecati na desetke, stotine ili čak tisuće članaka kod više izdavača Freepik

Sigurno dijeljenje podataka između izdavača pravno je problematično zbog obrade podataka i zakona protiv tržišnog natjecanja. Rukopisi koje istraživači predaju časopisima su povjerljivi i ne mogu se lako dijeliti između časopisa i izdavača. No Hub uvodi niz tehničkih mjera kako bi se od izdavača prikupili samo minimalni isječci informacija koje će biti šifrirane radi sigurnosti.

Manipuliranje slikama

Posljednji tehnički element bit će softver koji može uočiti manipulirane slike u rukopisima. Sve te aplikacije zamišljene su da podrže, a nipošto zamijene žive urednike i recenzente. Ljudi će i dalje morati reagirati na upozorenja, ali važan je određeni stupanj automatizacije, jer izdavači su često preopterećeni procjenom ogromnih količina radova.

Kako bi izdavačima pružio smjernice o tome kako se nositi s problemima,  STM surađuje i s Odborom za etiku objavljivanja, savjetodavnim tijelom sa sjedištem u britanskom Eastleighu, s kojim organizira radionice na kojima izdavači mogu razmjenjivati informacije i učiti jedni od drugih.