ChatGPT odjednom počeo pričati o gremlinima i goblinima – OpenAI razjašnjava misterij

Istraživanje je otkrilo kako su specifični signali nagrađivanja tijekom treninga "Nerdy" osobnosti uzrokovali neočekivano širenje metafora o goblinima kroz više generacija njihovih GPT modela

Sandro Vrbanus četvrtak, 30. travnja 2026. u 11:00

Stručnjaci tvrtke OpenAI uočili su neobičan obrazac ponašanja koji je započeo s modelom GPT-5.1, a koji se proteklih dana viralno počeo širiti društvenim mrežama. Naime, njihov jezični model počeo je u svojim odgovorima i metaforama sve češće spominjati gobline, gremline i slična mitska bića. Iako se u početku radilo o suptilnim promjenama koje nisu narušavale metriku sustava, s vremenom je postalo jasno da se učestalost korištenja ovih pojmova značajno povećava kroz generacije modela – a samim korisnicima to je postalo zabavno i zanimljivo za istaknuti.

Uzrok u "štreberskoj" osobnosti

Prvi jasni znakovi anomalije zabilježeni su u studenom, kada su korisnici primijetili pretjeranu prisnost jezičnog modela u komunikaciji. Sigurnosni istraživači OpenAI-ja proveli su analizu koja je pokazala da je upotreba riječi "goblin" u ChatGPT-u porasla za 175% nakon lansiranja verzije GPT-5.1, dok je spominjanje "gremlina" poraslo za 52% – a nije baš da prosječni korisnik ima često potrebu ispitivati ChatGPT o goblinima i gremlinima. Ono što je započelo kao izolirana jezična zanimljivost, ubrzo se tako pretvorilo u sustavni fenomen koji je zahtijevao internu istragu.

Ona je, pak, pokazala da korijen problema leži u funkciji prilagodbe osobnosti, točnije u postavkama za "Nerdy" (štreberski) stil komunikacije. Taj je profil bio programiran tako da koristi razigran jezik i naglašava neobičnost svijeta, što je AI sustav pogrešno interpretirao. Analiza je potvrdila da je "Nerdy" osobnost bila odgovorna za čak 66,7% svih spominjanja goblina, iako je sudjelovala u tek 2,5% ukupnog prometa ChatGPT-a.

Problem je dodatno produbljen zbog načina na koji funkcioniraju sustavi dok uče na temelju povratnih informacija korisnika. Algoritmi su visoko nagrađivali upotrebu kreativnih metafora u "Nerdy" modu, što je uključivalo i spominjanje mitskih stvorenja. Ta se preferencija potom, putem povratne veze, prenijela i na ostale načine rada modela, čak i kada "Nerdy" postavka nije bila aktivna. Osim goblina i gremlina, u bazi podataka pronađeni su i učestali spomeni rakuna, trolova i ogrova.

Goblini su savladani

OpenAI je stoga u ožujku, nakon lansiranja modela GPT-5.4, odlučio povući "Nerdy" osobnost iz upotrebe kako bi zaustavio daljnje širenje ovog jezičnog obrasca. U procesima treninga uklonjeni su signali koji su nagrađivali spominjanje mitskih stvorenja, a podaci za obuku su filtrirani. Ipak, budući da je razvoj modela GPT-5.5 započeo prije nego što je otkriven točan uzrok, zaposlenici su i u novoj verziji primijetili slične sklonosti – koje su posljednjih dana i sami korisnici počeli primjećivati.

Glavni znanstvenik OpenAI-ja također je imao bliski susret s goblinom
Glavni znanstvenik OpenAI-ja također je imao bliski susret s goblinom

Sve to u konačnici je primoralo OpenAI da u model ubaci posebne instrukcije za ublažavanje takvog izražavanja – zbogom, dakle, gremlinima i ostalima, do sljedeće prilike…

Za OpenAI ovaj slučaj, kako su objavili, predstavlja važnu lekciju o tome kako signali nagrađivanja mogu oblikovati ponašanje modela na nepredviđene načine. Sličan slučaj imali su i nešto ranije, kada su hrvatski korisnici mahom bili pretjerano kritični prema odgovorima koje im je ChatGPT pisao na našem jeziku, pa je on – na temelju mnogih negativnih povratnih informacija u obliku "palca dolje" – jednostavno bio prestao odgovarati na hrvatskom.

Iako su goblini i ostali u ovom slučaju za neke korisnike bili zabavni, ovaj je događaj unutar OpenAI-ja potaknuo razvoj novih alata za reviziju ponašanja umjetne inteligencije. Ti alati sada omogućuju istraživačkim timovima brže prepoznavanje i rješavanje sličnih problema u samom korijenu razvoja sustava – kako bi ih se popravilo prije nego iziđu u javnost.