AI eksperiment izbacio stvarnu povijest iz 1834.

Hobi programer koji je iz zabave trenirao umjetnu inteligenciju na viktorijanskim tekstovima dobio je neočekivanu lekciju iz povijesti od vlastite kreacije.

Drago Galić utorak, 26. kolovoza 2025. u 12:20

Hobi programer koji gradi AI jezične modele koji govore engleski iz viktorijanskog doba "samo iz zabave" dobio je neočekivani rezultat kada je njegov LLM spomenuo stvarne prosvjede iz Londona 1834. godine – događaje za koje programer nije znao da su se stvarno dogodili, a jezični model ih je naučio iz nepovezanih zbirki tekstova na kojima je treniran.

Posljednje vrijeme spomenuti programer razvija ono što naziva TimeCapsuleLLM, mali AI jezični model koji je u potpunosti obučen na tekstovima iz Londona u razdoblju od 1800. do 1875. godine. Cilj je uhvatiti autentičan viktorijanski izričaj u izlazima AI modela. Kao rezultat toga, AI model na kraju izbacuje tekst je nalik tekstovima pisanim u tom razdoblju.

Projekt se pridružuje polju istraživača koji istražuju ono što neki nazivaju "Povijesni veliki jezični modeli" (Historic Large Language Models - HLLM) ako imaju veliku osnovnu bazu modela. Slični projekti uključuju MonadGPT, koji je obučen na 11.000 tekstova od 1400. do 1700. godine i može raspravljati o temama koristeći okvire znanja iz 17. stoljeća, te XunziALLM, koji generira klasičnu kinesku poeziju slijedeći drevna formalna pravila. Ovi modeli nude istraživačima priliku za interakciju s jezičnim obrascima prošlih razdoblja.

Prema autoru projekta, najintrigantniji nedavni izlaz TimeCapsuleLLM-a proizašao je iz jednostavnog testa. Kada ga je potaknuo s "Bila je godina Gospodnja 1834.", AI model – koji je obučen da nastavi tekst od mjesta gdje korisnik stane – generirao je sljedeće:

Bila je godina Gospodnja 1834. i ulice Londona bile su ispunjene prosvjedima i peticijama. Uzrok, kako su mnogi prepričavali, nije bio vezan za privatne stvari, već, budući da je istog dana preuzet u danu lorda Palmerstona, javnost će primiti kratku izjavu o poteškoćama pod kojima nas je dan zakona dosegao. Duboko je žaljenje što su sadašnji događaji u povijesti svijeta jasni i posljedično će biti poznati. Nije istina da bi upravo oni ljudi koji su se prvi nastanili u Evanđelju u Jeruzalemu trebali imati tako opsežan i tako zanimljiv zapis o blagostanju i prosperitetu.

Znatiželjan o točnosti, autor je provjerio činjenice. "Izlaz je također spomenuo lorda Palmerstona", napisao je, "i nakon pretraživanja na Googleu saznao sam da su njegove akcije rezultirale prosvjedima 1834."

Čini se da se detalji spomenuti u tekstu generiranom umjetnom inteligencijom podudaraju s povijesnim činjenicama: 1834. godina vidjela je značajne građanske nemire u Engleskoj nakon Zakona o izmjenama i dopunama Zakona o siromašnima iz 1834., a Palmerston je služio kao ministar vanjskih poslova Velike Britanije tijekom ovog razdoblja, a kasnije je bio i premijer.

Ponašanje chatbota nije iznenađujuće: istraživači godinama znaju da ovi modeli mogu sintetizirati realistične permutacije informacija naučenih iz tih tekstova.

Ono što ovu epizodu čini posebno zanimljivom jest da se čini da je mali hobi model, obučen od strane jednog čovjeka, iznenadio rekonstruirajući koherentan povijesni trenutak iz raštrkanih referenci u tisućama dokumenata, povezujući određenu godinu sa stvarnim događajima i likovima, a da mu te veze nisu eksplicitno naučene. Model nije obučavan na dokumentaciji o prosvjedima iz 1834. - AI je sastavio te veze iz ambijentalnih obrazaca u 6,25 GB pisanih materijala iz viktorijanskog doba: preko 7.000 knjiga, pravnih dokumenata i novina objavljenih u Londonu između 1800. i 1875. godine. 

Autor primjećuje smanjenje konfabulacija s vremenom kao učinak povećanja količine visokokvalitetnih podataka za obuku, što je dobro poznat efekt posebno kada su modeli vrlo mali.