AI modeli OpenAI-ja i Googlea rješavaju matematičke probleme na razini zlatne medalje

Međunarodna matematička olimpijada poslužila je tvorcima naprednih modela umjetne inteligencije da testiraju svoje matematičko rezoniranje, a prvi rezultati govore u prilog velikom napretku

Sandro Vrbanus utorak, 22. srpnja 2025. u 14:28

U Australiji je od 10. do 20. srpnja održana 66. Međunarodna matematička olimpijada (IMO), na kojoj su svoje znanje u matematici tradicionalno odmjerili najbolji svjetski učenici, mlađi od 20 godina. No, zadatke koje su rješavali najbolji od najboljih mladih ljudskih matematičara bili su dostupni i AI kompanijama, koje su na njima testirale svoje modele i njihove mogućnosti matematičkog rezoniranja.

OpenAI prerano objavio rezultate

Iako je službeno bilo dogovoreno da se rezultati umjetne inteligencije neće objavljivati do 28. srpnja, neki nisu mogli izdržati do tada, pa su se već pohvalili svojim modelima i rezultatima. Prvi je u javnost s informacijom o "zlatnoj medalji" izišao OpenAI, tvrdeći da je njihov najnoviji eksperimentalni model s mogućnošću rezoniranja (rana verzija modela GPT-5) ostvario rezultate na razini zlatne medalje ovogodišnje Međunarodne matematičke olimpijade.

To je potaknulo i Googleov DeepMind da se pohvali sličnim postignućem – u njihovom slučaju i službeno potvrđenim od strane organizatora IMO-a: model Gemini s dodatkom Deep Think riješio je pet od šest teških matematičkih problema, koji su uključivali algebru, kombinatoriku, geometriju i teoriju brojeva.

AI modeli dobili su jednake uvjete kao i ljudski natjecatelji. Predstavljeni su im problemi i omogućeno im je vrijeme od 4,5 sata za njihovo rješavanje, pri čemu nisu imali dostupnu vanjsku pomoć niti pristup Internetu. U oba slučaja rezultati modela bili su rigorozni matematički dokazi dugi nekoliko stranica. I Open AI i Google objavili su identičan službeni rezultat od 35 bodova (od ukupno 42), odnosno prijavili riješenih pet od šest zadataka, što je na razini zlatne medalje.

Predstavnici Olimpijade nisu presretni s ovakvim razvojem događaja, pogotovo s činjenicom što je OpenAI "izletio" s rezultatima prije isteka službenog embarga. Poručili su i da OpenAI nije surađivao s organizatorima IMO-a na testiranju modela te da njihovi rezultati, za razliku od Googleovih, nisu službeno verificirani.