AlphaGeometry2 rješava geometrijske probleme bolje od matematičara

Druga generacija Googleovog matematičkog AI sustava kombinira jezični model sa simboličkim model za rješavanje složenih geometrijskih problema bolje od pobjednika Međunarodne matematičke olimpijade

Mladen Smrekar srijeda, 26. veljače 2025. u 18:00
AG2 može riješiti 84 % geometrijskih problema s Međunarodne matematičke olimpijade, dok prosječni osvajači zlatne medalje rješavaju 81,8 % zadataka 📷 Freepik
AG2 može riješiti 84 % geometrijskih problema s Međunarodne matematičke olimpijade, dok prosječni osvajači zlatne medalje rješavaju 81,8 % zadataka Freepik

Googleovi istraživači razvili su matematički sustav umjetne inteligencije koji može nadmašiti osvajače zlatnih medalja na međunarodnim natjecanjima iz geometrije. Njihov AlphaGeometry2 (AG2) može riješiti 84 % geometrijskih problema postavljenih na Međunarodnoj matematičkoj olimpijadi (IMO), dok prosječni osvajači zlatne medalje rješavaju 81,8 % zadataka. Sustav koji je projektirao Google DeepMind može se uključiti ne samo u podudaranje uzoraka već i u kreativno rješavanje problema, tvrde znanstvenici u radu objavljenom na arXivu.

Rezultati AlphaGeometry2 za sve IMO geometrijske probleme 📷 Google DeepMind
Rezultati AlphaGeometry2 za sve IMO geometrijske probleme Google DeepMind

Ova vijest dolazi mjesec dana nakon što je Microsoft predstavio rStar-Math, napredni AI matematički sustav za zaključivanje koji koristi male jezične modele (SML) za rješavanje složenih jednadžbi. AG2 se od rStar-Matha razlikuje po tome što se fokusira na rješavanje naprednih problema s hibridnim modelom razmišljanja, dok r-Star koristi manje jezične modele za rješavanje šireg spektra problema.

Povećanje performansi

Google je izvornu verziju AlphaGeometryja objavio u siječnju 2024., a najnovija inačica pokazuje povećanje performansi od 30 %. Poboljšanja su usmjerena su na ovladavanje geometrijom koja zahtijeva kombinaciju vizualnog razmišljanja i logike za rješavanje složenih problema. 

Sustav, predstavljen na na arXivu, može se uključiti u kreativno rješavanje problema 📷 Google DeepMind
Sustav, predstavljen na na arXivu, može se uključiti u kreativno rješavanje problema Google DeepMind

Dakako, AG2 pokazuje i neke nedostatke poput duljeg vremena obrade i ne se može nositi s najzahtjevnijim IMO geometrijskim problemima u 3D geometriji, nelinearnim jednadžbama ili problemima s varijabilnim i beskonačnim točkama. Uz to, ne može objasniti kako je došao do rješenja ni na jednom ljudima razumljivom jeziku.

Buduće verzije, najavljuju u DeepMindu, trebale bi proširiti podršku za više geometrijskih koncepata i podijeliti probleme u podskupine, a inženjeri intenzivno rade i na ubrzanju procesa zaključivanja i pouzdanosti sustava.