Google DeepMind velikim jezičnim modelom riješio ljudima nedokučiv matematički problem

Stručnjaci Googleovog odjela za umjetnu inteligenciju primijenili su jezični model na neočekivanom mjestu, u domeni teorijske matematike, pa njime riješili problem koji ljudi dosad nisu uspjeli

Sandro Vrbanus subota, 16. prosinca 2023. u 15:09

Istraživači Googleovog odjela za umjetnu inteligenciju DeepMind objavili su u časopisu Nature rad koji opisuje novi način rješavanja problema iz domene teorijske, odnosno "čiste" matematike. Za to im je, pomalo neočekivano, poslužio sveprisutan alat današnjice – veliki jezični model umjetne inteligencije. U radu stoji da takvi modeli često iskazuju ono što popularno nazivamo halucinacijama, odnosno samouvjereno stvaraju na prvi pogled prilično razumne argumente, koji zapravo nemaju smisla ili su činjenično netočni. Kako bi tome doskočili, izradili su novi dodatak jezičnom modelu, nazvan FunSearch.

Malo programiranja, malo matematike

Riječ je o modelu koji se tako zove jer pretražuje (search) matematičke funkcije (function), a ne jer je to zabavno (fun) – objašnjavaju iz Deepminda. Taj model služi kao dodatak jezičnom modelu i funkcionira kao validator, dio algoritma koji provjerava ono što klasični model proizvodi. Potom odbacuje besmislene rezultate, a one smislene mu vraća natrag, kako bi se model dodatno prilagodio i trenirao. Veliki jezični model u ovom slučaju je Codey, verzija Googleovog modela PaLM 2, posebno prilagođenoga razumijevanju i stvaranju programskog koda.

Do rješenja matematičkog problema došlo je zaobilaznim putem. Stručnjaci su matematički problem postavili u Pythonu, no izostavili su iz koda dio koji pokušava pronaći rješenje. Taj su zadatak prepustili svojem modelu Codey, uz validaciju FunSearcha. Tijekom procesa model je izbacio brojna "rješenja", neka besmislena, neka smislena, a neka zaista inovativna. Samo ova potonja su odobrena, pa je model dobio instrukcije da nastavi u tom smjeru. Veliki jezični model iskorišten je, dakle, kao generator kreativnosti, nakon čega su njegovi rezultati provjeravani, uz zadržavanje samo onih zaista korisnih.

Nakon, kažu, par milijuna prijedloga i nekoliko desetaka ponavljanja postupka tijekom više dana, FunSearch je dao valjano rješenje matematičkog problema, ranije ljudima nepoznato. Problem je prilično opskuran i dolazi iz teorije skupova, a smatran je otvorenim matematičkim problemom oko kojega se stručnjaci nisu složili niti na koji način ga rješavati, a kamoli koje bi zaista bilo rješenje.

Korištenje FunSearcha za ove svrhe moglo bi se pokazati kao ključna prednost. On, naime, stvara programski kod, svojevrsni recept za rješavanje teorijskih problema, umjesto da traži njihovo rješenje. Isti sustav testiran je i na sličnim matematičkim problemima, pa se pokazalo da je u stanju naći načine rješavanja, kojima se do krajnjeg rezultata stiže brže nego postojećim načinima, koje su osmislili matematičari. Model svakako obećava, kažu iz DeepMinda, i mogao bi pokazati kako je najbolje koristiti jezične modele u istraživačkom radu, kao kombinacija matematike i programiranja.