Višestruki UI modeli bolje zaključuju i daju točnije odgovore

Umjesto da usamljeni model umjetne inteligencije ponavlja sadržaj s interneta, metoda MIT-ovih inženjera aktivno potiče UI modele na izradu preciznijih i sveobuhvatnijih rješenja

Mladen Smrekar petak, 22. rujna 2023. u 06:00
Suradnja između agenata pomaže zaključivanju i činjeničnoj točnosti u velikim jezičnim modelima 📷 vecstock
Suradnja između agenata pomaže zaključivanju i činjeničnoj točnosti u velikim jezičnim modelima vecstock

"Dvije su glave bolje od jedne", kaže poslovica. Ova drevna mudrost izgleda vrijedi i kad je u pitanju umjetne inteligencije: višestruki jezični modeli koji rade u harmoniji bolji su od jednog. To su dokazali i inženjeri MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju (CSAIL) koji su iskoristili višestruke UI sustave za međusobne rasprave i prepirke kako bi došli do najboljeg mogućeg odgovora na postavljeno pitanje. 

Aktivna procjena odgovora

Srž problema s velikim jezičnim modelima (LLM) leži u nedosljednosti njihovih generiranih odgovora, što dovodi do potencijalnih netočnosti i pogrešnog zaključivanja. Novi pristup svakom agentu omogućuje aktivnu procjenu odgovora drugog agenta i koristi ovu kolektivnu povratnu informaciju za usavršavanje vlastitog odgovora. 

Modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili drugi modeli 📷 MIT CSAIL
Modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili drugi modeli MIT CSAIL

Tehnički, proces se sastoji od više krugova generiranja odgovora i kritike. Svaki jezični model generira odgovor na zadano pitanje, a zatim uključuje povratne informacije od svih ostalih agenata za ažuriranje vlastitog odgovora. Ovaj iterativni ciklus kulminira konačnim rezultatom većine glasova svih rješenja modela i odražava dinamiku grupne rasprave u kojoj pojedinci pridonose postizanju jedinstvenog i dobro obrazloženog zaključka.

Značajna poboljšanja

"Ovaj pristup se ne oslanjamo na samo jedan model umjetne inteligencije. Umjesto toga, naš proces uključuje mnoštvo UI modela, od kojih svaki donosi jedinstvene uvide za rješavanje problema. Iako se njihovi početni odgovori mogu činiti skraćenim ili mogu sadržavati pogreške, ovi modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili njihovi kolege", objašnjavaju istraživači u radu koji objavljuje arXiv.  

Debata s više agenata poboljšava rasuđivanje i činjeničnu točnost 📷 MIT CSAIL
Debata s više agenata poboljšava rasuđivanje i činjeničnu točnost MIT CSAIL

Istraživanje se bavilo rješavanjem matematičkih problema, poput zadataka iz osnovne i srednje škole. Proces debate s više agenata doveo je do značajnog poboljšanja točnosti konačnih rezultata, a jezični modeli pokazali su poboljšane sposobnosti za generiranje točnih aritmetičkih procjena.

Stop halucinacijama

Ova metoda mogla bi pomoći i u rješavanju problema "halucinacija" koje često muče jezične modele. Dizajniranjem okruženja u kojem agenti međusobno propitkuju odgovore izbjegava se izbacivanje nasumičnih informacija i daje prednost činjeničnoj točnosti. Uspostavom decentraliziranog sustava u kojem više agenata komunicira i raspravlja, kažu istraživači, ovaj pristup mogao bi se primijeniti i za integraciju različitih specijaliziranih modela koji se služe govorom, videom ili tekstom. 

Kombinacija ChatGPT-a i Barda može se koristiti zajedno za rješavanje teškog matematičkog problema iz osnovne škole 📷 MIT CSAIL
Kombinacija ChatGPT-a i Barda može se koristiti zajedno za rješavanje teškog matematičkog problema iz osnovne škole MIT CSAIL

Dakako, postojeći jezični modeli mogli bi imati problema s obradom vrlo dugih informacija, a sposobnosti kritike možda neće biti toliko rafinirane. Uz to, format rasprave s više agenata, inspiriran ljudskom interakcijom, tek treba uključiti složenije oblike rasprave koji pridonose inteligentnom kolektivnom donošenju odluka, kažu istraživači najavljujući daljnja poboljšanja.