Višestruki UI modeli bolje zaključuju i daju točnije odgovore
Umjesto da usamljeni model umjetne inteligencije ponavlja sadržaj s interneta, metoda MIT-ovih inženjera aktivno potiče UI modele na izradu preciznijih i sveobuhvatnijih rješenja
"Dvije su glave bolje od jedne", kaže poslovica. Ova drevna mudrost izgleda vrijedi i kad je u pitanju umjetne inteligencije: višestruki jezični modeli koji rade u harmoniji bolji su od jednog. To su dokazali i inženjeri MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju (CSAIL) koji su iskoristili višestruke UI sustave za međusobne rasprave i prepirke kako bi došli do najboljeg mogućeg odgovora na postavljeno pitanje.
Aktivna procjena odgovora
Srž problema s velikim jezičnim modelima (LLM) leži u nedosljednosti njihovih generiranih odgovora, što dovodi do potencijalnih netočnosti i pogrešnog zaključivanja. Novi pristup svakom agentu omogućuje aktivnu procjenu odgovora drugog agenta i koristi ovu kolektivnu povratnu informaciju za usavršavanje vlastitog odgovora.
Tehnički, proces se sastoji od više krugova generiranja odgovora i kritike. Svaki jezični model generira odgovor na zadano pitanje, a zatim uključuje povratne informacije od svih ostalih agenata za ažuriranje vlastitog odgovora. Ovaj iterativni ciklus kulminira konačnim rezultatom većine glasova svih rješenja modela i odražava dinamiku grupne rasprave u kojoj pojedinci pridonose postizanju jedinstvenog i dobro obrazloženog zaključka.
Značajna poboljšanja
"Ovaj pristup se ne oslanjamo na samo jedan model umjetne inteligencije. Umjesto toga, naš proces uključuje mnoštvo UI modela, od kojih svaki donosi jedinstvene uvide za rješavanje problema. Iako se njihovi početni odgovori mogu činiti skraćenim ili mogu sadržavati pogreške, ovi modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili njihovi kolege", objašnjavaju istraživači u radu koji objavljuje arXiv.
Istraživanje se bavilo rješavanjem matematičkih problema, poput zadataka iz osnovne i srednje škole. Proces debate s više agenata doveo je do značajnog poboljšanja točnosti konačnih rezultata, a jezični modeli pokazali su poboljšane sposobnosti za generiranje točnih aritmetičkih procjena.
Stop halucinacijama
Ova metoda mogla bi pomoći i u rješavanju problema "halucinacija" koje često muče jezične modele. Dizajniranjem okruženja u kojem agenti međusobno propitkuju odgovore izbjegava se izbacivanje nasumičnih informacija i daje prednost činjeničnoj točnosti. Uspostavom decentraliziranog sustava u kojem više agenata komunicira i raspravlja, kažu istraživači, ovaj pristup mogao bi se primijeniti i za integraciju različitih specijaliziranih modela koji se služe govorom, videom ili tekstom.
Dakako, postojeći jezični modeli mogli bi imati problema s obradom vrlo dugih informacija, a sposobnosti kritike možda neće biti toliko rafinirane. Uz to, format rasprave s više agenata, inspiriran ljudskom interakcijom, tek treba uključiti složenije oblike rasprave koji pridonose inteligentnom kolektivnom donošenju odluka, kažu istraživači najavljujući daljnja poboljšanja.