Neuronske mreže uz obuku ipak mogu "razmišljati" poput ljudi

Riječ je o značajnom iskoraku u kognitivnoj znanosti, području koje istražuje kakva bi vrsta računala najbolje predstavljala ljudski um

Mladen Smrekar subota, 28. listopada 2023. u 19:18
📷 FREEPIK
FREEPIK

Neuronske mreže ne mogu biti održivi modeli uma jer njihova arhitektura ne uspijeva uhvatiti ključnu značajku načina na koji razmišljaju ljudi; taj stav nekako je prevladavao u raspravama koje traju još od osamdesetih godina prošlog stoljeća. No, da neuronske mreže uz obuku ipak mogu steći ovu sposobnost sličnu ljudskoj, pokazali su istraživači Sveučilišta u New Yorku. Studija koju objavljuje časopis Nature značajan je iskorak u kognitivnoj znanosti, području koje istražuje kakva bi vrsta računala najbolje predstavljala ljudski um. 

Sustavna kompozicija

Neuronske mreže donekle oponašaju strukturu ljudskog mozga jer su njihovi čvorovi za obradu informacija povezani jedni s drugima, a njihova obrada podataka teče u hijerarhijskim slojevima. No povijesno se sustavi umjetne inteligencije nisu ponašali kao ljudski um jer im je nedostajala "sustavna kompozicija" (systematic compositionality), sposobnost kombiniranja poznatih koncepata na nove načine.

MLC) metoda neuronskoj mreži omogućava da primijeni različite skupove pravila na novonaučene riječi 📷 NYU
MLC) metoda neuronskoj mreži omogućava da primijeni različite skupove pravila na novonaučene riječi NYU

Na primjer, objašnjavaju istraživači, ako standardna neuronska mreža nauči riječi "skoči" (hop), "dvaput" (twice) i "u krug" (in a circle), potrebno joj je pokazati mnogo primjera kako se te riječi mogu kombinirati u smislene fraze, kao što su "skoči dvaput" i "skači u krug". Ali ako se sustav zatim nahrani novom riječi, kao što je "vrti" (spin), opet bi trebao vidjeti hrpu primjera da nauči kako je koristiti na sličan način. 

Testiranje izmišljenim jezikom

Istraživači su testirali modele umjetne inteligencije i ljudske dobrovoljce koristeći izmišljeni jezik s riječima poput "dax" i "wif". Te su riječi ili odgovarale točkama u boji ili funkciji koja je nekako manipulirala redoslijedom tih točaka u nizu. Tako su nizovi riječi odredili redoslijed pojavljivanja obojenih točkica. S obzirom na besmislenu frazu, umjetna inteligencija i ljudi morali su otkriti temeljna "gramatička pravila" koja određuju koje točke idu uz koje riječi. 

Neuralna mreža obučena MLC-om odgovarala ili nadmašuje ljudske performanse 📷 iuriimotov
Neuralna mreža obučena MLC-om odgovarala ili nadmašuje ljudske performanse iuriimotov

Ljudski sudionici proizveli su točne sekvence točaka u 80% slučajeva, a kad nisu uspjeli radili su dosljedne vrste pogrešaka, kao što je mišljenje da riječ predstavlja jednu točku, a ne funkciju koja miješa cijeli niz točaka. 

Sedam AI modela

Nakon testiranja sedam modela umjetne inteligencije, istraživači su došli su do metode Meta-Learning for Compositionality (MLC) koja neuronskoj mreži omogućava da primjenjuje različite skupove pravila na novonaučene riječi, uz povratnu informaciju o tome je li pravila primijenila ispravno.

Primjer epizode meta učenja i kako se ona obrađuje u različitim MLC varijantama 📷 NYU
Primjer epizode meta učenja i kako se ona obrađuje u različitim MLC varijantama NYU

Neuralna mreža obučena MLC-om odgovarala je ili premašila performanse ljudi na ovim testovima. A kada su istraživači dodali podatke o uobičajenim ljudskim pogreškama, model umjetne inteligencije napravio je iste vrste pogrešaka kao i ljudi. No, na testu s točkama i MLC i ljudi postigli su daleko bolje rezultate od OpenAI modela. MLC je uspješno rješavao i dodatne zadatke koji su uključivali tumačenje pisanih uputa i značenja rečenica.

Dakako, model je još uvijek ograničen u svojoj sposobnosti generalizacije i može raditi na tipovima rečenica na kojima je trenirao, ali ne može generalizirati na nove tipove rečenica. A to će, kažu istraživači, biti sljedeći logičan korak.