Umjetna inteligencija koristi opasne "prečace" u vizualnom prepoznavanju objekata

Ni najpametnija umjetna inteligencija ne može se mjeriti s ljudskom vizualnom obradom, otkriva istraživanje kanadskog Sveučilišta York

Mladen Smrekar subota, 12. studenog 2022. u 06:45

Duboke konvolucijske neuronske mreže (DCNN) ne promatraju stvari na isti način kao ljudi, a to bi moglo biti štetno u primjeni umjetne inteligencije u stvarnom svijetu, tvrde istraživači Sveučilišta York iz Toronta u radu koji objavljuje časopis iScience.

Vizualni podražaji

Modeli dubokog učenja jednostavno ne uspijevaju uhvatiti konfigurativnu prirodu percepcije, zaključili su profesor James Elder s katedre za istraživanje ljudskog i računalnog vida i direktor Centra za umjetnu inteligenciju i društvo te Nicholas Baker, profesor psihologije s koledža Loyola.

Frankensteini zbunjuju ljudski vizualni sustav, dok duboke konvolucijske neuronske mreže ostaju neosjetljivi na svojstva konfiguriranih objekata
Frankensteini zbunjuju ljudski vizualni sustav, dok duboke konvolucijske neuronske mreže ostaju neosjetljivi na svojstva konfiguriranih objekata

Elder i Baker istraživali su kako ljudski mozak i DCNN-ovi percipiraju holistička, konfigurirana svojstva objekata i pritom se koristili vizualnim podražajima poznatim kao "Frankensteini". Riječ je o predmetima koji su rastavljeni i ponovno sastavljeni na pogrešan način. Zbog toga ti predmeti imaju ispravna lokalna obilježja, ali na pogrešnim mjestima.

Korištenje prečaca

Istraživači su otkrili da Frankensteini zbunjuju ljudski vizualni sustav, DCNN-ovi ostaju neosjetljivi na svojstva konfiguriranih objekata.

"Naši rezultati objašnjavaju zašto duboki UI modeli ne uspijevaju pod određenim uvjetima i ukazuju na potrebu razmatranja zadataka izvan prepoznavanja objekata kako bismo razumjeli vizualnu obradu u mozgu", kaže Elder. 

Frankensteini su predmeti ili oblici koji su rastavljeni i ponovno sastavljeni na pogrešan način
Frankensteini su predmeti ili oblici koji su rastavljeni i ponovno sastavljeni na pogrešan način

Ovi duboki modeli imaju tendenciju koristiti "prečace" pri rješavanju složenih zadataka prepoznavanja. Ti prečaci najčešće funkcioniraju ali, upozoravaju istraživači, mogu biti opasni u nekim stvarnim primjenama umjetne inteligencije. Takav je, naprimjer, slučaj s prometnim video sigurnosnim sustavima: 

Osposobljavanje mreža

"Objekti u prometu - vozila, bicikli i pješaci - ometaju jedni druge i ulaze u oči vozača kao gomila nepovezanih fragmenata", objašnjava Elder. “Mozak mora ispravno grupirati te fragmente kako bi identificirao točne kategorije i lokacije objekata. Sustav umjetne inteligencije za nadzor sigurnosti u prometu koji je u stanju percipirati samo pojedinačne fragmente neće uspjeti u ovom zadatku."

James Elder i Nicholas Baker
James Elder i Nicholas Baker

Prema istraživačima, izmjene u obuci i arhitekturi usmjerene na to da mreže budu sličnije mozgu nisu dovele do konfiguracijske obrade, a nijedna mreža nije mogla točno procijeniti objekte. Kako bi odgovarale osjetljivosti koju može konfigurirati čovjek, kažu istraživači, mreže bi morale biti osposobljene za rješavanje šireg spektra zadataka.