Zašto AI ne može razumjeti različite pojmove na ljudski način?

Studija otvara filozofska pitanja o prirodi znanja – možemo li nešto "znati" bez fizičkog iskustva? Za sada, cvijet ostaje jedinstveno ljudsko iskustvo koje AI ne može replicirati

Mladen Smrekar srijeda, 11. lipnja 2025. u 13:07
Čak i najnapredniji AI modeli ne mogu potpuno shvatiti neke pojmove zbog manjka ljudskog osjetilnog iskustva 📷 Freepik
Čak i najnapredniji AI modeli ne mogu potpuno shvatiti neke pojmove zbog manjka ljudskog osjetilnog iskustva Freepik

Iako su alati poput ChatGPT-a potaknuli novi napredak tehnologije, nova studija Sveučilišta Ohio objavljena u časopisu Nature Human Behaviour pokazuje da čak i najnapredniji modeli umjetne inteligencije ne mogu potpuno shvatiti koncepte poput cvijeta – jer im nedostaje ljudsko iskustvo osjetila. Istraživači su naime usporedili ljudsku i AI reprezentaciju 4442 riječi, od "cvijet" i "kopito" do "humor" i "ljuljanje". Rezultati pokazuju da umjetna inteligencija, unatoč obradi golemih količina teksta, ne može replicirati multidimenzionalnu mrežu senzornih i motoričkih iskustava koja oblikuje ljudsko razumijevanje.

Pojmovi "cvijet" i "pravda" kako ih tumače ljudi, ChatGPT, PaLM i Gemini 📷 Qihui Xu, Yingying Peng, Samuel A. Nastase, Martin Chodorow, Minghua Wu & Ping Li
Pojmovi "cvijet" i "pravda" kako ih tumače ljudi, ChatGPT, PaLM i Gemini Qihui Xu, Yingying Peng, Samuel A. Nastase, Martin Chodorow, Minghua Wu & Ping Li

"Veliki jezični model ne može nanjušiti ružu, dotaknuti laticu tratinčice ili prošetati poljem divljeg cvijeća", ističu istraživači. Bez tih iskustava, AI percipira "cvijet" kao apstraktni skup atributa, a ne kao složeni koncept povezan sa sjećanjem, emocijama i tjelesnim doživljajima. AI najbolje replicira ljudske reprezentacije kod ne-senzomotoričkih pojmova (npr. "demokracija"), ali najslabije u motoričkim domenama (npr. "hodati"). Modeli obučeni na tekstu i slikama kao što je na primjer Gemini pokazuju bolje razumijevanje vizualnih aspekata od tekstualnih modela.

Spearmanove korelacije između ocjena koje su generirali ljudi i ocjena koje je generirao LLM za sve analizirane riječi 📷 Qihui Xu, Yingying Peng, Samuel A. Nastase, Martin Chodorow, Minghua Wu & Ping Li
Spearmanove korelacije između ocjena koje su generirali ljudi i ocjena koje je generirao LLM za sve analizirane riječi Qihui Xu, Yingying Peng, Samuel A. Nastase, Martin Chodorow, Minghua Wu & Ping Li

Dok umjetna inteligencija uspješno povezuje "ruže" i "tjesteninu" kao "mirisne objekte", ljudi ih ne smatraju sličnima jer koriste širu mrežu asocijacija. Ovaj jaz u razumijevanju može utjecati na primjenu AI u zdravstvu, obrazovanju ili korisničkoj službi, gdje bi pogrešna interpretacija osjetilno bogatih pojmova dovela do nesporazuma, upozoravaju istraživači i naglašavaju da bi integracija senzornih podataka i robotike mogla poboljšati AI. No, kažu, ljudsko iskustvo daleko je bogatije od onoga što riječi same mogu prenijeti.