UI modeli znaju ispričati vic, ali mogu li shvatiti šalu?

Velike neuronske mreže mogu generirati tisuće šala u stilu "Zašto je kokoš prešla cestu?", ali zasad ne razumiju zašto su smiješne

Mladen Smrekar subota, 2. rujna 2023. u 14:20
📷 Caitlin Cook / Cornell University
Caitlin Cook / Cornell University

Koristeći stotine unosa iz natječaja Cartoon Caption Contest časopisa New Yorker kao testnu podlogu, istraživači Sveučilišta Cornell su ljudima i umjetnoj inteligenciji postavili zadatke u kojima su trebali spajati šale s crtežima i objasniti zašto je nešto smiješno. U svim zadacima ljudi su pokazali puno bolje rezultate od strojeva, iako je napredak modela kao što je ChatGPT smanjio jaz izvedbe. 

Modeli su morali prepoznati tekst koji odgovara crtežu, procijeniti njegovu "kvalitetu" i objasniti zašto je šala smiješna
Modeli su morali prepoznati tekst koji odgovara crtežu, procijeniti njegovu "kvalitetu" i objasniti zašto je šala smiješna

Impresivni rezultati

Na pitanje "počinju li strojevi shvaćati humor?", kratki bi odgovor glasio: pomalo napreduju, ali još su daleko od cilja, kažu istraživači. Činjenica je da modeli umjetne inteligencije sve bolje rješavaju testove višestrukog izbora, pa čak i kad nadmaše rezultate koje postižu ljudi,  to ne znači da mogu istinski "razumjeti"

Primjeri zadataka korištenih u testu Sveučilišta Cornell
Primjeri zadataka korištenih u testu Sveučilišta Cornell

"Razumijevanje je ipak ljudska karakteristika. No, bez obzira na to razumiju li strojevi ili ne, doista je impresivno koliko dobro obavljaju te zadatke", kaže Jack Hessel, autor knjige “Do Androids Laugh at Electric Sheep? Humor ‘Understanding’ Benchmarks from The New Yorker Caption Contest” koja je osvojila glavnu nagradu na godišnjem sastanku Udruženja za računalnu lingvistiku u Torontu.

Značajan jaz

Istraživači su prikupili više od 700 karikatura koje je kroz 14 godina objavio časopis New Yorker, a testirali su dvije vrste umjetne inteligencije,"iz piksela" (računalni vid) i "iz opisa" (analiza ljudskih sažetaka crtića).

Rezultati predviđanja za zadatke uparivanja i rangiranja kvalitete
Rezultati predviđanja za zadatke uparivanja i rangiranja kvalitete

Studija otkrila značajan jaz između "razumijevanja" na razini umjetne inteligencije i ljudi o tome zašto je neka karikatura smiješna. Najbolja izvedba umjetne inteligencije u testu višestrukog izbora uparivanja crteža i naslova nikad nije premašila 62% točnosti, daleko iza ljudskih 94%. Uz to, ljudska objašnjenja "smiješnosti" pokazala su se dvostruko smislenijima od onih koje su davali modeli UI.

Za svaku od 704 karikature prikupljeno je nekoliko vrsta komentara
Za svaku od 704 karikature prikupljeno je nekoliko vrsta komentara

Iako umjetna inteligencija možda još ne može "razumjeti" humor, napisali su autori u zaključku svog rada, to bi mogao biti alat za suradnju koji bi humoristi mogli koristiti za razmišljanje o idejama.