Umjetna inteligencija

Može li umjetna inteligencija razumjeti govor životinja?

📷 Doc/AI
Igor Berecki četvrtak, 17. srpnja 2025. u 06:30

Hoćemo li uskoro moći dešifrirati mijauk mačke, kliktanje dupina, pjesmu kitova ulješura ili prepoznati stres u cijukanju štakora? Zahvaljujući algoritmima strojnog učenja – možda i hoćemo

Kada je nakon Prvog svjetskog rata britanski inženjer i ratni veteran Hugh Lofting izdao svoju prvu knjigu iz serijala dječjih pripovijedaka o doktoru Dolittleu, liječniku koji posjeduje dar komunikacije na životinjskim jezicima, nije ni mogao slutiti da će stotinjak godina kasnije računalni sustavi umjetne inteligencije vrlo ozbiljno pokušavati reproducirati taj Dolittleov talent.

Naizgled, lik doktora Dolittlea i moderni sustavi umjetne inteligencije nemaju mnogo toga zajedničkog: jedan je fiktivni dječji književni junak iz doba viktorijanske Britanije koji razumije i govori jezik životinja, a drugi su beživotni nizovi matematičkih modela koji, kada se nahrane dovoljnim količinama podataka, mogu naučiti prepoznavati obrasce. No, u 21. stoljeću smo se već pomalo i navikli da fikcija i suvremene tehnologije itekako mogu i znaju sjesti za isti stol. Pitanje koje se nameće jest: može li AI doista naučiti „govoriti“ sa životinjama?

A to pitanje i nije toliko naivno koliko se isprva čini. Tehnologija nam već omogućava da glasom dajemo naredbe pametnim uređajima i virtualnim asistentima. Ako već možemo „pričati“ s našim hladnjakom, možda bismo jednog dana mogli „razgovarati“ i s kućnim kanarincem. Ili barem razumjeti zašto naš pas naizgled ničim izazvan laje u gluho doba noći… i što nam zapravo pokušava reći kad gleda ravno u nas i maše repom.

Imaju li životinje jezik?

Prvi izazov u prevođenju životinjskog govora nije tehnološki, već semantički. Naime, temeljno je pitanje: imaju li životinje uopće jezik - u ljudskom smislu te riječi? Ako se pod jezikom podrazumijeva simbolički sustav izraza i gramatičkih pravila, onda većina stručnjaka odgovara s – ne.

No to ne znači da životinje ne komuniciraju. Pas koji maše repom ne govori, ali itekako prenosi poruku. Pčela koja izvodi "ples" na rubu košnice svojim zatkom iscrtava drugim pčelama preciznu informaciju o smjeru i udaljenosti izvora nektara. Dupini i kitovi koriste zvučne signale koji se razlikuju među skupinama, a pojedini znanstvenici vjeruju da oni nose značenje, pa možda čak i osobna imena.

U tom kontekstu, AI se ne koristi da bi životinjama nadjenuo gramatiku i rečeničnu strukturu ljudskog jezika, već da bi u golemim količinama prikupljenih podataka pronašao obrasce koji bi mogli upućivati na sustav sličan jeziku. Drugim riječima, iz „životinjskih jezika“ se ne bi prevodile riječi i rečenice u onom smislu kako ih podrazumijevamo u ljudskoj komunikaciji, nego neverbalni obrasci i uzorci koji u sebi nose komunikacijsku poruku na razini životinjske vrste koja ju koristi.

📷 Doc/AI
Doc/AI

AI kao prevoditelj – ali čega?

Strojno učenje već se koristi u mnogim granama znanosti kako bi prepoznalo obrasce u podacima bez da ih se prethodno eksplicitno programira. U kontekstu životinjske komunikacije, AI se uvježbava i uči na snimkama zvukova, gesti, pa čak i elektromagnetskih valova koje ispuštaju neke životinje. Cilj nije doslovan prijevod, već mapiranje - povezivanje određenog signala uz određeni kontekst – tko, kada i zašto proizvodi određeni zvuk.

U jednoj studiji, AI je naučio razlikovati koji je štakor pod stresom prema vrsti ultrazvučnih cijuka koje ispušta. To glasanje, iako nečujno ljudskom uhu, sadrži u sebi cijeli spektar emocionalnih informacija, a algoritmi su u stanju precizno kategorizirati razlike koje bi inače promakle čak i iskusnim istraživačima. Takve metode danas se koriste ne samo u laboratorijskim uvjetima, već i u promatranju životinja u prirodi, gdje je kontekstualna varijabilnost još veća.

U drugoj studiji, znanstvenici su uspjeli naučiti dupine da zasebnim zviždukom identificiraju točno određeni objekt – primjerice ribu, čamac, loptu određene boje… – a AI je kasnije, služeći se velikim brojem snimki i sofisticiranim klasifikacijskim modelima, uspio prepoznati taj zvižduk kad se ponovno pojavio u divljini, izvan laboratorijskih uvjeta. To sugerira da određeni zvukovi nisu slučajni, nego mogu imati stabilno simboličko značenje unutar komunikacijskog sustava pojedine životinjske vrste.

📷 Doc/AI
Doc/AI

Još zanimljivije, tim iz Earth Species Projecta tvrdi da su riješili poznati „cocktail party problem“ – kako razdvojiti više istodobnih glasova u gomili. Njihov pristup kombinira akustičnu analizu s prostornim rasporedom izvora zvuka, što omogućava razdvajanje pojedinačnih „glasova“ čak i u izrazito bučnom okruženju, poput dupinovih jata ili kolonija morskih ptica. To otvara vrata novim razinama analize komunikacije u kolonijama, jatima i krdima, gdje pojedinačne poruke inače tonu u kolektivni žamor, a svaki pokušaj dešifriranja do sada je bio poput pokušaja prepoznavanja individualnih glasova osoba u publici na rock koncertu.

Što je dosad postignuto?

Tehnologija već daje prve plodove, i to ne samo u laboratorijima, već i na terenu. Algoritmi umjetne inteligencije sada su u stanju prepoznati emocije u glasu svinja, kokoši i štakora – životinja koje često smatramo komunikacijski jednostavnima, a zapravo se pokazuju iznenađujuće vokalno izražajnima. Na temelju boje glasa, intonacije i učestalosti zvukova, AI može utvrditi je li neka kokoš uznemirena, je li štakor razigran, ili je li svinja pod stresom zbog promjene okoline. Uzgajivači sve češće koriste takve alate za procjenu dobrobiti životinja na farmama, čime se ujedno smanjuju i ekonomski gubici.

Neki sofisticirani softverski sustavi već identificiraju pojedinačne životinje unutar grupe samo prema njihovim glasovima, gotovo poput prepoznavanja otiska prsta. Takva bi mogućnost mogla revolucionirati ne samo etologiju nego i upravljanje divljim populacijama, jer omogućuje praćenje jedinki bez potrebe za invazivnim označavanjem ili čipiranjem. Uz to, algoritmi mogu otkriti i suptilne promjene u tonu i dinamici koje upućuju na stres, agresiju, zadovoljstvo ili čak dosadu – emocije koje smo dosad uglavnom pripisivali ljudima.

📷 Doc/AI
Doc/AI

AI također omogućuje da se analizira dugotrajna snimka i iz nje izvuče korisne informacije – primjerice, koji je morski sisavac prošao ispod podvodnog mikrofona, je li se zadržao i što je „rekao“ tijekom prolaska. U pasivnoj bioakustici, ovi alati služe kao svojevrsni nevidljivi čuvari prirode, registrirajući prisutnost i ponašanje životinja koje rijetko viđamo. Snimke iz prašuma, tundri, koraljnih grebena i dubokih oceana sada se digitalno „preslušavaju“ bez potrebe za ljudskim uhom – brže, točnije i u znatno većim količinama nego ikad prije.

Znanstvenici se nadaju da bi u skoroj budućnosti AI mogao ne samo prepoznati kad određeni signal znači opasnost, poziv na parenje ili identifikaciju člana grupe, već i otkriti nove oblike komunikacije koje dosad nismo znali prepoznati. To bi moglo značiti velik korak naprijed u razumijevanju društvenog života mnogih vrsta – možda čak i potaknuti redefiniranje granica onoga što nazivamo „inteligentnim ponašanjem“ u životinjskom svijetu.

Kad kitovi progovore

Posebno zanimljiv slučaj su kitovi ulješure – najveći zubati sisavci na svijetu, poznati po svojem dubokem zaronu i impozantnoj lubanji koja rezonira kao prirodna zvučna komora. Njihove „pjesme“ se sastoje od složenih nizova klikova, poznatih pod nazivom codas, koji imaju prepoznatljiv ritam, strukturu i čak dijalekatske razlike među različitim populacijama. Ti klikovi nisu samo biološki sonar za eholokaciju – u mnogim slučajevima izgledaju kao strukturirana komunikacija, s obrascima koji se prenose unutar obiteljskih skupina i regionalnih zajednica. Upravo ti elementi – ritam, ponavljanje, redoslijed i geografske varijacije – sugeriraju da se ne radi o slučajnom zvukovlju, već o nekoj vrsti vokalnog identiteta i međusobnog prepoznavanja.

📷 Doc/AI
Doc/AI

Project CETI (Cetacean Translation Initiative), interdisciplinarna inicijativa koja okuplja biologe, računalne lingviste i inženjere strojnog učenja, koristi stotine tisuća sati snimljenih zvukova ulješura, prikupljenih pomoću podvodnih mikrofona postavljenih diljem Kariba. Cilj im je dešifrirati strukturu i potencijalno značenje tih klikova pomoću naprednih AI modela koji se temelje na sličnim pristupima kao i algoritmi za prepoznavanje jezika kod ljudi. Ako se otkrije da ulješure koriste konzistentne obrasce za specifične kontekste – pozdrav, upozorenje, koordinacija – tada bi to bio najbliži dokumentirani oblik jezika u životinjskom svijetu.

Ako znanstvenici iz CETI-ja uspiju, to ipak ne bi značilo da ćemo kitovima uskoro pisati e-mailove ili s njima voditi razgovore o filozofiji egzistencije. No moglo bi značiti da ćemo po prvi put u povijesti biti sposobni razumjeti što ulješure misle o okolišu kroz koji migriraju, o svojim potomcima, o prisutnosti grabežljivaca – pa čak i o našem vlastitom uplivu u njihovo stanište. U konačnici, takvo razumijevanje ne bi samo obogatilo znanost, nego i potaknulo drugačiji, suosjećajniji odnos prema vrstama s kojima dijelimo planet.

Zašto to radimo?

Osim što zadovoljava znanstvenu znatiželju i tehno-optimističnu fascinaciju, razumijevanje životinjske komunikacije moglo bi imati vrlo praktične koristi koje nadilaze granice zoologije, ekologije ili računalne znanosti. Riječ je o potencijalno revolucionarnom pomaku u našem svakodnevnom odnosu prema životinjama, prirodi i – u konačnici – nama samima. Potvrdu o globalnom porastu interesa za to daju i izvešća svjetskih agencija koje prate AI-tehnologija vezanih uz prepoznavanje verbalnih i neverbalnih komunikacijskih signala, o čemu je Bug već pisao, nedavno prenoseći Reutersovo izvješće.

Za kućne ljubimce i domaće životinje razumijevanje njihovog "jezika" znači bolju brigu, manje stresa i suptilnije shvaćanje njihovih potreba. Zamislimo uređaj koji vlasniku psa može signalizirati da je njegov ljubimac tjeskoban ili zbunjen, ili aplikaciju koja može detektirati znakove boli kod mačke prije nego ih vlasnik uopće primijeti. U farmi budućnosti, stoka bi mogla „reći“ kada joj nešto smeta, kada osjeća glad, žeđ ili nelagodu – a sve to bez riječi, ali uz pomoć umjetne inteligencije koja razumije jezik potreba.

📷 Doc/AI
Doc/AI

U zaštiti okoliša, takva tehnologija omogućila bi bolje praćenje bioraznolikosti i bržu detekciju promjena u ponašanju životinjskih vrsta – promjena koje često signaliziraju poremećaje u ekosustavu. AI može djelovati kao akustični nadzornik prirode, neprekidno slušajući i interpretirajući „šapat šume“, „žamor oceana“ ili „zbor noćnih kukaca“.

U znanosti o ponašanju, algoritmi koji uče iz životinjskih signala otvaraju nove dimenzije za proučavanje kompleksnih društvenih mreža među vrstama – hijerarhija, prijateljstava, saveza, sukoba. Ono što smo prije tumačili ponašajnim eksperimentima sada se može dopuniti „transkriptima“ njihovih međusobnih poruka.

A u području etike, potencijal je možda i najdublji: razumijevanje da životinje međusobno komuniciraju složenije nego što smo mislili, da izražavaju emocije, namjere i osjećaje – to bi moglo redefinirati način na koji ih tretiramo u zakonodavstvu, industriji, pa čak i kulturi.

Naposljetku, možda je Denise Herzing u pravu kad kaže da bi spoznaja o jeziku životinja mogla pomoći ljudima da shvate: nismo jedina osjećajna bića na planetu. A ako ih zaista počnemo razumijevati, možda ćemo ih – prvi put u povijesti – i početi slušati.