Sintetički glasovi razumljiviji su od ljudskih

Samo nekoliko sekundi uzorkovanja dovoljno je za stvaranje AI kopije glasa osobe, ali nitko ne zna zašto su nam toliko jasniji

Mladen Smrekar petak, 24. travnja 2026. u 07:33
Rezultati istraživanja opovrgnuli su uvriježeno mišljenje o tome koliko je prosječnoj osobi lako razumjeti što joj govori drugi čovjek ili klon ljudskog glasa 📷 Freepik
Rezultati istraživanja opovrgnuli su uvriježeno mišljenje o tome koliko je prosječnoj osobi lako razumjeti što joj govori drugi čovjek ili klon ljudskog glasa Freepik

Sintetički glasovi sve su više dio naših života, od digitalnih asistenata do automatiziranog telemarketinga i telefonskih sekretarica. Širenjem generativne umjetne inteligencije razvijena je nova vrsta sintetičkog glasa: klonovi glasa koji mogu rekreirati faksimil nečijeg glasa iz samo nekoliko sekundi snimljenog govora.

Udio ispravno zabilježenih ključnih riječi u zadatku razumljivosti. Ispunjavanje okvira predstavlja vrste glasa 📷 Patti Adank, Han Wang
Udio ispravno zabilježenih ključnih riječi u zadatku razumljivosti. Ispunjavanje okvira predstavlja vrste glasa Patti Adank, Han Wang

Istraživači University Collegea u Londonu i Sveučilišta u Roehamptonu dali su si u zadatak procijeniti razumljivost ljudskih i kloniranih glasova, odnosno koliko je prosječnoj osobi lako razumjeti što im tko ili što govori. Pretpostavka je bila da će klonirani glasovi biti lošiji prikazi stvarnih ljudskih glasova i da će ih ljudi teže razumjeti.

Klonovi jasniji od ljudi

No, rezultati istraživanja, objavljeni u časopisu Američkog društva za akustiku JASA, pokazali su potpuno drugačiju sliku: klonirane glasove lakše je razumjeti nego ljudske, naročito u bučnijim okruženjima. Matematički, klonirani glasovi ljudima su bili bili razumljiviji do čak 20 %.

Glasovi na testu: 15 značajki rangiranih po važnosti 📷 Patti Adank, Han Wang
Glasovi na testu: 15 značajki rangiranih po važnosti Patti Adank, Han Wang

Nakon što su otkrili da su klonovi glasa dosljedno ocijenjeni lakšima za razumijevanje, ponovili su eksperiment sa starijim volonterima kako bi utvrdili mijenja li nagluhost učinak; usporedili su i rezultate američkih i britanskih naglasaka, kao i one s filterom dizajniranim za oponašanje umjetne pužnice. U svim slučajevima klonovi glasa izašli su kao pobjednici.