Sintetički glasovi razumljiviji su od ljudskih
Samo nekoliko sekundi uzorkovanja dovoljno je za stvaranje AI kopije glasa osobe, ali nitko ne zna zašto su nam toliko jasniji
Sintetički glasovi sve su više dio naših života, od digitalnih asistenata do automatiziranog telemarketinga i telefonskih sekretarica. Širenjem generativne umjetne inteligencije razvijena je nova vrsta sintetičkog glasa: klonovi glasa koji mogu rekreirati faksimil nečijeg glasa iz samo nekoliko sekundi snimljenog govora.

Istraživači University Collegea u Londonu i Sveučilišta u Roehamptonu dali su si u zadatak procijeniti razumljivost ljudskih i kloniranih glasova, odnosno koliko je prosječnoj osobi lako razumjeti što im tko ili što govori. Pretpostavka je bila da će klonirani glasovi biti lošiji prikazi stvarnih ljudskih glasova i da će ih ljudi teže razumjeti.
Klonovi jasniji od ljudi
No, rezultati istraživanja, objavljeni u časopisu Američkog društva za akustiku JASA, pokazali su potpuno drugačiju sliku: klonirane glasove lakše je razumjeti nego ljudske, naročito u bučnijim okruženjima. Matematički, klonirani glasovi ljudima su bili bili razumljiviji do čak 20 %.

Nakon što su otkrili da su klonovi glasa dosljedno ocijenjeni lakšima za razumijevanje, ponovili su eksperiment sa starijim volonterima kako bi utvrdili mijenja li nagluhost učinak; usporedili su i rezultate američkih i britanskih naglasaka, kao i one s filterom dizajniranim za oponašanje umjetne pužnice. U svim slučajevima klonovi glasa izašli su kao pobjednici.