Ljudski glas ili 'deepfake'? Većina više ne čuje razliku

Bilo je samo pitanje vremena kad će tehnologija umjetne inteligencije početi proizvoditi naturalistički govor koji zvuči ljudski

Mladen Smrekar utorak, 7. listopada 2025. u 18:39

Klonovi glasova obučeni na glasovima stvarnih ljudi pokazali su se jednako uvjerljivima kao i njihovi stvarni pandani Freepik

Glasovi stovreni uz pomoć umjetne inteligencije danas su toliko uvjerljivi da ih većina ljudi više ne može razlikovati od stvarnih ljudskih glasova. Novo istraživanje londonskog Sveučilišta Queen Mary, objavljena u časopisu PLOS One, pokazuju da deepfake glasovi, klonirani na bazi stvarnih ljudi, zvuče gotovo identično kao stvarni ljudski glasovi.

Nema statističke razlike u našoj sposobnosti razlikovanja glasova stvarnih ljudi od njihovih lažnih klonova, zaključuju istraživači 📷 Nadine Lavan, Mairi Irvine, Victor Rosi, Carolyn McGettigan — Nema statističke razlike u našoj sposobnosti razlikovanja glasova stvarnih ljudi od njihovih lažnih klonova, zaključuju istraživači Nadine Lavan, Mairi Irvine, Victor Rosi, Carolyn McGettigan

Sudionicima studije pušteno je 80 uzoraka glasa, od čega 40 stvarnih i 40 AI-generiranih, a oni nisu mogli pouzdano razlikovati prave od umjetnih. Glasovi generirani od nule pritom su bili nešto lakše prepoznatljivi, ali klonirani glasovi gotovo se uopće nisu razlikovali od originala; razlike su bile toliko male da spadaju u kategoriju statističke pogreške.

Realistični, ali ne i hiperrealistični

Istraživači naglašavaju da glasovni klonovi korišteni u studiji nisu bili osobito sofisticirani. Napravljeni su komercijalno dostupnim softverom i obučeni su sa četiri minute snimaka ljudskog govora. ”Proces je zahtijevao minimalno stručno znanje, samo nekoliko minuta glasovnih snimaka i gotovo nikakav novac. To samo pokazuje koliko je AI glasovna tehnologija postala dostupna i sofisticirana“, objašnjavaju istraživači.

U prosjeku je samo 41% glasova generiranih umjetnom inteligencijom od nule pogrešno klasificirano kao ljudski 📷 Freepik — U prosjeku je samo 41% glasova generiranih umjetnom inteligencijom od nule pogrešno klasificirano kao ljudski Freepik

Istraživanje je također pokazalo da su AI-generirani glasovi često percipirani kao dominantniji, a ponekad i pouzdaniji nego ljudski glasovi, što otvara brojna etička i sigurnosna pitanja. Međutim, studija nije pronašla "hiperrealistički" efekt – glasovi nisu bili percipirani kao "čudniji" ili "previše savršeni" u odnosu na stvarne glasove, što je čest slučaj kod vizualnih deepfakeova.

Ljudski glas ili 'deepfake'? Većina više ne čuje razliku

Realistični, ali ne i hiperrealistični

Vezano

Vrhunski hi-fi zvuk uz najbolje popuste!

KEF Q7 Meta

DALI KUPID Black Ash

PRO-JECT E1.2, , PICK IT, MM

KEF Coda W Dark Titanium

Bluesound PowerNode N331

WiiM Ultra

Ronis Velesajam

Trenutno najpovoljnije cijene na tržištu

Vezano

glasovni phishing

Nova era 'vishinga': glasovne prevare u realnom vremenu

nova generacija napada

Umjetna inteligencija pokreće 80 % 'ransomware' napada

noise-coded illumination

Vodeni žig za razlikovanje stvarnih od deepfake videa

Grok Imagine

Od raketa i planeta do polugolih teta: umjesto lansiranja na Mars, Musk lansira erotske fantazije

Fejk, al najslađi

Nudify, deepfake pornografija i Reddit

Početak ere post-istine?

Je li Googleov Veo 3 alat kreativnosti ili oružje dezinformacija?