Predstavljena AI platforma za kloniranje glasa OpenVoice tvrtke MyShell

OpenVoice je platforma otvorenog koda za kloniranje glasa, a ističe se brzom obradom i naprednim opcijama prilagodbe, što ju razlikuje od postojećih tehnologija za kloniranje glasa

Tomislav Stanković četvrtak, 4. siječnja 2024. u 14:44
📷 Vika Strawberrika, Unsplash
Vika Strawberrika, Unsplash

MyShell je predstavio OpenVoice, platformu razvijenu od strane istraživača s MIT-a, Sveučilišta Tsinghua u Pekingu i kanadske tvrtke MyShell, koja nudi kloniranje glasa temeljem samo nekoliko sekundi snimke izvornog govora te omogućuje kontrolu nad tonom, naglaskom, emocijama i ritmom.

Riječ je o tehnologiji otvorenog koda koja postavlja nove standarde u području repliciranja glasa pomoću umjetne inteligencije, koristeći mali audio isječak, s preciznom kontrolom tona, emocija, naglaska, pauza i intonacije.

Obučen je na različitim glasovnim uzorcima, što mu omogućuje brzo prepoznavanje i ubrzavanje vremena potrebnog za kloniranje novog glasa, a sastoji se od dva AI modela koji zajedno rade na pretvaranju teksta u govor i kloniranju tona glasa, pomoću kojih je moguće reproducirati glas korisnika i promijeniti ton ili emociju u govoru, navodi VentureBeat.

OpenVoice može klonirati glasove s vrlo malo podataka kombiniranjem univerzalnog govornog modela s uzorkom glasa koje daje korisnik, prenosi AI News.

Ovaj AI model može se isprobati na platformama LeptonAI i Hugging Face, unošenjem tekstualnog unosa ili kratkom snimkom vlastitog glasa, te odabiranjem naglaska, tona glasa, emocije itd. Bit će zanimljivo vidjeti kako će se ovakvi modeli dalje razvijati.