Muško, žensko, svahili ili urdu, ovaj sintetizator govora moći će sve

Poljski startup ElevenLabs razvija model dubokog učenja za sintezu govora koji tekst pretvara u govor bilo kojim glasom i bilo kojom emocijom, na bilo kojem jeziku

Mladen Smrekar ponedjeljak, 23. siječnja 2023. u 18:15

Nakon posljednjih otkrića u generiranju teksta i slika, sljedeći izazov za umjetnu inteligenciju bit će zvuk. Barem su u to uvjereni ljudi iz poljskog startupa ElevenLabs koji intenzivno radi na text-to-speach sintetizatoru govora i audio konverteru.

Njihovo bi rješenje radilo na bilo kojem jeziku, s bilo kojim glasom i s punim rasponom emocija. I moglo bi se koristiti za sve, od prijevoda audio knjiga do sinkronizacije filmova. Na temelju te ideje primili i dva milijuna dolara kapitala u pre-seed rundi.

Model dubokog učenja

ElevenLabs je startup za glasovnu tehnologiju. Njihov model dubokog učenja za sintezu govora, nazvan Prime Voice AI, proizvodi umjetne glasove, ali može klonirati i postojeće. Audio knjigu tako vam može čitati glas neke slavne osobe, bez njenog punog sudjelovanja; tehničar glas može klonirati iz uzoraka ne dužih od pet sekundi.

Razvijeno rješenje trenutno radi na engleskom i poljskom, a u startupu se nadaju da će funkcionirati na svim svjetskim jezicima. U sljedećim mjesecima ElevenLabs namjerava objaviti i program automatskog presnimavanja s jednog jezika na drugi, s istim glasom.

Mati Staniszewski i Piotr Dabkowski, osnivači startupa Eleven Labs

Dugoročno gledano, njihov bi se sintetizator govora mogao koristiti u kino sinkronizaciji, TV prijenosima uživo i općenito u komunikaciji u stvarnom vremenu.

Veliki igrači

Poljski ElevenLabs dakako nije jedini startup u području glasovne umjetne inteligencije; tu su još i ukrajinski Respeecher, kanadski Resemble AI i američki WellSaid Labs.

Istim poslom bave se i veliki igrači: u prva tri tjedna ove godine Microsoft je najavio novi alat koji može klonirati nečiji glas i ton iz isječka zvuka od tri sekunde, a Apple je najavio pokretanje novog projekta digitalne naracije za stvaranje audio knjiga.

Vezano

📢 Uštedi

Laptop LENOVO V15 G5

Sniženo

1.015,99€ ~~1.199,99€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Wave Keys

Uhvati priliku

69,99€ ~~84,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Električni romobil SEGWAY

Na popustu

792,99€ ~~999,99€~~ Kupi

📢 Fotkaj

POLAROID instant fotoaparat

Provjeri odmah

119,99€ ~~129,99€~~ Kupi

📢 Uštedi

Pametni sat GARMIN Fenix E

Uhvati uštedu

539,99€ ~~839,99€~~ Kupi

📢 Otkrij

E-Book Reader POCKETBOOK Verse Pro

Akcija

169,99€ ~~219,99€~~ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Zadnji komentari na forumu

mrgood 24. siječnja 2023.

Hobbit je nevjerojatan! Kao da mi čita osobno sir David Attenborough! Originalni britanski naglasak.

kowach 24. siječnja 2023.

Gabrijel i Srećka bi uskoro mogli u preuranjenu mirovinu

ZovemseZoranidolazimizRijeke 23. siječnja 2023.

Djeluje iskreno fantastično! Oduševio sam se kako dobro može transcribeati. Ono što je manje fantastično je model pretplate, mislim nije problem platiti ali biti limitiran na 60,000 znakova mjesečno je stvarno nešto što te jako ograničava u onome što ti treba.Za igre, povremene članke isl. je d...

Mitch 23. siječnja 2023.

Ovo vec postoji tako da ne kuzim jesu li toga svjesni. FB/Meta ima speech translator (plus audio output) za oral language (za nepisane jezike) - https://about.fb.com/news/2022/10/hokkien-ai-speech-translation/ OpenAI ima VALL-E (koji jos nije public ali ce bit nakon GPT-4) i radi bolesno d...

Keso 23. siječnja 2023.

Jako dobro, ali ima dosta šuma i kuži se da je "čistoća" zvuka slabija od hifi snimljenog glasa u studiju. Ima potencijala da postane savršeno jednog dana.

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

Idealne za glazbu i razgovore.

Akcija

REVEL M105 Performa 3

Dvostazni bookshelf zvučnici, frekvencijski raspon 56Hz–20kHz, osjetljivost 86dB, impedancija 8Ω, pojačalo 50–120W, 1" aluminijski tweeter, 5.25" aluminijski woofer, stražnji bass-reflex, crossover 2.3kHz, dimenzije 35.6 x 20 x 24.8 cm, masa 7 kg.

899,00€ ~~1.499,00 €~~ Akcija

Flagship zvučnik s karbonskim driverima i RSC kabinetom.

Akcija

ACOUSTIC ENERGY Corinium tectona

3-way dizajn, 29 mm tweeter, 120 mm midrange, 2x140 mm bass, 32 Hz – 30 kHz, 92 dB, 4 ohma, 200 W, 40 kg.

6.299,00 € ~~6.999,00 €~~ Akcija

Bas s Marshallovim potpisom.

Akcija

MARSHALL EMBERTON III BT

Android, iOS, 2 x 2" (10W ukupno), Bluetooth verzija: 5.3, vodootpornost: IP67, raspon frekvencija: 65 Hz - 20 kHz, 32 sati sviranja, 2 sata punjenja, ulazi/Izlazi: USB, USB-C (bez AUX IN)

159,00 € ~~179,00 €~~ Akcija

Prestižni status Stereophile Class A komponente.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC licencirani monitor, Frekvencijski odziv: 70 Hz – 20 kHz (+/-3 dB), Impedancija: 15 /u2126 (nominalno), Osjetljivost: 82.5 dB / 2.83V / 1m

3.439,00 € ~~4.299,00 €~~ Akcija

Kompaktni high-end bookshelf zvučnici.

Akcija

REVEL M105 Performa 3

899,00 € ~~1.499,00 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II