Xiaomijevo rješenje za pomoć osobama s poremećajima govora

Projekt "Own My Voice" omogućuje reprodukciju jedinstvenih i prilagođenih glasova

Bug.hr petak, 20. svibnja 2022. u 09:02

Xiaomi, koji se bavi proizvodnjom vrlo raznolikih uređaja, predstavio je vlastitu govornu Text-To-Speech tehnologiju, koju je razvio Xiaomi AI Lab, a koristi se za generiranje jedinstvenog i prilagođenog glasa za korisnike s poremećajima govora.

Korisnik sada može komunicirati s drugim ljudima koristeći "vlastiti glas", umjesto tipičnog monotonog elektroničkog glasa. Kao dio predistraživačkog projekta "Own My Voice" kojeg provodi Xiaomi Technical Committee, ovaj uspješan pokušaj demonstrira Xiaomijevu predanost filozofiji "Tech for Good".

"Own My Voice"

Xiaomi je osnovao projektni tim "Own My Voice" kako bi pozvao korisnike s govornim poremećajima kao primatelje glasa. Zhu Xi, voditelj tematskog tehnološkog odbora za Tech for Good u kompaniji Xiaomi Corporation, je rekao: "Uzbuđeni smo što ćemo istražiti višestruku vrijednost koju nam donose tehnološke inovacije, kao što je odgovor na zahtjeve korisnika za vlastitim identitetom i izgradnjom identiteta.“

Kako bi generirao najprikladniji, personalizirani glas za primatelja, projektni tim je angažirao više od 200 volontera unutar Xiaomija da doniraju svoje glasove. Koristili su algoritam za podudaranje otiska glasa kako bi uparili značajke glasova doniranih volontera s onima glasa primatelja. Ovim pristupom pronašli su najprikladniji glas kao osnovni zvuk glasovne reference za primatelja. S obzirom na personalizaciju i zaštitu privatnosti, odabranim stvarnim glasom manipulirano je složenim akustičnim modifikacijama kako bi se formirao novi i originalni zvuk glasa.

Zatim je upotrijebljena tehnologija Text-To-Speech spontanog stila za treniranje AI modela, čime je ovaj novi glas postupno dobio prirodan ritam i intonaciju koja može istinito izraziti emociju i ton čovjeka.

Projekt "Own My Voice" kombinira niz najnaprednijih algoritama s Xiaomijevom samorazvijenom govornom tehnologijom kako bi se osigurala specifičnost, sigurnost i visoka autentičnost sintetiziranog glasa, stvarajući novu ideju o prilagođenoj sintezi govora za korisnike s govornim poremećajima.

Koji je značaj ovog projekta?

Okosnica ovog projekta je grupa stručnjaka za govornu tehnologiju iz Xiaomi AI Laba. Od 2017. godine objavili su 37 radova o govoru u zbornicima vrhunskih međunarodnih konferencija, poput Međunarodne konferencije o akustici, govoru i obradi signala (ICASSP). Uspjeh "Own My Voice" uglavnom ovisi o Text-To-Speech tehnologiji spontanog stila koju su razvili.

Tehnologija Text-To-Speech spontanog stila u biti čini da sintetizirani glas zvuči poput ljudskog u svojoj intonaciji, pauzi, brzini i drugim značajkama. Time se monoton i neprirodan osjećaj elektroničkog glasa zamjenjuje prirodnijim. Trenutno se ova tehnologija primjenjuje na mnoge pametne uređaje koji koriste Xiaoai, AI glasovnog asistenta kompanije Xiaomi.

Projekt "Own My Voice" pokazuje da Text-To-Speech tehnologija spontanog stila također može biti široko prihvaćena u područjima pristupačnosti i poboljšati korisničko iskustvo.

Zhu Xi dodaje: "Ako primijetimo potrebe manjinskih skupina u ranoj fazi i odgovorimo na njih, proces širenja tehnologije mogao bi se uvelike skratiti. To omogućuje da prednosti novih tehnologija postanu trenutno dostupne korisnicima s posebnim potrebama."

Xiaomi će nastaviti primati povratne informacije od primatelja glasa i dalje proučavati izvedivost ovog projekta u širem rasponu.

Xiaomijevo rješenje za pomoć osobama s poremećajima govora

"Own My Voice"

Koji je značaj ovog projekta?

Vezano

Vrhunski hi-fi zvuk uz najbolje popuste!

KEF Q7 Meta

DALI KUPID Black Ash

PRO-JECT E1.2, , PICK IT, MM

KEF Coda W Dark Titanium

Bluesound PowerNode N331

WiiM Ultra

Ronis Velesajam

Trenutno najpovoljnije cijene na tržištu

Vezano

CES 2026

Samsung Display na CES-u demonstrirao nove OLED inovacije

TEHNOLOGIJE

Najmanji autonomni roboti na svijetu 'manji od zrna soli'

Tjedni pregled – znanost i tehnologija

Najmoćniji stroj za hipergravitaciju komprimira prostor i vrijeme

Nek i oni pate!

Neuromorfni taktilni živčani sustav: roboti dobivaju osjet boli

Nepotrebno?

Serija Xiaomi 17 uskoro bi mogla dobiti još jednog člana

Neiskorišteni AI potencijal

Microsoft kupcima financira obuku za Copilota