U Meti izradili univerzalnog multimodalnog prevoditelja teksta i govora, baziranog na otvorenom kodu

Prevoditeljski sustav SeamlessM4T oslanja se na umjetnu inteligenciju, podržava gotovo stotinu svjetskih jezika kad je riječ o prevođenju i transkribiranju, što u Meti uspoređuju sa znanstvenom fantastikom

Sandro Vrbanus četvrtak, 24. kolovoza 2023. u 08:35

Univerzalni prevoditelji, fascinantni koncepti poznati nam iz različitih djela iz domene znanstvene fantastike, novim su Metinim alatom sve bliže tome da postanu dijelom stvarnosti. Oni, kako kažu u Meti, služe dodatnom povezivanju ljudi, otvaraju vrata za komunikaciju putem društvenih mreža i drugih kanala te omogućavaju ljudima pristup sadržajima, bez obzira na kojem su oni jeziku izvorno nastali. Njihov najnoviji prevoditeljski model, SeamlessM4T, ima zadatak postati upravo ono što smo do sada gledali u znanstvenoj fantastici – univerzalni prevoditelj za pisani tekst i/ili govor, za bilo koji svjetski jezik.

Model koji "može sve"

Za korištenje sustava SeamlessM4T nećete morati umetnuti ribu u uho, već ćete ga moći koristiti kao dodatak svojem omiljenom pregledniku, aplikaciji ili društvenoj mreži – sve ovisi o tome gdje će i kako developeri ugraditi novi Metin model. Naime, on je potpuno otvorenog koda i njegovim se programskim kodom i podacima može koristiti svatko.

Sustav se oslanja na umjetnu inteligenciju, i multimodalan je, što znači da zna baratati kako pisanim, tako i izgovorenim tekstom. Ulazni mu se tekst može zadati govorom ili u pisanom obliku, a prijevod je moguće dobiti u obliku teksta, govora, ili u oba oblika. Automatsko prevođenje teksta za sada podržava gotovo 100 jezika, a govor je kao izlazni rezultat podržan za njih 35. Sustav automatski prepoznaje govor i jezik, pa je u stanju prevoditi i kada govornik u pola razgovora promijeni jezik koji koristi.

Krajnji cilj Metinih je stručnjaka u ovom projektu izraditi potpuno univerzalni sustav prevoditelja, sposoban za sve zadatke iz tog područja, bez obzira na jezik, primjenu ili oblik ulazne informacije. Ključno je pritom uvesti i značajno poboljšanu izvedbu kad je riječ o rjeđim i manje korištenim jezicima, za koje je teško pribaviti materijale za treniranje AI sustava – i na tome će u Meti i dalje raditi. Objavom ovog open source modela vjeruju da su načinili velik korak naprijed ka konačnom cilju, izradi zaista univerzalnog i "svemoćnog" prevoditelja.

Projekt je besplatan i moguće ga je pronaći na GitHubu, a demo je (u ograničenom izdanju) dostupan online na ovom mjestu.

Prevoditelj već sada podržava i hrvatski jezik, koji prepoznaje u govoru i pismu
Prevoditelj već sada podržava i hrvatski jezik, koji prepoznaje u govoru i pismu