Svaka dva tjedna umire jedan autohtoni jezik - kako ih sačuvati?
S približno 4.000 jezika autohtonih naroda diljem svijeta koji nestaju tempom od jednog jezika svaka dva tjedna, razvoj AI rješenja postaje sve važniji u naporima očuvanja kulturnog naslijeđa…
![📷 Bug.hr](/img/svaka-dva-tjedna-umire-jedan-autohtoni-jezik-kako-ih-sacuvati_DvTri_.png)
Statistički podaci jasno ukazuju na hitnost situacije diljem svijeta, od Sjeverne Amerike do amazonske regije, australskih domorodačkih jezika do Afrike, gdje postoji preko 2.000 jezika, da se očuvaju jezici i kulturno naslijeđe. Problem nije nov, UNESCO je već pred petnaestak godina objavio Atlas ugroženih jezika svijeta koji se ažurira. Ipak, danas, zahvaljujući umjetnoj inteligencije može se s optimizmom gledati na barem digitalno očuvanje tih jezika za buduće generacije.
200 ugroženih jezika autohtonih jezika američkih domorodaca
Samo na prostoru Sjeverne Amerike jezici američkih domorodaca mogli bi nestati u sljedećih pet do deset godina. Nestajanje jezika nije moguće spriječiti, ali zahvaljujući nekim novim inicijativama poput First Languages AI Reality (FLAIR) pri kanadskom institutu za umjetnu inteligenciju Mila-Quebec, razvijaju se nova rješenja. Program umjetne inteligencije razvija modele za prepoznavanje govora za više od 200 ugroženih jezika autohtonih naroda Sjeverne Amerike.
Nedostatak stručnjaka iz redova autohtonih naroda
Nestajanje jezika veliki je problem, ali još je veći pronaći govornike, posebno tehnološki obrazovane koji će sudjelovati u takvim programima. Nevjerojatan je jaz u zastupljenosti stručnjaka iz redova autohtonih naroda. Oni čine manje od 0,005% tehnološke radne snage u SAD-u i drže samo 0,4% diploma prvostupnika računarstva. Situacija je posebno kritična u istraživanju umjetne inteligencije, gdje je identificirano samo desetak AI znanstvenika iz redova autohtonih naroda Sjeverne Amerike. Tvrtke koje su osnovali pripadnici autohtonih naroda primile su tek 0,02% ukupnog venture capital financiranja u 2022. godini.
Obrazovne inicijative i tehnička obuka
First Languages AI Reality pristupa očuvanju jezika kroz razvoj specijaliziranih modela za prepoznavanje govora. Projekt je prije svega postavio neka osnovna pravila: važnost etičkih AI protokola i vlasništva zajednice nad podacima. Kako temeljni podaci uključuju kulturološki osjetljive informacije govornika koji više nisu živi, posebno je važno dati im zakonski i povijesni legitimitet.
Nekoliko organizacija radi na rješavanju problema zastupljenosti kroz specijalizirane programe obuke. Lakota AI Code Camp, kojim upravlja IndigiGenius, pruža trotjedne intenzivne treninge gdje mladi pripadnici autohtonih naroda uče dizajnirati aplikacije koje dokumentiraju Lakota kulturu. Program je od 2022. godine obučio 33 učenika, od kojih se mnogi vraćaju kao instruktori.
T3PD, još jedna IndigiGenius inicijativa, fokusira se na obuku srednjoškolskih nastavnika za razvoj kulturološki relevantnih tečajeva računarstva. Ovaj program odgovara na činjenicu da samo 67% učenika iz autohtonih zajednica ima pristup računarskom obrazovanju.
U Centru za umjetnu inteligenciju autohtonih naroda Wihanble S'a pri koledžu Bard, istraživači primjenjuju strojno učenje na tradicionalne umjetničke forme. Primjerice, rad Suzanne Kite prevodi jezik Lakota snova u geometrijske uzorke koji se koriste u tradicionalnom vezenju perlica i izradi patchwork prekrivača.
Globalni AI napori za očuvanje jezika autohtonih naroda
Australski domorodački jezici suočavaju se s ozbiljnom prijetnjom izumiranja, s više od 250 originalnih jezika od kojih je danas aktivno samo oko 40. Prvi digitalni jezični centar za Aboridžine u Australiji, smješten u Perthu, koristi AI tehnologiju za digitalizaciju i očuvanje jezika Noongar. Projekt "Keeping Languages Strong" kombinira tradicionalno znanje starješina s naprednom tehnologijom prepoznavanja govora za stvaranje digitalnih arhiva.
Na Novom Zelandu, maorski jezični projekt "Te Reo Māori" koristi AI za razvoj alata za učenje jezika koji uključuje prepoznavanje govora i automatsko prevođenje. Projekt "Te Hiku Media" razvio je platformu Papa Reo, koja koristi umjetnu inteligenciju za transkripciju i prevođenje maorskog jezika, stvarajući pritom najveću digitalnu bazu maorskog jezika na svijetu.
U Africi, gdje postoji preko 2.000 jezika, nekoliko projekata koristi AI za očuvanje jezične raznolikosti. U Južnoj Africi, projekt "Masakhane" okuplja istraživače koji razvijaju sustave strojnog prevođenja za afričke jezike. Njihov rad uključuje jezike poput joruba, svahili i zulu, stvarajući AI modele koji mogu prevoditi između ovih jezika i globalnih jezika.
Afrički "Digital Heritage"
U Keniji, inicijativa "Digital Heritage" radi na očuvanju jezika Masai kroz AI potpomognuto prikupljanje usmenih povijesti i tradicionalnih priča. Projekt koristi napredne algoritme za prepoznavanje govora prilagođene specifičnostima masajskog jezika.
U amazonskoj regiji, gdje mnogi domorodački jezici imaju manje od 1.000 govornika, projekti poput "Línguas Indígenas Digitais" u Brazilu koriste AI za dokumentiranje i očuvanje jezika kao što su guarani i tupi. Posebnost ovog projekta je integracija tradicionalnih načina pripovijedanja s modernom tehnologijom.
Prepoznavanje i analiza kečuanskog jezika
U Peruu, inicijativa "Quechua AI" razvija alate za učenje jezika koji koriste strojno učenje za prepoznavanje i analizu kečuanskog jezika, jednog od najraširenijih domorodačkih jezika Južne Amerike.
Sami narod u nordijskim zemljama koristi AI tehnologiju za očuvanje svojih jezika. Projekt "Giellatekno" na Sveučilištu Tromsø razvija jezične tehnologije za sami jezike, uključujući alate za automatsku analizu teksta i prepoznavanje govora. U Grenlandu, projekt "Oqaasileriffik" koristi AI za razvoj digitalnih alata za očuvanje grenlandskog jezika kalaallisut, stvarajući pritom i edukativne aplikacije za mlađe generacije.