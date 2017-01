Sjetite se samo kako su se ljudi znali sprdati na račun nekih bizarnih uputa hrvatskih iznajmljivača soba ili hotelijera namijenjenih stranim gostima. Čest komentar bio je da bi i Google prevoditelj mogao bolje. Zapravo stranica Iznajmljivači.hr još je u prosincu 2016. objavila tekst u kojem daje savjet da se Googleov prevoditelj koristi s mjerom i oprezom jer prijevod, mada brz i lako dostupan, može sadržavati greške koje mogu ozbiljno zavesti goste ili ih odvratiti od odabira ponuđača zbog dojma neprofesionalnosti. Autor teksta za primjer daje rečenicu 'Sutra ću s prijateljem ići u kino gledati film', koju je Google preveo kao 'Tomorrow I'm going with a friend to go to the cinema to watch a movie'. Svatko s elementarnim poznavanjem engleskog nasmijat će se na ove očite nespretnosti.



No takvo sprdanje uskoro će postati prošlost, a profesionalnim prevoditeljima još će se ozbiljnije stisnuti knedla u želucu koja ondje čuči već od prvih nagovještaja da bi računala u doglednoj budućnosti možda mogla preuzeti čak i njihove poslove. Zapravo u nekim zemljama, u kojima se govore veći jezici poput engleskog, španjolskog ili njemačkog, to se već događa. U Hrvatskoj još ne, ali prema najavama Googlea trebalo bi do kraja 2017.



Što se zapravo zbiva?

U uvodu u odličan osvrt na ovu temu u New York TimesuGideon Lewis-Kraus navodi iskustvo uglednog profesora Juna Rekimotoa sa Sveučilišta u Tokiju koji se bavi interakcijama ljudi i računala.



Saznavši da je Google Translate doživio nevjerojatan kvalitativni preobražaj, Rekimoto ga je odlučio testirati na dijelovima prijevoda knjige Veliki Gatsby na japanski u izvedbi slavnog književnika Harukija Murakamija. Kada je iste dijelove provukao kroz Google Translate, Rekimoto je na svoje veliko iznenađenje dobio prijevod koji mu se učinio transparentnijim od Murakamijeva. Ovaj potonji opisao je kao vrlo dotjeran na japanskom, ali izrazito u Murakamijevu stilu.



Nakon toga usporedio je svoj vlastiti prijevod Hemingwayevih Snjegova Kilimandžara s Googleovim prijevodom.



Usporedio je dvije verzije, a vi pokušajte odlučiti koja je računalna bez čitanja nastavka teksta:

NO. 1:

Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

NO. 2:

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

Malenu grešku u verziji 2, nedostatak člana the uz riječ leopard, uočit će vjerojatno samo netko kome je engleski materinji jezik.



Kvalitativni skok

Kako je Google od gotovo sprdnje odjednom postao tako respektabilan prevoditelj?

Sundar Pichai, izvršni direktor Googlea objasnio je u studenom prošle godine, kada se kvalitativni skok dogodio, da je ključ obrata u tome što je Google u međuvremenu razvio pristup poznat kao 'A.I.-first'. Ideja tog pristupa, koji se razvija u sklopu projekta Google Brain pokrenutog 2011., jest da bi računala trebala učiti jezik na način kako to rade djeca, odnosno mozak.



Naime, postoje dva temeljno različita pristupa računalnoj obradi jezika koji potječu još s kraja prve polovice 20. stoljeća. Prema jednom, pojednostavljeno govoreći, u računala bi trebalo ubaciti sva gramatička pravila jednog jezika, primjerice engleskog, a potom i sve riječi iz nekog dobrog engleskog rječnika. Potom bi trebalo ubaciti sve isto iz nekog drugog jezika, recimo njemačkog. Konačno bi se u program mogla unijeti neka rečenica na engleskom i zatražiti da on, na temelju pravila logičkog razmišljanja i podataka, odnosno riječi, odradi prijevod na njemački. No takav pristup je spor, a funkcionira samo ako su pravila vrlo jasna, kao što su primjerice u šahu. U mnogim jezicima to nije slučaj; u govoru, pisanju i prevođenju nerijetko ima više iznimaka nego pravila.



Drugi pristup temelji se na ideji da umjetna inteligencija treba oponašati biološku, odnosno mozak. Ljudski mozak sastoji se od stotinjak milijardi neurona od kojih je svaki sinapsama povezan s tisućama, ponekad i više od 10.000 drugih. Ove veze stvaraju se postupno, u procesu učenja kroz pokušaje i pogreške. Na taj način nastaje vrlo složena mreža koja je temelj znanja i obrade podataka. Smatra se da u središnjem živčanom sustavu postoji toliko sinapsi da bismo ih morali brojati desecima tisuća godina uz uvjet da ih možemo izbrojati po 1000 u sekundi. Računalna tehnologija za sada još uvijek nije na razini replike ljudskog mozga, no prema mišljenjima stručnjaka 2015. dosegnula je onu mišjeg. Kada bi se nastavila razvijati prema Mooreovom zakonu 2023. bi trebala dostići ljudski. No ključna stvar u ovoj priči jest da takav pristup već sada omogućuje mnogo fleksibilniju i prirodniju obradu jezika.



Googleov prevoditelj pokrenut je 2006. godine da bi do danas postao jednom od najpopularnijih usluga kompanije. Trenutno se u svijetu mjesečno koristi više od 500 milijardi puta, podržava više od 100 jezika na različitim razinama, poslužuje preko 200 milijuna ljudi dnevno, a njegovi korisnici svaki dan prevode više od 140 milijardi riječi. Tijekom prošlogodišnje emigrantske krize broj prijevoda između arapskog i njemačkog se upeterostručio.



Krajem prošle godine princip A.I.-first uveden je za engleski, španjolski, francuski, portugalski, njemački, kineski, japanski, korejski i turski. Plan kompanije je da se ostalih stotinjak jezika uvodi po osam mjesečno kako bi proces prelaska bio okončan do kraja 2017. Stručnjaci tvrde da su poboljšanja koja je pristup praktički preko noći ostvario otprilike jednaka onima koja je stari pristup ostvario za cijelog svojeg postojanja. Naravno, on se u Googleu, iza zavjesa, s određenim zastojima razvija već više godina.



Era AI-ja: Googleov asistent

Jedan od ciljeva razvoja Googleovog prevoditelja, među ostalim, jest i stvaranje Googleovog asistenta (video dolje). Kako je Picahi objasnio u Mountain Viewu u Kaliforniji u svojoj prezentaciji u listopadu, vrijeme je sazrelo da se počne intenzivno raditi na razvoju umjetne inteligencije.



„Ako pogledamo unazad, računarstvo je prolazilo kroz velike obrate svakih desetak godina. Sve je počelo u ranim 80-ima kada su osobna računala postala uobičajena stvar... Desetak godina kasnije, sredinom 90-ih stigao je Web. On je doveo internet mnogo većem broju ljudi, radikalno je promijenio industrije i iz temelja promijenio način komunikacije među ljudima. Desetak godina kasnije, sredinom 2000-tih, s pojavom pametnih telefona dobili smo revoluciju mobitela. To je do pola svjetskog stanovništva dovelo računalnu tehnologiju koja na dubok način mijenja njihove živote“, rekao je Pichai.



„Kada gledam kako se razvija računalna tehnologija, jasno mi je da idemo od Mobile-first prema A.I.-first“, dodao je pojasnivši svoju viziju novog velikog obrata.



U toj viziji ljudi će moći ulaziti u interakcije s računalima s velikom lakoćom i vrlo prirodno. Google već duže radi na tom konceptu koji za cilj ima razvoj osobnog pomoćnika, koji će biti dostupan svugdje, a s kojim ćemo moći voditi smislenu dvosmjernu komunikaciju. Za razvoj takvog osobnog pomoćnika, koji će objediniti razne postojeće Googleove funkcije, poput prepoznavanja glasa i predmeta, Google karata i tražilice, trebat će također unaprijediti sposobnost računala da pamti i prepoznaje naše osobne potrebe i interese te da kvalitetno komunicira s nama s jezičnim sposobnostima na visokoj razini. U konačnici pomoćnik bi čak sam sintetizirao glas koji bi vlasnik uređaja mogao mijenjati prema vlastitom ukusu. Štoviše, mogao bi govoriti s nekim određenim naglaskom i na specifičnom narječju.



Primjerice, ako bismo došli u neki grad, Googleov pomoćnik trebao bi za nas moći pronaći najbolji restoran po našem ukusu, koji bi mu trebao biti dobro poznat, kao i prema našim financijskim mogućnostima. Pritom bi se restoran trebao nalaziti najbliže određenoj lokaciji na kojoj smo našli smještaj ili kojom se taj dan planiramo kretati.



„Danas naš grafikon znanja sadrži više od 70 milijardi činjenica o ljudima, mjestima i stvarima i na temelju njih može odgovarati na pitanja. Naša prirodna obrada jezika omogućuje da Google istinski komunicira sa svojim korisnicima. Stvorili smo i najsuvremenije programe za računalno prevođenje, prepoznavanje slika i prepoznavanje glasa. Svako od tih područja je turbo-nabijeno napretkom koji ostvarujemo u području računalnog učenja A.I.-ja. Prije nekoliko mjeseci privukli smo pozornost svijeta kada je DeepMindov program AlphaGo osvojio svjetsko prvenstvo protiv Lee Sedola... To je svijetu pokazalo da je došao trenutak za A.I.“, rekao je Pichai.



Govoreći o strojnom prevođenju, Pichai je istaknuo da se ono povijesno gledano temeljilo na prevođenju svakog pojma pojedinačno. Prijevodi pojedinačnih pojmova u tom su se pristupu kombinirali u rečenice, međutim, one nisu zvučale naročito prirodno, onako kako bi ih čovjek preveo.



„Nedavno smo objavili naše prve sustave dubokog računalnog učenja, od početka do kraja, u prevođenju. Umjesto da rade na razini pojedinačnih fraza, oni uzimaju rečenice i cijele ih oblikuju kao ishod“, rekao je Pichai istaknuvši da se strojevi u tome vrlo očigledno približavaju onome što mogu ljudi. Svoju tvrdnju ilustrirao je grafikonom kvalitete prevođenja koji pokazuje da je neuronski stroj već došao sasvim blizu čovjeku (grafikon dolje).



Koliki je kvalitativni skok napravio Google prevoditelj s konceptom strojnog učenja nama u Hrvatskoj vjerojatno će biti jasnije tek kasnije tijekom 2017. kada on bude uveden i za naš jezik. Ipak, trebat će tek vidjeti hoće li odmah u startu razlika biti toliko velika i očigledna kakvom se pokazala u velikim jezicima.



Nenad Jarić Dauenhauer po vokaciji je fizičar, a od 2000. godine do danas bavi se novinarstvom na Internetu pokrivajući u prvom redu znanstvene i školsko-obrazovne teme.