MuZero: Googleov AI sustav samostalno uči igrati igre na ploči

Prvi sustav umjetne inteligencije naučio je igrati šah, go i druge igre gledajući ljude kako igraju, druga generacija naučila je pravila i trenirala igrajući sama sa sobom, a trećoj niti pravila nisu potrebna

Sandro Vrbanus četvrtak, 24. prosinca 2020. u 14:36

Googleova kompanija DeepMind koja se bavi umjetnom inteligencijom nedavno je objavila kako je riješila 50 godina star problem otkrivanja strukture proteina. Do toga su došli modifikacijama sustava koji se "proslavio" prije četiri godine pobjedom nad svjetskim prvakom u igri go, AlphaGo.

Sustav AlphaGo naučio je igrati drevnu kinesku igru proučavajući njezina pravila i partije koje su odigrali drugi (ljudski) igrači. Nakon mnogo takvih treninga i dorade sustava, AlphaGo je bio ravnopravan protivnik najboljim svjetskim igračima, a potom ih je počeo pobjeđivati. No, u DeepMindu nastavili su razvijati sustav te ga pretvorili u AlphaGo Zero, igrača koji je naučio igrati go tako što je kao inpute uzeo tek pravila igre. Metode i strategije osmislio je "samostalno", a trenirao je igrajući sam protiv sebe. Ubrzo je postao nepobjediv i u gou i u šahu. U međuvremenu je nastala i općenitija inačica ovog sustava, AlphaZero, koja može samo iz pravila naučiti igrati i druge igre na ploči (šah i šogi).

Može i bez pravila

Sada je DeepMind u javnost izišao s novom inačicom ovog sustava, trećom generacijom nazvanom MuZero. Ovaj sustav koristi umjetnu inteligenciju još više razine, tako da je ona sposobna naučiti igrati go, šah i druge igre bez da zna njihova pravila ili išta drugo o igri. Sve što joj je potrebno jest promatrati okruženje i odigrane partije. Na temelju toga MuZero je u stanju zaključiti kako se figure kreću, što je bitno za pobjedu i slično, te kroz simulacije igranja steći iskustvo potrebno za ostvarivanje pobjeda.

Napredak kroz generacije
Napredak kroz generacije

Igra i video igre

Osim igara na ploči isti sustav je naučio igrati i Atarijeve retro igre, kao što je Ms Pac-Man. I u njima je pokazao vrlo brz napredak i sposobnost da vrlo lako pobijedi ljudske igrače u svakom zadanom scenariju. U Googleu kažu da je ovo velik korak naprijed prema izradi sustava opće umjetne inteligencije koja ne bi bila specijalizirana samo za jednu zadaću ili područje rada. Umjesto toga, mogla bi se "snalaziti" u novim, nepoznatim okruženjima, iz konteksta učiti pravila (igre, posla, bilo čega), te vrlo brzo početi preuzimati dio zadataka na sebe, efikasno pronalazeći "pobjedničke" strategije i planirajući poteze unaprijed.

Moguća primjena u kodiranju videa

Jedna od mogućih situacija u kojoj bi ovakvi napredni sustavi sa sposobnošću učenja mogli biti od velike koristi je i kompresija podataka u digitalnom obliku. MuZero bi mogao biti stavljen u funkciju tako da proučava, primjerice, video zapise, koji su najveći generator internetskog prometa u svijetu. Analizom njihovog izvornog i komprimiranog zapisa mogao bi osmisliti algoritme za bolju kompresiju podataka bez gubitka kvalitete.

To bi dovelo do velikog napretka u smanjenju količine podataka za prijenos i pohranu, a vrlo vjerojatno bi se time prvi mogao okoristiti Googleov video servis YouTube. Iz DeepMinda nisu željeli otkrivati više o ovakvoj primjeni umjetne inteligencije. Za BBC su izjavili da su prvi testovi AI kompresije videa pokazali značajne uštede, ali da će više detalja o tome objaviti sljedeće godine.