Google ima odličan novi sustav za povećanje rezolucije slika

San svakog CSI istražitelja, barem u TV serijama, je imati ovako efikasan sustav koji može razotkriti detalje s fotografija koji se zbog slabe rezolucije ne vide dovoljno dobro

Sandro Vrbanus utorak, 31. kolovoza 2021. u 19:37

Kada se spomene povećanje rezolucije fotografija i izvlačenje iz njih detalja koji se na prvu ne vide dobro, gotovo uvijek je prva asocijacija nerealistični prikaz tog procesa kakav se može vidjeti u CSI serijalu i raznim filmovima. No, Google je sada vrlo blizu tome da sustavi poput filmskih postanu stvarnost. Prošloga su mjeseca, naime, njihovi znanstvenici iz područja umjetne inteligencije predstavili novu metodu za generiranje realističnih fotografija visoke rezolucije iz onih niske rezolucije.

Kao i neki raniji pokušaji, ovaj se sustav oslanja na strojno učenje i GAN (generative adversarial networks, generativna suparnička mreža) mreža treniranih na razne načine. U slučaju Googlea, neuronske su mreže trenirane tako što su im davane fotografije koje su postupno "uništavane" primjenom Gaussian šuma. Sustav je "gledao" kako se slika polako pretvara u šum, sve dok potpuno ne postane isključivo šum. Nakon toga GAN mreža je trenirana da pokuša obrnuti taj proces u suprotnom smjeru.

Tako je dobiven sustav koji od šuma može postupno stvarati sve čišću sliku, optimizirajući je kroz svoje algoritme kako bi dobio ono za što se smatra da bi mogla biti izvorna fotografija. Primjeri koje su istraživači objavili prilično su fascinantni, a možete ih vidjeti unutar ovog teksta ili na Gooleovom AI blogu.

Na temelju svojih istraživanja u Googleu su stvorili dva modela. Model SR3 sposoban je stvoriti sliku više rezolucije iz slike niže rezolucije, korištenjem spomenutog pristupa izvođenja (gotovo pa izmišljanja) novih informacija iz čistog vizualnog šuma.

Drugi sustav nadograđuje se na ovaj, naziva se Class-Conditional ImageNet Generation, a koristi se nizom modela koji se primjenjuju jedan za drugim. Sposoban je postupno povećavati rezoluciju slike i u nekoliko koraka, kao što se vidi na primjerima, iz matrice 32x32 piksela izraditi sliku daleko više rezolucije (256x256) i s više detalja.

Ispitivanja su pokazala da ove metode ostvaruju bolje rezultate od do sada poznatih sustava za povećanje razlučivosti na fotografijama, a u stanju su "prevariti" i više od 40% ispitanika, koji smatraju da je fotografija stvarna, a ne generirana. Nešto bolje rezultate postižu u fotografijama ljudskog lica (47,4% ispitanika mislilo je da su stvarne), dok je rezultat za druge prirodne slike "zbunio" 39% ispitanika.