VQGAN + CLIP - Generatori protiv diskriminatora

Jednom kada se prvi put zaviri u svijet generatora likovne umjetnosti, neuputno je da će se susretati s brojnim novim pojmovima i konceptima. Možda i najvažniji su upravo VQGAN i CLIP, skraćenice koje, izgovore le se u cijelosti, itekako mogu djelovati zastrašujuće kada se s njima prvi put susreće. No, kao što je to slučaj kod neuronskih mreža, stvari postaju jasnije jednom kada ih se ponešto demistificira…

Matija Gračanin petak, 30. prosinca 2022. u 05:00

Neuronske mreže i duboko učenje temeljne su sastavnice za razvoj područja kao što su prirodni jezik ili obrada slika (pa danas i generiranja likovne umjetnosti) sa stanovišta računala, a tijekom vremena razvile su se i napredne tehnike neuronskih mreža, u koje se ubrajaju konvolucijske neuronske mreže (CNN), kao i generativne suparničke mreže (GAN). Prvi je koncept posebne neuronske mreže proizašao iz činjenice kako je nemoguće (neisplativo) naučiti neuronsku mrežu da na slikama prepoznaje (klasificira) obilježja koja se mogu razlikovati prema veličini, položaju pa i usmjerenosti. Primjerice, ljudsko oko nije jednostavno točno klasificirati modelima koji uče na temelju piksela ulaznih slika, jer se pri svakom pomicanju kadra (i drugim promjenjivim parametrima) vrijednost piksela znatno mijenja. Sve to znači da bi za uspješno prepoznavanje takvih obilježja bila potrebna zaista ogromna količina podataka, a i onda bi prepoznavanje bilo uspješno samo u zadanim i predvidljivim uvjetima (primjerice, ako se ljudsko oko nalazi uvijek u sredini slike).

Članak dostupan pretplatnicima

Kako bi mogao pročitati cijeli članak, moraš biti prijavljen na Bug.hr sa svojim podacima te imati status pretplatnika.

Bug 362 siječanj 2023.

AI alati za generiranje digitalne umjetnosti