Blackout Diffusion: umjetna inteligencija koja slike stvara ni iz čega

Model generira uzorke usporedive s modelima difuzije kao što su DALL-E ili Midjourney, ali pritom zahtijeva manje računalnih resursa

Mladen Smrekar subota, 13. siječnja 2024. u 15:59
Generiranje slike na temelju Blackout Diffusiona 📷 Javier E. Santos i sur.
Generiranje slike na temelju Blackout Diffusiona Javier E. Santos i sur.

Novi, revolucionarni okvir umjetne inteligencije nazvan Blackout Diffusion generira slike iz potpuno prazne podloge, što znači da algoritam strojnog učenja, za razliku od drugih modela generativne difuzije, ne zahtijeva nasumične podatke (random seed) da bi počeo s radom. Blackout Diffusion, predstavljen na Međunarodnoj konferenciji o strojnom učenju ICML, generira uzorke usporedive s trenutnim modelima difuzije kao što su DALL-E ili Midjourney, ali pritom zahtijeva manje računalnih resursa.

Preduvjet nove revolucije

"Generativno modeliranje preduvjet je sljedeće industrijske revolucije i pomoći će nam u raznim zadacima, od generiranja softverskog koda, preko izrade pravnih dokumenata, sve do umjetnosti", smatra Javier Santos, istraživač umjetne inteligencije u Nacionalnom laboratoriju Los Alamos i jedan od tvoraca Blackout Diffusiona.

Četiri stotine uzoraka koje je generirao Blackout Diffusion 📷 Javier E. Santos i sur.
Četiri stotine uzoraka koje je generirao Blackout Diffusion Javier E. Santos i sur.

Generativno modeliranje moglo bi se iskoristiti za stvaranje znanstvenih otkrića, a ovim se okvirom, kaže, postavljaju temelji i daju praktični algoritmi za primjenu modeliranja generativne difuzije na znanstvene probleme.

Rad u diskretnom prostoru

Blackout Diffusion se od postojećih modela generativne difuzije razlikuje i prostorom u kojem djeluje. Naime, dok oni rade u kontinuiranim prostorima, što ograničava njihov potencijal za znanstvenu primjenu, ovaj radi u diskretnim prostorima što znači da je svaka točka u prostoru izolirana od drugih određenom udaljenošću, a to otvara mogućnosti za različite tekstualne i znanstvene primjene.

Novi generativni AI model može stvoriti slike iz praznog okvira 📷 Nacionalni laboratorij Los Alamos
Novi generativni AI model može stvoriti slike iz praznog okvira Nacionalni laboratorij Los Alamos

Model je testiran na brojnim standardiziranim skupovima podataka, uključujući modificiranu bazu podataka Nacionalnog instituta za standarde i tehnologiju, skup podataka CIFAR-10 koji sadrži slike objekata u 10 različitih klasa i CelebFaces Attributes Dataset s više od 200.000 slika ljudskih lica. 

Modeliranje generativne difuzije moglo bi drastično ubrzati vrijeme provedeno u izvođenju znanstvenih simulacija na superračunalima. Neki od primjera, navode tvorci Blackout Diffusiona, uključuju dinamiku podzemnih ležišta, kemijske modele za otkrivanje lijekova i ekspresiju gena i stanica za bolje razumijevanje biokemijskih mehanizama u živim organizmima.