Meta ima alat za automatizirano generiranje videa na osnovu teksta

Osim što mogu stvoriti realistične ilustracije na temelju tekstualnih zadataka, napredni sustavi s umjetnom inteligencijom u stanju su na sličan način stvoriti i dinamične scene

Sandro Vrbanus subota, 1. listopada 2022. u 20:10

Nakon, ovoga srpnja predstavljenog, zanimljivog alata za generiranje slika uz pomoć umjetne inteligencije, Make-A-Scene, Facebookova je kompanija unaprijedila svoje sustave te prikazala da se na sličan način mogu generirati i video isječci. Njihovim se novim alatom, izrađenim za te svrhe, pohvalio protekloga tjedna Mark Zuckerberg.

Logično, sustav za stvaranje videa nazvali su Make-A-Video, a on funkcionira kao i mnogobrojni slični, danas vrlo popularni, sustavi umjetne inteligencije. Korisnik mu mora samo zadati tekstualni opis scene koju želi vidjeti, a sustav potom samostalno stvara nikad viđene ilustracije, ili – u ovom slučaju – video zapise.

AI video kreativac

Za sada je prikazano tek nekoliko scena stvorenih na ovaj način. Tako možemo vidjeti, recimo, plišanog medvjedića kao slika autoportret, svemirski brod kako slijeće na Mars ili robota koji surfa na valovima – sve prizori koje je "izmaštala" umjetna inteligencija, trenirana na postojećim slikama i videima.

Zuckerberg kaže kako je stvaranje videa "ni iz čega" daleko složenije od stvaranja nepokretnih slika, jer sustav mora, ne samo generirati svaki piksel na slici, već i predvidjeti kako će se on mijenjati kroz vrijeme. U te su svrhe sustavu dodali još jedan "sloj" umjetne inteligencije koja uči bez nadzora, a služi tome da "razumije" pokret u stvarnom svijetu te ga primjenjuje na postojeće slike nastale iz tekstualnih zadataka. Za sada iz Mete prikazuju tek kratke isječke kao dokaz koncepta, a u budućnosti bi se u javnosti mogao pojaviti i demo njihovog sustava Make-A-Video.

Osim stvaranja videa "iz nule", isti će sustav biti u stanju pretvoriti statične slike u pokretne, kao i urediti postojeći video zapis s dodatnim efektima, novim pozadinama ili scenama, koje su u principu proširenje ranije snimljenog videa.