Stable Video Diffusion novi je AI model za generiranje videozapisa
Stable Video Diffusion dostupan je za testiranje, ali korisnici moraju prihvatiti određene uvjete koje nalaže Stability AI
Tvrtka Stability AI predstavila je Stable Video Diffusion, novi AI model koji je sposoban generirati videozapise animiranjem postojećih slika. Nadograđujući se već na postojeći text-to-image model Stable Diffusion, Stable Video Diffusion ističe se kao jedan od rijetkih modela za generiranje videozapisa dostupnih u otvorenom kodu.
Naime, Stable Video Diffusion dolazi u obliku dva modela – SVD i SVD-XT. Prvi, SVD, transformira statične slike u videozapise rezolucije 576 x 1.024 pri 14 sličica u sekundi. S druge strane, SVD-XT koristi istu arhitekturu, ali povećava broj sličica na 24. Usprkos toj razlici, Stability AI navodi da oba mogu generirati videozapise s između tri i 30 sličica u sekundi.
Inače, SVD i SVD-XT trenirani su na skupu podataka od nekoliko milijuna videozapisa, a zatim su „uglađeni“ na mnogo manjem skupu od nekoliko stotina tisuća do oko milijun isječaka. Iako generirani videozapisi izgledaju impresivno, Stability AI priznaje da Stable Video Diffusion ima svojih ograničenja. Prvo, nije moguće generirati videozapise bez pokreta, renderirati čitljivi tekst i dosljedno generirati lica i osobe.
Stable Video Diffusion trenutno je u testnoj fazi i oni koji ga žele koristiti moraju pristati na određene uvjete. Više informacija dostupno je u priopćenju Stability AI-ja.