Pokušali napraviti film korištenjem samo AI alata i napatili se brutalno - evo zašto

Umjesto obećavane jednostavnosti, eksperiment WSJ-a otkrio je šokantnu istinu o tome kako je stvaranje kvalitetnog video sadržaja pomoću umjetne inteligencije još uvijek zahtjevan, mukotrpan i komplicirani proces koji daleko nadilazi samo pritiskanje gumba

Bug.hr četvrtak, 29. svibnja 2025. u 08:15

Svjedočimo svakodnevno novim preokretima u razvoju umjetne inteligencije, a posebno onima za stvaranje video sadržaja. Nedavno je Google najavio Veo 3, AI generator videozapisa koji može kreirati video i dodavati zvuk te time preskočio postojeće konkurentske alate poput OpenAI-jeve Sore.

Nova generacija AI video alata dosegla je razinu kvalitete koja sve više briše granicu između stvarnog i umjetno generiranog sadržaja. Veo 3 stvara mini video segmente koje većina korisnika online ne može razlikovati od onih koje su napravili ljudi - filmski stvaratelji i glumci. Posebno se izdvaja svojom sposobnošću sinkronizacije zvuka s video sadržajem koji može uključiti dijaloge, glazbu i zvučne efekte. Sve izgleda jednostavno i mnogi se nadaju kako će s nekoliko promptova stvoriti idući Netflixov hit.

Testirali Google Veo, Runway AI i Midjourney

Ipak, praktični testovi pokazuju složenost procesa stvaranja kvalitetnog sadržaja. Wall Street Journal proveo je eksperiment stvaranja trominutnog filma "My Robot & Me" koristeći isključivo AI alate. Za projekt su odabrali Google Veo i Runway AI nakon testiranja različitih platformi, pri čemu se OpenAI-jev Sora pokazao neodgovarajućim za ozbiljnu produkciju.

Tim je koristio Midjourney za stvaranje pozadina i dizajn likova, a zatim detaljne tekstualne opise za usmjeravanje generiranja scena. Svaki kadar zahtijevao je precizne opise poput: "Niski kut snimanja: Joanna radi sklekove brzim tempom, održavajući ravnu liniju od glave do pete. Robot stoji iznad, nadgleda i usmjerava." Rezultat je bio preko tisuću generiranih sekvenci za samo tri minute finalnog sadržaja, što ilustrira muke stvaranja i trenutna ograničenja tehnologije.

"Anatomske noćne more"

Glavni problemi uključivali su kontinuitet likova - glavna protagonistica imala je različito lice u gotovo svakom kadru unatoč korištenju istih fotografija kao reference. Tim se također suočio s "anatomskim noćnim morama" gdje su generirani likovi imali iskrivljene udove, te nasumičnim pojavljivanjem novih likova koji nisu bili dio originalnog prompta. Čak i "dobri" kadrovi često su imali pregladka kretnja i dijelove koji su očito lažni.

Rezultat: AI-generirani sadržaj s prepoznatljivim nedostacima

Produkcijski tim morao je razviti potpuno novu metodologiju rada. Jarrard Cole, producent s desetogodišnjim iskustvom, izumio je cijeli produkcijski tijek da bi održao kontinuitet između scena. Proces je uključivao stvaranje AI verzije glavne protagonistice iz fotografija, precizno opisivanje kutova kamere, stilova osvjetljenja i kretanja za svaku scenu pojedinačno.

Unatoč svim tim naporima, finalni produkt i dalje ima ono što industrija naziva "slop" - AI-generirani sadržaj s prepoznatljivim nedostacima. Neki kadrovi su pretjerano glatki, dijelovi očito lažni, a neki prizori jednostavno smiješni jer su očito nestvarni.

Koliko ih je koštao eksperiment?

WSJ-jevi producenti izračunali su da kompletni projekt košta nekoliko tisuća dolara za pristup platformama Googlea i Runwaya, što je znatno manje od konvencionalnih produkcija koje zahtijevaju brojnu ekipu i skupu opremu. Zaključili su da AI omogućava neovisnim filmašima da proizvode visokokvalitetan sadržaj s minimalnim financijskim ulaganjem, što demokratizira pristup filmskoj produkciji, no trenutna generacija alata zahtijeva puno vremena i veliko strpljenje. WSJ eksperiment pobio je mit da se može "s nekoliko promptova napraviti film".

Zaključak projekta je da AI alati "nisu ništa bez ljudskog inputa, kreativnosti i originalnih ideja". Budućnost tehnologije, ne samo u ovom projektu WSJ-a, jest prema hibridnom pristupu gdje AI podržava, a ne zamjenjuje ljudsku kreativnost.