Sora – generativni AI video postao je dobar kao slike ili tekst

OpenAI je predstavio svoj difuzijski model za stvaranje kratkih video isječaka na temelju tekstualnog prompta. Rezultati su fascinantno realistični, a model još uvijek nije dostupan javnosti

Sandro Vrbanus petak, 16. veljače 2024. u 15:38

Nakon ChatGPT-a za stvaranje tekstova, koje je sve teže razlikovati od ljudskih, pa alata DALL-E za generiranje ilustracija, OpenAI je sada predstavio i model Sora – namijenjen generiranju realističnih video isječaka. Nisu oni prvi koji u javnost izlaze s rezultatima difuzijskog modela za pretvaranje teksta u video, ali su, barem prema prikazanome, izradili najbolji model dosad viđen. To su postigli tehnikama koje stoje u pozadini ove umjetne inteligencije i surađuju kako bi stvorile realistične snimke, gotovo istovjetne onima kakve bi nastale videokamerom.

Iz teksta u video

Osim što je riječ o difuzijskom modelu, koji stvara slike iz nasumičnog šuma pa ih kroz milijune iteracija prilagođava željenom rezultatu, u ovaj model ugrađeni su i drugi dodaci. Prvo, tu je sustav dubokog razumijevanja teksta i interpretacije promptova, što mu omogućava stvaranje kompleksnih scena, likova, kao i zadržavanje stila i scene čak i u slučajevima kada se unutar videa mijenja kadar.

Nadalje, Sora ne samo da razumije što je u tekstualnom zadatku bitno, već je u stanju odvojiti glavni subjekt videa od pozadine, pa generirati oboje uz visoku razinu detalja. Interakcija među objektima na videu, pak, rezultat je ugrađenog fizikalnog modela, koji simulira uvjete u stvarnom svijetu.

Trenutačno Sora može stvarati video isječke u trajanju do jedne minute, a pristup joj imaju tek OpenAI-jevi testeri i nekolicina kreativaca. I sami kažu da je riječ o modelu još uvijek u razvoju, koji ima svojih nedostataka. Primjerice – nekada nije konzistentan u stvaranju kompleksnih scena i "ne razumije" uzrok i posljedicu. Osoba na videu tako može odgristi komad kolačića, a da nakon toga kolačić naizgled bude netaknut. Bez obzira na to sve, OpenAI je na svojim stranicama objavio niz "sirovih" isječaka, stvorenih modelom Sora, kako bi prikazali do koje razine je već sada on napredovao u stvaranju realističnih videa.

Model će polako biti puštan u javnost, uz sva moguća sigurnosna ograničenja. Nemoguće je, kažu autori Sore, predvidjeti sve načine na koje bi ovakav alat mogao pomoći, ali i odmoći čovječanstvu. Mnogo toga naučit će se kroz njegovo korištenje u stvarnim uvjetima, pa će na temelju naučenoga nastajati i sigurnosne odrednice Sore. Istodobno će od umjetnika, filmaša i dizajnera organizacija prikupljati povratne informacije o tome kako dalje razvijati model, da bi on postao što korisniji.

(Svi isječci unutar ovog teksta su dijelom OpenAI-jevog demo prikaza rada Sore i nastali su isključivo iz tekstualnih promptova, a prikazani su bez modifikacija).

Vezano

📢 Uštedi

Laptop ASUS VivoBook 15

Sniženo

449,99€ ~~489,99€~~ Kupi

📢 Uštedi

HONOR Magic 7 Lite

Uhvati priliku

349,99€ ~~399,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

14,99 € ~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

📢 Otkrij

Računalo LINKS Multimedia

Saznaj više

749,99€ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Gaming G915

Uhvati uštedu

179,99€ ~~229,99€~~ Kupi

📢 Uštedi

Miš LOGITECH Gaming G402

Akcija -43%

39,99 € ~~69,99 €~~ Kupi

📢 Uštedi

E-Book Reader KOBO

Vrući popust

169,99 € ~~199,99 €~~ Kupi

Zadnji komentari na forumu

Cryogenic 18. veljače 2024.

Stvarno impresivno. A vezano za AI influencere pokušao sam iz zajebancije napravit AI influencera na Instagramu, https://www.instagram.com/eleanor_sinclair26/, nazvao sam je Eleanor, sav sadržaj na slikama je AI generated, od lica backgrounda, kose, svega. Koristio sam face swap da n...

rooswelt1991 18. veljače 2024.

Imam osjećaj dok dođe prvi film, da će glumci početi još žešće prosvjedovati. S druge strane, zamislite situaciju gdje uploadas knjigu, kažeš gptu da napravi scenarij, ispravis šta ti se ne sviđa, i napraviš film. Već vidim da će se nastati hrpa ai film "studija".

guslac 18. veljače 2024.

Meni nije čudno da neće trebati glumce, nego mi je čudno da netko uopće treba porniće.

Ovo je kraj 16. veljače 2024.

Ja čekam interaktivan PornAI s generatorom videa... oh fantazije su već počele vrludati!

BarbaVeli 16. veljače 2024.

Čekamo prvi holivudski film by Sora. Živimo u zanimljivom vremenu. Mašta postaje sve stvarnija. Meni i dalje nije jasno kako su u svemu tome uspjeli. Ako su mogli napraviti tako realne scene, onda će brzo riješiti i ove uzročno-posljedične veze pri generiranju videosadržaja.

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

50th Anniversary Limited Edition.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC monitor s Falcon B110 wooferom i T27 visokotoncem, 70Hz–20kHz, 15Ω, 82.5dB, 50–80W, Golden Madrone furnir, dimenzije 305 x 190 x 165 mm.

3.439,00 € ~~4.299,00 €~~ Akcija

Iznimne performanse i svestranost.

Akcija

PARASOUND JC3+ phono pretpojačalo

Frekvencijski raspon: 20 Hz - 20 kHz, +/- 0.2 dB, THD: < 0.01% at 1 kHz, SNR, MM > 87 dB, input shorted, IHF A-weighted > 78 dB, input shorted, unweighted

3.822,00 € ~~4.778,00 €~~ Akcija

Next Generation HDI™ valovod.

Akcija

JBL Stage 250B

5.25" poliselulozni woofer, 1" anodizirani aluminijski visokotonac s HDI™ horna valovodom, 2-smjerni sustav, skretnica na 1.7kHz, frekvencijski odziv 50Hz–25kHz (±6dB), osjetljivost 86dB, impedancija 6Ω, preporučena snaga pojačala 20–150W, bass-reflex kućište s otvorom straga

349,30 € ~~499,00 €~~ Akcija

Savršen za srednje i velike sobe.

Akcija

ACOUSTIC ENERGY AE309

2.5-sistemski zvucnici sa 130mm mid-bass jedinicama i 28mm aluminijskim visokotoncem, frekvencijski raspon 38Hz -30kHz, osjetljivost 89dB, vršni SBL 115dB, snaga 175W, crossover frekvencija 296Hz / 2.56kHz, impedancija 6 ohma.

1.189,00 € ~~1.399,00 €~~ Akcija

Aktivni zvučnik s Bluetooth aptX i NFC povezivanjem.

Akcija

WHARFEDALE DS1

100 mm bas i 20 mm visokotonac, pojačanje 7W RMS / 14W max, frekvencijski odziv 55Hz–20kHz (±3dB), osjetljivost linijskog ulaza 350mV, kontrole za glasnoću, izvor i uparivanje, 3,5 mm ulaz.

175,00 € ~~232,26 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II