Metin alat uz pomoć umjetne inteligencije stvara ilustracije iz skica i teksta

Make-A-Scene novi je sustav koji, korištenjem umjetne inteligencije, tumači zadatke postavljene mu prirodnim jezikom i u obliku jednostavne skice, pa iz njih stvara fotorealistične slike

Sandro Vrbanus nedjelja, 17. srpnja 2022. u 06:00

Nakon što se u javnosti pojavio sustav DALL-E 2, pa je Google predstavio svoj Imagen, sada i Meta predstavlja vlastito rješenje za stvaranje vizualizacija, ilustracija i kompozitnih slika uz pomoć umjetne inteligencije.

Za slučaj da vam treba podsjetnik, DALL-E 2 nastao je na temelju sustava umjetne inteligencije OpenAI, a u stanju je izraditi ilustracije na temelju zadanog mu teksta, i to u stilu u kojem korisnik želi. Googleov Imagen, pak, također razumije zadatke zadane prirodnim jezikom i pretvara ih u fotorealistične slike. I jedan i drugi sustav nisu u potpunosti dostupni širokoj javnosti zbog bojazni oko manipulacije njime, iako DALL-E 2 polako otvara vrata široj publici (uz neka ograničenja).

Stvara scenu iz skice

Na ova dva sustava, koji su fascinirali javnost, sada se nadovezuje i Meta sa svojim novim istraživačkim AI alatom, koji nazivaju Make-A-Scene. Njihova se umjetna inteligencija u radu oslanja na ulazne informacije u obliku vizualne skice i teksta, a izlazni proizvod su joj slike, kvalitetom usporedive s onima iz OpenAI-a i Googlea. Primjere možete vidjeti uz ovaj tekst.

Osnovna ideja Metinih stručnjaka jest da se Make-A-Scene koristi kao alat za brzo ilustriranje raznih publikacija, na način da njegovi vizualni uraci prate tekst, ali i u većoj mjeri zadovolje želje korisnika. Tako ovaj sustav traži od korisnika tekstualni opis scene koju treba "nacrtati", ali i jednostavnu vizualnu skicu rasporeda elemenata na finalnoj slici. To bi trebalo olakšati predviđanje finalnog rezultata, odnosno korisnik bi lakše dobio digitalnu ilustraciju kakvu je zamislio, umjesto da umjetna inteligencija "pogađa" što je on zapravo mislio i isporučuje iznenađujuće (ali, priznajmo, zabavne) slike.

Daljnji razvoj

Meta također navodi kako su svoj sustav dali na raspolaganje tek nekolicini umjetnika, za potrebe testiranja. Sustav u budućnosti neće biti namijenjen samo umjetnicima, već svima koji se žele vizualno izraziti, od djece do odraslih. No, kako bi Make-A-Scene mogao doći u ruke svima zainteresiranima, potrebno ga je dodatno razvijati i unaprjeđivati, poručili su iz Metinog AI laboratorija.

Žele ga učiniti potpuno intuitivnim, dati korisnicima kontrolu nad generiranim sadržajem, tj. stvoriti od njega kreativno okruženje u kojem će se moći stvarati novi vizualni komunikacijski sadržaj ili umjetnost. Najavljuju i kako će s time pokušati iskoračiti iz dvodimenzionalnog prostora u virtualne svjetove i proširenu stvarnost.