Umjetna inteligencija sada može stvoriti i digitalne 3D modele

Googleovi stručnjaci za umjetnu inteligenciju nadogradili su sustav koji stvara ilustracije na temelju teksta tako da je on u stanju kao rezultat izbaciti i trodimenzionalni model

Sandro Vrbanus ponedjeljak, 3. listopada 2022. u 11:50

Googleov text-to-image difuzijski model Imagen, koji je treniran tako da prepoznaje naredbe zadane prirodnim jezikom te iz njih stvara fotorealistične ilustracije, dobio je nadograđenu verziju. Njezino ime je DreamFusion, a na temelju istih podataka za treniranje sada može kao rezultat izbaciti trodimenzionalni model "izmaštanog" objekta. Kao i kod ostalih sustava slične namjene, koji tekst pretvaraju u slike ili video, i kod ovog modela sve što trebate učiniti jest opisati ono što želite dobiti, a Googleova umjetna inteligencija odradit će ostalo.

3D iz 2D

Zanimljivo je da sustav nije trebalo posebno trenirati na 3D modelima, već se za dobivanje trodimenzionalnog rezultata koriste dvodimenzionalni renderi iz više uglova, koje sustav potom spaja u 3D model. Tako dobiven model moguće je razgledati sa svih strana, mijenjati mu osvjetljenje ili ga ugraditi u neku veću 3D scenu. Neke primjere rezultata ovako dobivenih 3D ilustracija možete pogledati na stranicama projekta, prije nego on postane javno dostupan.

Dodatnu korist ovom sustavu daje i činjenica da je generirane modele moguće izvesti u obliku pogodnom za korištenje u softverima za 3D modeliranje. Tamo ih se može doraditi, obraditi i modificirati, a odatle ih potom i ispisati na 3D pisaču.