OpenAI DALL·E 2 - Veliki majstor digitalne likovne umjetnosti
Na sâm spomen generatora slika od unesenoga teksta, većina će bez imalo razmišljanja spomenuti upravo DALL·E. Riječ je o latentnom difuzijskom modelu, koji je u stanju, na temelju jednostavnoga teksta, generirati neočekivano dobre slike, pa ni ne čudi da su mnogi jedva dočekali da DALL·E postane dostupan svima, i da se uklone liste čekanja, a upravo to dogodilo se krajem rujna prošle godine…

Prije nego što uopće počnemo nešto konkretnije demistificirati kako DALL·E zapravo radi, valja napomenuti da je riječ o komercijalnom servisu i modelu, a to znači da se u konačnici mora plaćati za generiranje slika. Otkad su krajem rujna prošle godine konačno uklonjene liste čekanja, sada svatko može otvoriti korisnički račun i početi eksperimentirati s tim rješenjem za generiranje digitalne umjetnosti, koje se temelji na latentnom difuzijskom modelu (dostupan je i API). Inicijalno se dobiva 50 kredita za generiranje slika, a nakon što ih se potroši, potrebno je kupovati dodatne kredite za nastavak generiranja (115 kredita stoji 15 dolara). Samo korištenje servisa prilično je jednostavno, a nakon što se prijavi u online laboratorij, dovoljno je upisati tekst s opisom onoga kakva se slika želi generirati, i kliknuti na gumb Generate, nakon čega će vrlo brzo biti generirane i prikazane četiri slike. Svaku od njih dalje je moguće uređivati (čak i dodavati nove elemente na postojeće slike), izvoditi varijacije i proširivati (outpainting). Zapravo, čitava je stvar toliko dobra i zabavna da će se onih 50 inicijalnih besplatnih kredita vrlo brzo potrošiti, a to svakako valja imati na umu, jer ako se ne žele kupovati dodatni krediti, onda će se samo moći pregledavati kreacije modela koje su inicirali drugi korisnici. No, kako DALL·E uspijeva biti toliko dobar u generiranju digitalne likovne umjetnosti?