DALL·E 3 bolje razumije promptove, zahvaljujući ChatGPT-u

OpenAI predstavio je svoj novi sustav za generiranje ilustracija, koji koristi snagu jezičnog modela da bi bolje razumijevao zadatke i pretvarao ih u još bolje, preciznije i detaljnije digitalne slike

Sandro Vrbanus petak, 22. rujna 2023. u 09:13

Organizacija OpenAI izišla je u javnost s prvim pojedinostima vezanima za njihov popularni sustav za stvaranje digitalne umjetnosti, DALL·E. Treća verzija ovog alata najavljena je za sada u obliku istraživačkog previewa, a opisana kao veliko unaprjeđenje, primarno u pogledu razumijevanja onoga što korisnik želi.

Moderni sustavi za pretvaranje teksta u sliku, primijetili su iz OpenAI-ja, često ignoriraju pojedine riječi ili opise, što korisnike tjera na dodatno "igranje" s promptovima učenje procesa kako napisati bolji i precizniji zadatak za svaki od tih sustava. DALL·E 3 će tome doskočiti tako što će iskoristiti moć velikog jezičnog modela, ChatGPT, koji je nastao pod istim krovom OpenAI-ja.

Kraćim uputama do boljih rezultata

U simbiozi, ova će dva modela dati daleko bolje, preciznije i detaljnije rezultate, barem ako je vjerovati prvim objavljenim primjerima. Jednom kada korisnik napiše svoj zadatak, prvo će jezični model učiniti ono za što je specijaliziran – protumačit će napisani tekst. Potom će samostalno "prevesti" korisnikov zadatak u niz promptova, koji će biti prilagođeni za sustav DALL·E 3 te ga proslijediti njemu na daljnju obradu.

Isti prompt: lijevo DALL·E 2, desno DALL·E 3 (An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula)

No, dobijete li sliku koja vam nije potpuno u skladu sa zamislima, moći ćete je jednostavnim naputkom (kao što se to može učiniti s odgovorima ChatGPT-a) usmjeriti u željenom pravcu te lako izraditi njezine varijacije. Svime ovime ChatGPT postaje partner u "brainstormingu" i daje korisnicima veću kreativnost, a prema viđenome razumijevanje promptova u sustavu DALL·E 3 moglo bi nadmašiti i trenutačnog lidera po tom pitanju, sustav Midjourney v5.

Značajna poboljšanja

Prema prvim objavljenim primjerima, vidljiv je i značajan napredak po pitanju manipuliranja tekstom. Tako će ubuduće biti moguće zadati tekst, koji želimo dobiti ispisan na ilustraciji, a novi DALL·E će ga integrirati u sliku onako kako je i napisan (a ne, kao do sada, ispisati tek škrabotine koje su podsjećale na tekst).

Načinjeni su i pozitivni pomaci kad je riječ o autorskim pravima ljudskih umjetnika, na čijim je djelima sustav treniran. Treća verzija ovog alata odbijat će zahtjeve za stvaranjem ilustracija u stilu nekog živućeg umjetnika, a svima je omogućeno zatražiti da se njihova djela ne koriste prilikom treniranja umjetne inteligencije. Neće biti moguće stvoriti niti lažne slike slavnih osoba, a i dalje na njemu nema sadržaja koji bi poticao mržnju, nasilje ili bio seksualno eksplicitan. Organizacija radi i na novim alatima za prepoznavanje AI generiranih slika, pa već imaju interni alat koji može otkriti one slike, koje je izradio DALL·E 3.

DALL·E 3🤝ChatGPT pic.twitter.com/90ITkUAln2
— OpenAI (@OpenAI) September 21, 2023

DALL·E 3 će biti javno dostupan početkom listopada, ali samo za korisnike koji plaćaju ili ChatGPT Plus ili Enterprise pretplatu za OpenAI-jeve sustave. Kao i kod prethodne verzije, sve kreacije koje nastanu uz pomoć novog AI ilustratora u potpunosti su u vlasništvu samog korisnika i besplatno ih se te bez ikakve zadrške smije koristiti, pa i u komercijalne svrhe.

Vezano

📢 Uštedi 130€

ASUS VivoBook 15 OLED

Savršen za obavljanje svakodnevnih zadataka!

669,99€ ~~799,99€~~ Kupi

📢 Uštedi do 30%

Trust periferija

Uživaj u besprijekornoj igri i radu!

Od 18,99€ Kupi

📢 Uštedi 15%

WACOM One 12

Za sigurno održavanje opreme!

379,99€ ~~449,99€~~ Kupi

Zadnji komentari na forumu

ZovemseZoranidolazimizRijeke 22. rujna 2023.

Ne znam, koristim Stable Diffusion XL preko stranice dreamstudio, pokazao se trenutačno kao vrlo dobar za ono što meni treba. Dolazimo u vrijeme kada će i midjourney i sd i dalle napraviti isti posao, te će razlike u velikoj većini biti minorne, niti lošije niti bolje, nego drugačije.Cije...

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Unikatni Folded Motion visokotonac.

Preporuka

MARTIN LOGAN Motion Foundation B1

Dvosustavski bookshelf, Frekvencijski raspon: 48 Hz - 23 kHz ± 3 dB, Snaga pojačala 15 - 100 watts, Osjetljivost: 89 dB, Impedancija: 5 ohms

809 € Kupi

Dizajnirani za audiofile, stvoreni za glazbu.

Akcija

REVEL Concerta2 M16 zvučnici

Preporucena ulazna snaga 50-120W, osjetljivost 86dB, nominalna impedanca 6Ohma, frekvencijski raspon 50-20,000Hz

799 € ~~1.189 €~~ Kupi

Audio elegancija u vašem domu.

Akcija

KEF Q150 stereo zvučnici

Preporucena ulazna snaga 10-100W, osjetljivost 86dB, nominalna impedanca 8 Ohma,frekvencijski raspon 63-28,000Hz

369 € ~~499 €~~ Kupi

Inovativni Uni-Q driver.

Akcija

KEF Q750 zvučnici

Preporucena ulazna snaga 15-150W, osjetljivost 88dB, nominalna impedanca 8 Ohma,frekvencijski raspon 42-28,000Hz,

1.039 € ~~1.389 €~~ Kupi

Čisti i precizan zvuk posvuda.

Akcija

KEF Mu7 over-ear slušalice

Aktivno poništenje buke, Bluetooth, baterija 40 sati, USB-C kabel za punjenje, audio 3.5 mm kabel

299 € ~~399 €~~ Kupi

Novorazvijeni driveri od karbonskih vlakana.

Akcija

ACOUSTIC ENERGY AE500 zvučnici

Snaga opterećenja 120w, osjetljivost 87dB, Peak SPL: 113dB, Impedancija: 6 ohm, crossover frekvencija: 2.8kHz

1.020 € ~~1.200 €~~ Kupi

Više od 100 sati bežicne reprodukcije.

Novo

MARSHALL Major V slušalice

Slušalice sa zatvorenim stražnjim dijelom s poklopcima slušalica ojacanim celikom za slušanje bez ometanja Referentni 42 mm koso postavljeni pretvaraci s dijafragmom od 38 mm.

149 € Kupi

Elegantan i suptilan.

CAMBRIDGE AUDIO CXA81 pojačalo

Integrirano pojačalo snage 80W RMS (8 ohma), ESS Sabre DAC ES9016K2M, frekvencijski odziv <5Hz– 60kHz +/-1dB, analogni audio ulazi: 1x balanced XLR, 4 x RCA, digitalni audio ulazi 1 x S/PDIF coaxial, 2 x TOSLINK optical, 1 x USB audio, Bluetoot

1.259 € Kupi

Visoka rezolucija u svakom detalju.

NAD C 658 pretpojačalo

BluOS mrežni streaming s MQA dekodiranjem, ESS Sabre DAC, Dirac Live korekcija prostorije, Gigabitni Ethernet, Dvopojasni Wi-Fi 5 802.11ac, Dvosmjerni Qualcomm aptX HD Bluetooth

1.989 € Kupi

Uđite u svijet High Fidelity zvuka.

Best Buy

KEF LSX II aktivni zvučnici

Output power: LF: 70W, HF: 30W, frekvencijski raspon (±3dB) measured at 85dB/1m 54Hz – 28kHz, AirPlay 2 Google Chromecast, Roon Ready, UPnP Compatible, Bluetooth 5.0

1.389 € Kupi

Hi-Res streaming i multiroom izvedba.

Best Buy

BLUESOUND NODE audio streamer

Ethernet, Wi-Fi 5 802.11ac; Podržani audio formati: MQA, MP3, AAC, WMA, OGG, FLAC, ALAC, WAV, AIFF; Apps: BluOS Controller ; Priključci: 1 x LAN Ethernet, 2 x USB-A, 1 x TOSLINK, 1 x koaksijalni digitalni, 1 x analogni ulaz, 1 x subwoofer izlaz, 1 x IR ulaz, 1 x 12V trigger ulaz/izlaz

650 € Kupi

Preporučamo

Premium

Naš best buy izbor iz trenutnih akcijskih ponuda

Vodič za kupnju televizora: OLED ili LED, novi ili stariji model na akciji?

Bug.hr 2. lipnja 2024.

Trenutno najpovoljnije cijene na tržištu

Vezano

Umjetna inteligencija

Na svoj način

WWDC 2024: Apple "oteo" kraticu AI, pa ona za njih znači Apple Intelligence

Sandro Vrbanus ponedjeljak 9

App dana

Umjetna inteligencija

Private AI - praktična aplikacija za lokalno pokretanje i interakciju s velikim jezičnim modelima

Matija Gračanin 7. lipnja 2024.

Biznis

Hitachi i Google Cloud objavljuju strateško partnerstvo za Gen AI

debug.hr 5. lipnja 2024.

Apple

PRIČA SE

Apple će, izgleda, početi opsežnije koristiti OpenAI-jevu tehnologiju

Mreža 4. lipnja 2024.

Premium

Uvodnik

Spašavanje vojnika juniora

Miro Rosandić 31. svibnja 2024.

Umjetna inteligencija

OpenAI: Novi model umjetne inteligencije, novi Odbor te napuštanje razvoja superinteligencije

Ivan Podnar 29. svibnja 2024. 5