Objavljen je novi GenAI model za ilustracije, Stable Diffusion 3, s boljim prikazom teksta

Alati za izradu ilustracija na temelju tekstualnih opisa vrlo brzo napreduju, a svakom novom iteracijom donose poboljšanja u određenom segmentu. Kod Stable Diffusiona poboljšan je prikaz tipografije

Sandro Vrbanus četvrtak, 13. lipnja 2024. u 16:02

Startup Stability AI službeno je lansirao svoj novi difuzijski model za generiranje ilustracija iz tekstualnih zadataka, Stable Diffusion 3. Najnapredniji je to otvoreni "text-to-image" model na svijetu, potvrdilo je istraživanje, u kojem su ispitanici rezultate tog modela proglasili boljima od onih kod, primjerice, sustava DALL·E 3 ili Midjourney v6. Posebno se novi SD3 ističe kad je riječ o preciznom praćenju zadataka napisanih u "promptu" te tipografiji, odnosno prikazu teksta na sintetiziranim ilustracijama.

Kompaktan i moćan

Model SD3 zasnovan je na 8 milijardi parametara, a samim time može ga se izvoditi na standardnim korisničkim računalima i grafičkim karticama, a ne samo na moćnim računalima i poslužiteljima u oblaku. Njegovi tvorci ističu da kao takav, SD3 može stati u 24GB VRAM-a kartice RTX 4090, gdje mu za generiranje ilustracije veličine 1.024x1.024 piksela u 50 iteracija treba tek 34 sekunde.

No, model će biti dostupan u više varijanti, veličine od 800 milijuna do 8 milijardi parametara. Od svih njih, trenutačno je za preuzimanje dostupan model Stable Diffusion 3 Medium, s 2 milijarde parametara, ali i dalje vrlo sposoban u izradi ilustracija.

Nova arhitektura modela posebnu je pozornost posvetila preciznom praćenju zadataka, pa će se na ilustracijama moći istaknuti više točnije iscrtanih detalja, tekst će biti ispisan točno i u tipografiji prema zahtjevu korisnika, uz zadržavanje visoke kvalitete slike i fleksibilnost kod kreiranja "promptova". Stability AI poručuje da će isti pristup kreiranju modela moći biti preslikan i na multimodalne alate, primjerice na modele za generiranje videa.

Vezano

Zadnji komentari na forumu

Damir22 18. lipnja 2024.

Evo, nije dugo trajalo... Nakon pocetkog haj'pa, sve ce se izgleda svesti na pa pa.... Elem, kako sluzbena prica ide, svi, pa i njihove bake panicno banaju SD3, brisu modele, brisu slike generirane.... shvatili ste, nesto kao armagedon, jerbo, licence koji dolazi u novoj verziji je blago r...

Damir22 14. lipnja 2024.

Bug rulez?

Damir22 14. lipnja 2024.

Ne znam kome placas "sdxl", vjerovatno si mislio na neku pretplatu negdje, pa onda tamo generiras slike... Jacina graficke kartice nema nikakve veze s kvalitetom generirane slike, niti artefaktima, niti icime, jedino ima veze s vremenom potrebnim za generiranje slike. Takodjer, svi trenutni sta...

encoding 14. lipnja 2024.

koliko jak gpu treba za to upogonit lokalno? jel se može postić neka solidna kvaliteta generiranih slika npr bez artefakata il je i dalje bolje platit SDXL ?

Damir22 14. lipnja 2024.

zaboravi na sd3, za sada.... trebat ce tu puno rafiniranja, destiliranja, merdjanja dok to ne postane upotrebljivo. da, generira text, hit and miss, nista bolje nego neki stabilni sdxl modeli. problem je sto sve ostalo generira losije, anatomija mu je potpuna nepoznanica, ne samo ljudska,

Sniženje do -40%

Vrhunski hi-fi zvuk uz najbolje popuste!

Za potpuni doživljaj i profesionalno savjetovanje, posjetite našu Ronis slušaonicu na Velesajmu i osobno isprobajte Hi-Fi sustave uživo!

Kupi

Uni-Q driver s MAT™ tehnologijom.

Akcija

KEF Q7 Meta

Trosistemski bass-reflex zvučnik s Uni-Q driverom, frekvencijski raspon 39 Hz – 20 kHz, osjetljivost 87 dB, impedancija 4 Ω, preporučena snaga pojačala 15 – 200 W

1.279 € ~~1.599 €~~ Akcija

Donose pravi DALI Hi-Fi zvuk u svaki prostor.

Izbor kupaca

DALI KUPID Black Ash

Frekvencijski raspon: 63 – 25.000 Hz (±3 dB), osjetljivost: 83 dB, mominalna impedancija: 4 Ohma, Preporučena snaga pojačala: 40 – 120 W, Frekvencija skretnice: 2.100 Hz, Tip kućišta: Bass reflex

338 € Kupi

Uključena Pick it MM E zvučnica

PRO-JECT E1.2, , PICK IT, MM

Gramofon s elektroničkom promjenom brzine 33/45 o/min i remenskim pogonom, omjer signal/šum 65 dB, wow & flutter do ±0,23 %, ručka 218,5 mm / 7 g, potrošnja 4,5 W,

329 € Kupi

Spaja bezvremenski dizajn s vrhunskom akustičnom tehnologijom.

KEF Coda W Dark Titanium

Podržava Bluetooth 5.4 s aptX Adaptive i aptX Lossless, ima phono ulaz za gramofon, USB-C, AUX ulaz te izlaz za subwoofer, što omogućuje jednostavno proširenje sustava. Bilo da slušate streaming, vinil, s računala ili TV, sve se spaja izravno na zvučnike.

899 € Kupi

Visokoučinkovito pojačalo za streaming.

Bluesound PowerNode N331

Sa 100 W po kanalu, HDMI eARC priključkom i BluOS™ podrškom za više prostorija, spaja pravi HiFi doživljaj s modernom praktičnošću. Bilo da ga koristite za glazbu, filmove ili oboje, dizajniran je da pojednostavi vaš sustav bez kompromisa u kvaliteti zvuka.

1.049 € Kupi

Premium 32-bitni DAC

Izbor kupaca

WiiM Ultra

Mrežni audio streamer s DAC-om visoke rezolucije, podrška za streaming servise i lokalnu mrežu, Wi-Fi i Ethernet povezivanje, Bluetooth, HDMI ARC i analogni/digitalni ulazi i izlazi, upravljanje putem aplikacije i zaslona osjetljivog na dodir, kompaktne dimenzije i niska potrošnja energije.

399 € Kupi

Posjetite našu Hi-Fi slušaonicu.