DeepSeek se s AI modelom Janus Pro-7B suprotstavlja OpenAI-jevom DALL-E 3

Kineska AI tvrtka DeepSeek objavila je svoj najnoviji model otvorenog koda, Janus Pro-7B, koji može istovremeno stvarati i analizirati slike, čime izravno konkurira vodećim platformama poput OpenAI-jevog DALL-E 3

Ivan Podnar utorak, 28. siječnja 2025. u 09:04
Janus-Pro-7B  📷 DeepSeek
Janus-Pro-7B DeepSeek

DeepSeek je svoj novi model Janus Pro-7B objavio na platformi Hugging Face i na GitHubu pod MIT licencom, kao otvoreni kod, uz mogućnost besplatnog korištenja u komercijalne svrhe.

Janus Pro-7B temelji se na posebnom autoregresivnom sustavu koji omogućuje dvosmjernu obradu slika - njihovu analizu i stvaranje. Modeli iz ove obitelji imaju između 1 i 7 milijardi parametara. Najveći među njima, Janus Pro-7B, pokazao se boljim od DALL-E 3 i drugih poznatih modela kao što su PixArt-alpha, Emu3-Gen te Stability AI-jev Stable Diffusion XL. To potvrđuju rezultati testiranja na standardnim mjerilima GenEval.

Usporedba inicijalnog modela s modelom Janus Pro 📷 DeepSeek
Usporedba inicijalnog modela s modelom Janus Pro DeepSeek

U području generiranja slika iz teksta, na GenEval testu koji mjeri točnost praćenja uputa pri stvaranju slika, Janus-Pro-7B postigao je rezultat 0,80, što je značajno bolje od DALL-E 3 rezultata koji iznosi 0,67. DeepSeek pritom tvrdi da njihov model nadmašuje DALL-E 3 i na GenEval i na DPG-Bench testovima.

Što se tiče multimodalne obrade, Janus-Pro-7B pokazao je odlične rezultate s ocjenom 79,2 na MMBench testu, koji procjenjuje sposobnost razumijevanja više vrsta podataka istovremeno. Model Janus-Pro-7B ističe se stabilnijim generiranjem slika s više detalja, boljim procesom treniranja i kvalitetnijim podacima.