GPT 4.1 u tri varijante, milijun tokena konteksta i ekonomičniji od GPT-a 4.5

OpenAI je predstavio novu obitelj modela GPT-4.1, koja donosi kontekstni prozor od 1 milijun tokena. Nova obitelj uključuje tri modela: GPT-4.1, GPT-4.1 mini i GPT-4.1 nano

Drago Galić utorak, 15. travnja 2025. u 18:09

Prema OpenAI-u, ovi modeli nadmašuju GPT-4o u nekoliko ključnih područja, ali će biti dostupni samo putem razvojnog API-ja, ne u korisničkom sučelju ChatGPT-a. Kontekstni prozor od 1 milijun tokena omogućuje obraditi oko 3.000 stranica teksta u jednom razgovoru, što je na razini Googleovog Geminija. Istovremeno, tvrtka je najavila umirovljenje modela GPT-4.5 Preview u API-ju do srpnja 2025., dok će u ChatGPT-u zasad ostati dostupan.

Iako „manjeg“ verzijskog broja , 4.1 je napredniji od verzije 4.5. OpenAI pozicionira GPT-4.1 kao jasno unapređenje u odnosu na GPT-4o, posebno u kodiranju i praćenju složenih uputa, iako GPT-4.1 ne spominje mogućnosti audio ulaza ili izlaza, fokusirajući se na tekstualne i slikovne ulaze s tekstualnim izlazom.

 GPT-4.1 postiže bolje rezultate na SWE-bench testu za kodiranje (54,6% naspram 38,0%), ali OpenAI-jevi podaci pokazuju da je GPT-4.5 i dalje bolji na testovima akademskog znanja, praćenju uputa i zadacima vezanim uz vid.

Ipak, GPT-4.1 košta 2$ po milijunu tokena za ulaz i 8$ po milijunu tokena za izlaz, što je 26% jeftinije od GPT-4o. GPT-4.1 mini ima cijenu od 0,40$ za ulaz i 1,60$ za izlaz, dok GPT-4.1 nano košta samo 0,10$ za ulaz i 0,40$ za izlaz po milijunu tokena.

Za usporedbu, cijene GPT-4.5 bile su astronomske - 75$ po milijunu ulaznih tokena i 150$ po milijunu izlaznih tokena. Dakle, 4.1 je nadogradnja u odnosu na 4o koja gotovo odgovara 4.5, ali košta daleko manje.

Kako je ovaj  sustav dostupan samo kao programerski API, a ne kao internetski servis za korisnike, dobivaju se dva odvojka razvoja: za programere koji dobivaju specifične, dosljedne modele s jasno definiranim mogućnostima, dok redovni korisnici ChatGPT-a dobivaju jedan model koji se mijenja iza kulisa postupnim ugrađivanjem poboljšanja iz drugih modela.