OpenAI i Tencent predstavili nove AI modele: GPT-4.5 i Hunyuan Turbo S

Gotovo svaki tjedan donosi najavu nekog novog velikog jezičnog modela, a danas imamo još jednu takvu vijest. Tehnološki giganti s obje strane Pacifika – iz SAD-a i Kine – guraju granice AI tehnologije sve dalje, predstavljajući modele koji su učinkovitiji, promišljeniji, komunikativniji
OpenAI je u San Franciscu predstavio GPT-4.5, svoj najnapredniji i najučinkovitiji AI model do sada. Ova najnovija iteracija nadograđuje se na prethodnika, GPT-4, uz poboljšanja u računalnoj učinkovitosti i konverzacijskim sposobnostima.
"Orion" - zadnji korak prije GPT-5
GPT-4.5, kojemu je interni kodni naziv "Orion", predstavlja kompanijin posljednji model bez tzv. lančanog razmišljanja (non-chain-of-thought) prije planirane unifikacije pod nazivom GPT-5. Model je trenutno dostupan kao istraživačka verzija pretplatnicima ChatGPT Pro usluge, a postupno uvođenje planirano je za Plus i Team korisnike sljedećeg tjedna, nakon čega slijede Enterprise i Education korisnici za otprilike dva tjedna. Jedan od najznačajnijih napredaka u GPT-4.5 modelu je dramatično poboljšanje računalne učinkovitosti. OpenAI tvrdi da je novi model više od 10 puta učinkovitiji od GPT-4, što bi moglo imati značajne implikacije za skalabilnost.
Emocionalna inteligencija bez multimodalnosti
Iako GPT-4.5 nije klasificiran kao model za rezoniranje, funkcionira u prirodnim razgovorima i emocionalnoj inteligenciji. Model pokazuje sposobnost interpretacije nijansiranog jezika, što ga čini prilagodljivijim stvarnim razgovorima, tehničkim upitima i kreativnom pisanju. Interni testeri navode da interakcija s GPT-4.5 djeluje prirodnije, pri čemu model pokazuje bolje razumijevanje korisničkih namjera i poboljšanu emocionalnu inteligenciju. GPT-4.5 podržava značajke poput web pretraživanja, prijenosa datoteka i slika te platformu za programiranje. Ipak, modelu nedostaju multimodalne mogućnosti poput glasovnog načina rada i razumijevanja videozapisa.
OpenAI navodi nedostatak GPU-a kao razlog za ograničeni početni pristup GPT-4.5 modelu, no kako se najavljuju nova ulaganja, to znači da će biti potrošeno dovoljno milijardi da i ovaj model može zasijati u punom sjaju.
Tencentov Hunyuan Turbo S je kineski odgovor na DeepSeek
Na drugoj strani zemaljske kugle, kineski tehnološki div Tencent predstavio je svoj najnoviji AI model, Hunyuan Turbo S i pozicionirao ga kao izravnog konkurenta DeepSeekovom R1 modelu. Tencentova nova ponuda dizajnirana je kao "model brzog razmišljanja", sposoban za gotovo trenutačne odgovore u roku od sekunde.
Brzo razmišlja, konkurira elitnim AI sustavima
Model Hunyuan Turbo S razlikuje se od modela "sporog razmišljanja" poput DeepSeek R1 tako što odmah započinje s odgovorom, koristeći kratak lanac razmišljanja sličniji ljudskoj intuiciji. To je spojeno s lancem sporog razmišljanja koji pruža sposobnosti rezoniranja za znanstvene, matematičke i racionalne odgovore. Tencent tvrdi da je Hunyuan Turbo S pokazao usporedive performanse s vodećim modelima na tržištu poput DeepSeek-V3, OpenAI-jevog GPT-4o i Anthropicovog Claudea u testovima iz matematike, rezoniranja i znanja. Tvrtka je pružila podatke koji pokazuju da se njihov Turbo S dobro natječe s DeepSeekovim V3 modelom u često korištenim AI evaluacijama.
Hibridna moć Mamba-Transformer arhitekture
Što se tiče arhitekture, Hunyuan Turbo S koristi hibridni Mamba-Transformer način spajanja, za koji Tencent tvrdi da je prva uspješna primjena Mamba arhitekture na vrlo veliki model "mješavine stručnjaka" (Mixture of Experts - MoE) bez gubitka performansi. MoE je je zanimljiva arhitektura neuronske mreže koja unosi element specijalizacije u AI modele. Ova arhitektura učinkovito smanjuje računalnu složenost tradicionalnih transformerskih struktura, smanjuje korištenje KV-cache memorije te snižava troškove treniranja i zaključivanja. Mamba obrađuje duže sekvence efikasnije, zahtijeva manje memorije i brža je. Transformer omogućuje bolje razumijevanje složenih odnosa između tokena. Hibridni pristup kombinira prednosti obje arhitekture.
Ključna značajka Hunyuan Turbo S modela je njegova isplativost. Tencent je značajno smanjio troškove implementacije modela, čineći ga ekonomski privlačnom alternativom za poslovanje i razvojne programere. Cijena unosa za Turbo S iznosi 0,8 juana (0,11 eura) po milijunu tokena, a cijena izlaza 2 juana po milijunu tokena, što je nekoliko puta niže od prethodne generacije Hunyuan Turbo modela.