OpenAI upravo predstavio GPT-4o (kombinira tekst, kameru i govor) i osvježeno desktop sučelje

OpenAI je danas predstavio niz značajnih nadogradnji za svoju platformu ChatGPT, uključujući novi model pod nazivom GPT-4o, desktop verziju popularne aplikacije te senzacionalnog glasovnog asistenta

Ivan Podnar ponedjeljak, 13. svibnja 2024. u 21:10
Mira Murati, CTO OpenAI-ja,  predstavlja novosti i nadgradnje
Mira Murati, CTO OpenAI-ja, predstavlja novosti i nadgradnje

CTO OpenAI-ja, Mira Murati, otvorila je streaming događaj raspravom o fokusu kompanije na izradi proizvoda koji su lakši za korištenje "gdje god se nalazite". To uključuje i osvježeno korisničko sučelje za desktop aplikaciju ChatGPT (trenutno dostupno samo za MacOS).

GPT-4o: Inteligencija razine GPT-4 za sve

GPT-4o (o se izgovara kao slovo, ne kao broj) je najnoviji model iz OpenAI-jeve obitelji GPT, koji nudi inteligenciju razine GPT-4 svim korisnicima, uključujući i one na besplatnoj verziji ChatGPT-a. GPT-4o dostupan je u besplatnoj verziji ChatGPT-a počevši od danas, a pretplatnicima OpenAI-jevih premium ChatGPT Plus i Team planova s "5x većim" kapacitetom odgovora.

"Važan dio naše misije je dostupnost naših naprednih AI alata i da budu besplatni", rekla je Murati. Možda je ta izjava bila i skriveni odgovor Elonu Musku koji je tužio i kritizirao komercijalizaciju OpenAI.

Glasovni asistent nove generacije

Jedan od najimpresivnijih aspekata novih nadogradnji je ChatGPT Voice, koji omogućuje korisnicima interakciju s AI modelom kroz govor. Glas je bio toliko prirodan, da se lako moglo posumnjati da to ne govori stroj već skrivena osoba, negdje iza panela. Model može razumjeti i generirati govor u realnom vremenu, otvarajući nove mogućnosti za interakciju s AI-jem. U svakom  trenutku, može se prekinuti a ne samo dati naredbu i čekati sekundu dvije do odgovora. Ovako, konverzacija je prirodna, kao razgovor dvoje ljude. Novi model može odgovoriti na audio upite korisnika "za samo 232 milisekunde, s prosjekom od 320 milisekundi, što je slično vremenu ljudskog odgovora u razgovoru."

U jednoj od demonstracija, znastvenik OpenAI-a, Mark Chen, je teško disao u mobitel i dobio je savjete o poboljšanju tehnika disanja. Asistent je čak prepoznao da korisnik "nije usisivač", pokazujući razinu razumijevanja i konteksta koji je rijetko viđen u AI sustavima. 

„Gledanje“ i  prevođenje

Novi ChatGPT također "vidi" kroz kameru na vašem telefonu. To se može koristiti za razne zadatke, kao što je rješavanje jednadžbi ili prevođenje teksta.

U jednoj od demonstracija, ChatGPT-u je pokazana jednadžba napisanu na komadu papira te ga je demonstrator zamolio da mu pomogne u rješavanju. AI nije samo dao odgovor, već je ponudio i savjete i korak po korak vodio korisnika kroz rješenje.

ChatGPT Voice se također može koristiti kao alat za prevođenje uživo, pretvarajući govor iz jednog jezika u drugi u realnom vremenu što će biti od neprocjenjive vrijednosti za turiste i poslovne ljude. ChatGPT sada podržava više od 50 jezika uključujući hrvatski.

Impresivno je bilo gledati kako ChatGPT "gleda" napisani kod i korisniku objašnjava što je napisano. Mogućnosti "vida" mogu ne samo analizirati matematiku na listu papira i ponuditi savjete umjesto potpunih odgovora ako želite, već riješiti složene probleme kodiranja putem dijeljenja zaslona te analizirati i objasniti detaljne grafikone.