UC Berkeley Sky-T1 - umjetna inteligencija dostupna javnosti
Istraživački tim Sky Computing Laba na Sveučilištu UC Berkeley objavio je model umjetne inteligencije Sky-T1-32B-Preview, namijenjen složenim analitičkim zadacima, a može se obučiti uz trošak manji od 450 dolara. Kako se ovakvi modeli uspoređuju s modelima zatvorenog koda OpenAI-ja, Googlea i Microsofta?

Sky-T1-32B-Preview, koji je razvio Istraživački tim Sky Computing Laba na Sveučilištu UC Berkeley postiže rezultate usporedive s ranim verzijama OpenAI-jevog modela o1 pri testiranju analitičkih sposobnosti i programiranja. Tim NovaSky je javno objavio sve komponente potrebne za razvoj modela: težinske vrijednosti, podatke za obuku i izvorni kod.
Lančano povezivanje misaonih procesa
Model koristi arhitekturu s 32 milijarde parametara, što se pokazalo optimalnim za lančano povezivanje misaonih procesa (Chain of Thought, CoT). Testiranja manjih modela sa 7 i 14 milijardi parametara nisu dala zadovoljavajuće rezultate. Za početnu obuku korišten je Alibabin model QwQ-32B-Preview, dok je dodatno usavršavanje provedeno pomoću OpenAI-jevog GPT-4o-mini modela. Obuka je izvedena na skupini od osam Nvidia H100 grafičkih procesora tijekom 19 sati.
U usporednim testiranjima, Sky-T1 ostvaruje bolje rezultate od rane verzije modela o1 na testovima MATH500 i LiveCodeBench, no slabije rezultate na testu GPQA-Diamond. Time se potvrđuju njegove prednosti u matematici i programiranju u odnosu na općenita znanstvena pitanja.
Stanje modela otvorenog koda
Projekti poput Metinog sustava Llama i sustava Stable Diffusion tvrtke Stability AI, zajedno s inicijativama kao što je Hugging Faceov repozitorij modela, omogućili su široj zajednici sudjelovanje u istraživanju umjetne inteligencije. Ti se modeli mogu slobodno upotrebljavati, prilagođavati i distribuirati, što je dovelo do stvaranja ekosustava u kojem i manje organizacije i pojedinci mogu koristiti najnapredniju tehnologiju. Modeli otvorenog koda, poput sustava DeepSeek-v3 i novoobjavljenog Sky-T1-32B-Preview, pokazuju napredak te smanjuju razliku u odnosu na zatvorene modele u područjima kao što su rasuđivanje, programiranje i specifične primjene. Troškovi treniranja tih modela znatno su se smanjili, kao sustav Sky-T1-32B-Preview za manje od 450 dolara, čime razvoj umjetne inteligencije postaje dostupan većem broju istraživača.
Usporedba s modelima zatvorenog koda
Modeli zatvorenog koda, poput onih koje razvijaju OpenAI, Google i Microsoft, mogu i dalje imati prednost u određenim aspektima izvedbe zbog svojih vlasničkih optimizacija. Međutim, ta se razlika postupno smanjuje. Modeli otvorenog koda postaju sve konkurentniji, posebice u specijaliziranim zadacima. Transparentnost otvorenih modela u pogledu programskog koda, podataka i težinskih vrijednosti gradi povjerenje i omogućuje zajednički nadzor, što nije moguće kod zatvorenih modela koji su netransparentni.
Otvoreni modeli nude veću prilagodljivost specifičnim potrebama, dok zatvoreni modeli, iako korisnički pristupačni putem API-ja, ograničavaju tu fleksibilnost. Sigurnost i privatnost predmet su rasprave; modeli otvorenog koda mogu se pregledavati radi otkrivanja ranjivosti, ali njihova sigurnost ovisi o zajednici. Zatvoreni modeli mogu bolje štititi podatke, no mogu skrivati neotkrivene ranjivosti.