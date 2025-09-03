EPFL, ETH Zurich i Švicarski nacionalni superračunalni centar predstavili su Apertus, veliki višejezični model koji podržava više od 1000 jezika

Početkom srpnja EPFL, ETH Zurich i Švicarski nacionalni superračunarski centar CSCS najavili su veliki jezični model Apertus, koji je sad postao javno dostupan kao prvi potpuno otvoreni i transparentni višenamjenski jezični model iz Švicarske. Ovaj model, obučen na impresivnih 15 bilijuna tokena, podržava više od 1000 jezika, a među njima i dosad nedovoljno zastupljeni švicarski njemački i retoromanski.

Model koristi novu xIELU aktivacijsku funkciju i obučen je od nule pomoću AdEMAMix optimizatora

Apertus je jedinstven po potpunoj otvorenosti korisnicima koji slobodno mogu pristupiti cjelokupnom procesu razvoja, uključujući arhitekturu, težine modela, izvore podataka i proceduru treniranja. Model je dostupan u dvije veličine, s osam i 70 milijardi parametara, i otvorenog je koda pa se može koristiti u obrazovanju, istraživanju i komercijalnim projektima.

Dostupan i transparentan, Apertus, kažu njegovi tvorci, služi kao primjer kako AI može postati javna infrastruktura, od chatbotova, preko sustava za prevođenje, do obrazovnih alatia. Model se lako koristi i prilagođava kroz platforme poput Swisscoma, Hugging Facea i javnog AI servisa Public AI.