Apertus: potpuno otvoren i transparentan LLM

EPFL, ETH Zurich i Švicarski nacionalni superračunalni centar predstavili su Apertus, veliki višejezični model koji podržava više od 1000 jezika

Mladen Smrekar srijeda, 3. rujna 2025. u 11:13
Švicarski Apertus je jedan od najvećih otvorenih LLM-ova i osnovna tehnologija na kojoj drugi mogu dalje graditi 📷 EPFL, ETH Zurich, CSCS / Molinari Design
Švicarski Apertus je jedan od najvećih otvorenih LLM-ova i osnovna tehnologija na kojoj drugi mogu dalje graditi EPFL, ETH Zurich, CSCS / Molinari Design

Početkom srpnja EPFL, ETH Zurich i Švicarski nacionalni superračunarski centar CSCS najavili su veliki jezični model Apertus, koji je sad postao javno dostupan kao prvi potpuno otvoreni i transparentni višenamjenski jezični model iz Švicarske. Ovaj model, obučen na impresivnih 15 bilijuna tokena, podržava više od 1000 jezika, a među njima i dosad nedovoljno zastupljeni švicarski njemački i retoromanski.

Model koristi novu xIELU aktivacijsku funkciju i obučen je od nule pomoću AdEMAMix optimizatora
Model koristi novu xIELU aktivacijsku funkciju i obučen je od nule pomoću AdEMAMix optimizatora

Apertus je jedinstven po potpunoj otvorenosti korisnicima koji slobodno mogu pristupiti cjelokupnom procesu razvoja, uključujući arhitekturu, težine modela, izvore podataka i proceduru treniranja. Model je dostupan u dvije veličine, s osam i 70 milijardi parametara, i otvorenog je koda pa se može koristiti u obrazovanju, istraživanju i komercijalnim projektima.

Dostupan i transparentan, Apertus, kažu njegovi tvorci, služi kao primjer kako AI može postati javna infrastruktura, od chatbotova, preko sustava za prevođenje, do obrazovnih alatia. Model se lako koristi i prilagođava kroz platforme poput Swisscoma, Hugging Facea i javnog AI servisa Public AI.