Huaweijevi čipovi pogone DeepSeek AI

Iako je DeepSeek R1 LLM treniran na Nvidijinom H100 čipu, za inferenciju se koristi Huaweijev Ascend 910C

Matej Markovinović srijeda, 29. siječnja 2025. u 15:02
AI ilustracija 📷 Foto: Dall-E
AI ilustracija Foto: Dall-E

Ratovi umjetne inteligencije zahuktavaju se s DeepSeekom već danima, kineskim AI modelom za kojeg se tvrdi da značajno nadmašuje američke konkurente kada je riječ o troškovnoj učinkovitosti. Da bi se cijela stvar sada dodatno začinila, otkriveno je da radi na Huaweijevom AI čipu.

Naime, DeepSeek R1 LLM treniran je na Nvidijinom H100 čipu, ali za inferenciju, točnije proces korištenja treniranog modela za generiranje odgovora, koristi Huaweijev Ascend 910C. Ovu informaciju objavio je na X-u tehnološki analitičar Alexander Doria, navodeći i neke slabosti Huaweijevih čipova.

„Ograničenja izvoza utječu na litografske strojeve koji omogućuju proizvodnju čipova za GPU. Ascend 910C nešto je manje učinkovit i još uvijek nema dobru međusobnu povezivost koja je ključna za treniranje modela. Ipak, Huawei sustiže konkurenciju. Ascend 910C prvenstveno je razvijen za inferenciju, a nadolazeći čip, Ascend 920C, cilja na performanse Nvidijinog B200“, napisao je Doria.

Istaknuo je i da DeepSeek ipak razmatra treniranje svog modela V4 na 32.000 Huaweijevih Ascenda 910C što bi bio značajan korak u smjeru smanjenja ovisnosti o američkoj tehnologiji. Iako Huawei ima poteškoća s ispunjavanjem velike potražnje, ovakav bi potez bio poprilično simboličan, zbog čega će kineski proizvođač vjerojatno dati DeepSeeku prioritet u isporukama.

Osim toga, navodi se da bi tim koji stoji iza DeepSeeka mogao biti jedan od rijetkih koji je uspješno riješio problem međusobne povezanosti čipova. Ako im to pođe za rukom, globalni AI poredak mogao bi se dodatno promijeniti.