Jaz od 600 milijardi dolara između ulaganja u AI infrastrukturu i prihoda industrije
Era umjetne inteligencije ulazi u novu, zreliju fazu gdje učinkovitost i praktičnost preuzimaju primat nad pukim impresioniranjem veličinom. Fokus se premješta na praktičnu primjenu i ekonomsku održivost. Ipak, prska li AI balon?
Svijet tehnologije i investitora trenutačno je u znaku velike groznice oko umjetne inteligencije, no nova analiza otkriva jaz između ulaganja i profita. Ipak, počelo je otrežnjavanje i okretanje manjim LLM modelima.
Jaz od 600 milijardi dolara
Prema izvješću uglednog investicijskog fonda Sequoia Capital, objavljenog na stranicama kompanije, AI industrija suočava se trenutno s godišnjim jazom od 600 milijardi dolara između ulaganja u infrastrukturu i stvarnih prihoda. (Napomena: Kako je izvještaj napravljen pred nekoliko tjedana, već se u naslovu spominje već brojka od 600 milijardi dolara, iako se u izvornom tekstu navodi 500, što pokazuje da se AI balon strelovito napuhava)
Pitanje koje svatko može odmah postaviti: je li ova golema razlika ruši dugoročnu održivost trenutačnog trenda ulaganja u AI?
Također, nakon isporučenih narudžbi od stotinu tisuća procesora, vide se naznake zasićenosti tržišta i u tom segmentu, kao da potražnja jenjava. Sve to vodi prema zaključku kako projekcije budućih velikih zarada nisu izvjesne, pa to i nema opravdanja za tako velika kapitalna ulaganja.
Rupa puno veća
„U posljednjoj analizi (kad je jaz bio „samo“ 125 milijardi, op.a. ) velikodušno sam pretpostavio da će svaki od Googlea, Microsofta, Applea i Mete moći generirati 10 milijardi dolara godišnje od novih prihoda povezanih s umjetnom inteligencijom. Također sam pretpostavio 5 milijardi dolara prihoda od nove umjetne inteligencije za Oracle, ByteDance, Alibabu, Tencent, X i Teslu. Čak i ako ovo ostane točno i dodamo još nekoliko tvrtki na popis, rupa od 125 milijardi dolara sada će postati rupa od 500 milijardi dolara.“, napisao je na stranicama kompanije analitičar David Cahn.
Iako AI kompanije ne ispunjavaju očekivani rast zarade, vrijednosti njihovih dionica i dalje rastu. Dapače, one su daleko nadmašile rast vrijednosti u usporedbi s onima koje nisu vezane uz AI, a imaju stabilne prihode, što sugerira da je i dalje prevladava ekonomsko raspoloženje u fazi ulagačke groznice.
Prekapacitiranost, ali dolazi bum?
Međutim, povijest nas uči da svjedočimo znatnom prekomjernom kapacitetu u izgradnji računalne infrastrukture, slično kao što smo vidjeli u prethodnim valovima infrastrukturnog razvoja poput digitalnih telekomunikacija. Za usporedbu, 2005. godine, nakon booma ulaganja i potresa na tržištu, 85 posto kapaciteta širokopojasnog interneta u SAD-u bilo je neiskorišteno. Ali, kad su se ljudi nakupovali mobitela, servisi se prebacili na online poslovanje, streaming glazbe i videa postao popularan, 2022. godine, razina internetskog prometa porasla je oko 300 puta.
Mali AI modeli, niže cijene
Industrija umjetne inteligencije ipak traži kako bi prečicom zaradila i povratila ulagačima nešto para.
Opsesija, bilo tehnoloških divova, bilo startupova, je da velikim najavama sve većih modela sa sve većim brojevima parametara preteknu jedni druge. To znaci prestiž, ali ne i veliki dobitak u profitu. Zato se mnogi okreću razvoju manjih, specijaliziranih AI modela, koji su pristupačniji tržištu.
"Ne treba bilijuni operacija za računsku operaciju 2 + 2.” kaže Illia Polosukhin, bivši Googlov znanstvenik
Ovi mali jezični modeli, trenirani na manjim skupovima podataka i često dizajnirani za specifične zadatke, pokazuju se kao jeftinija, brža i ponekad jednako učinkovita alternativa svojim divovskim prethodnicima. Brojke govore same za sebe: dok najveći modeli, poput OpenAI-jevog GPT-4, koriste više od trilijun parametara i koštaju preko 100 milijuna dolara za razvoj, manji modeli često koriste manje od 10 milijardi parametara i mogu se razviti za manje od 10 milijuna dolara.
Phi sve popularniji
Microsoft prednjači u ovom trendu sa svojom grupom malih modela nazvanom Phi. Glavni izvršni direktor Satya Nadella ističe da su ovi modeli 100 puta manji od besplatnog modela OpenAI-jevog ChatGPT-a, ali obavljaju mnoge zadatke gotovo jednako dobro.
Google, Apple i AI startupovi poput Mistrala, Anthropica i Coherea također su predstavili manje modele ove godine. Apple je najavio planove za korištenje malih modela koji bi mogli raditi izravno na pametnim telefonima, čineći AI bržim i sigurnijim.
Šest puta jeftiniji
Yoav Shoham, suosnivač AI21 Labs-a, kompanija koja razvija male AI modele koji se fokusiraju na "Task specific" primjene, pruža konkretan primjer: "Naš mali model, sa samo 7 milijardi parametara, može generirati poslovni e-mail jednako kvalitetno kao i GPT-4, ali za djelić cijene. Govorimo o 0,0001 dolara po upitu nasuprot 0,0006 dolara."
Shosham je 28 godina predavao predmete vezane uz AI na sveučilištu Stanford. Njegova istraživanja obuhvaćaju umjetnu inteligenciju, logiku i teoriju igara. Također je osnovao i prodao nekoliko AI tvrtki. Dakle, zna što govori kao znanstvenik i poslovni čovjek: "Šest puta jeftiniji, a jednako učinkoviti za specifične zadatke kao sažimanja dokumenata ili generiranja slika. Korištenje velikih modela za takve svrhe je loša poslovna odluka."
Illia Polosukhin, jedan od članova Googleovog time iz 2017. koji je postavio temelje za trenutni AI boom, a danas je utemeljitelj startupa NEAR Protocol, slikovito to objašnjava: "Ne treba bilijuni operacija za računsku operaciju 2 + 2.” Primjera već ima. Experian, kompanija za kreditni rejting, prešla je s velikih na male modele za svoje AI chatbotove za financijske savjete i korisničku podršku.
Ovaj trend prema manjim modelima odražava u isto vrijeme spuštanje na zemlju i sazrijevanje AI industrije. Od impresivnih demonstracija i bombastičnih najava s brojevima koji dosežu uskoro bilijarde, fokus se premješta na praktičnu primjenu i ekonomsku održivost.