Generiranje AI slike može iskoristiti jednaku količinu energije kao i punjenje mobitela
Nedavno provedeno istraživanje pokazalo je koliko su zapravo energetski intenzivni procesi koje izvodi generativna umjetna inteligencija, a istraživači su rezultate izrazili usporedivši ih s punjenjem mobitela
Krajem studenoga je na platformi arXiv objavljen rad istraživača iz kompanije Hugging Face, specijalizirane za generativnu umjetnu inteligenciju i američkog sveučilišta Carnegie Mellon. Rad se bavi tehnologijom koja je u proteklim godinama doživjela ogroman porast popularnosti – komercijalnom generativnom umjetnom inteligencijom. Istraživači su željeli usporediti različite modele i njihove troškove rada, od onih jednostavnih i specijaliziranih za usko definirane zadaće, pa do onih općih, poput velikih jezičnih modela ili difuzijskih modela za generiranje ilustracija.
Multimodalnost troši najviše
Nimalo iznenađujuće, analiza je pokazala da su multifunkcionalni, a pogotovo multimodalni alati generativne umjetne inteligencije za red veličine skuplji za održavanje. U svjetlu se šire dostupnosti takvih alata autori rada upozoravaju da njihovu primjenu i integraciju "u sve i svašta" treba uzeti s dozom opreza. Trebalo bi, kažu, odvagnuti prednosti te ih usporediti s povećanim troškovima u smislu povećanja korištenja energije i s njome povezanim štetnim emisijama.
Za potrebe rada analiziran je niz modela, koji se oslanjaju na strojno učenje, a kao referenca uzet je njihov rad nakon treniranja, tj. u uvjetima korištenja. U analizu su uključeni modeli klasifikacije teksta, jezičnog modeliranja, klasifikacije slika, opisivanja slika te u konačnici stvaranja slika iz teksta – sve tehnologije vezane uz jezične modele i računalni vid, vrlo popularne u današnje vrijeme.
Velika varijacija
Razlike među modelima bile su velike – od samo 0,002 kWh za tisuću upita kod klasifikacije teksta, pa sve do gotovo 3 kWh za tisuću generiranja AI ilustracija. Kako bi zorno prikazali koliko je zapravo najintenzivnija aktivnost, AI sintetiziranje slika, energetski zahtjevna, autori studije usporedili su je s nečim svakodnevnim – punjenjem mobitela.
Za potrebe usporedbe korišteno je 0,012 kWh, potrebnih za punjenje baterije prosječnog mobitela. Za tisuću upita, dakle, najefikasniji model klasificiranja teksta potrošit će tek 16% te energije. S druge strane, tisuću generiranja AI ilustracija, korištenjem najmanje učinkovitog alata, iskoristit će energije kao 950 punjenja mobitela (11,49 kWh). Dakle, utrošak električne energije kod energetski "najgladnijeg" sustava bit će otprilike u omjeru 1 slika – jedno punjenje mobitela.
Autori navode i kako postoji velika varijacija unutar svake kategorije, što znači da nije svaki difuzijski AI model toliko energetski rastrošan. Najpopularniji text-to-image modeli generiraju i najviše ugljikovih emisija (vidljivo na priloženom grafikonu) u usporedbi s ostalim AI alatima. Po tom pitanju najgori od njih, stable-diffusion-xl-base-1.0, zaslužan je za 1.594 grama CO2 za 1.000 upita, što autori studije uspoređuju s vožnjom prosječnog benzinskog automobila na udaljenosti od 6,5 kilometara.