Nvidia trenirala svoje jezične modele na milijunima piratiziranih knjiga?
Nedavno dopunjena tužba niza književnika protiv Nvidije otkriva navodnu izravnu suradnju s piratskom platformom Anna’s Archive i svjesno korištenje ilegalno pribavljenog sadržaja za obuku AI modela
Najvrjednija kompanija na svijetu trenutačno, Nvidia, suočava se s ozbiljnim optužbama u okviru nedavno proširene kolektivne tužbe koju je pokrenula skupina književnika. Prema najnovijim sudskim podnescima, tvrtku se tereti da je, pod pritiskom tržišne utrke u domeni umjetne inteligencije, svjesno koristila milijune piratskih knjiga iz ilegalnih repozitorija, na kojima je trenirala svoje jezične modele NeMo, Retro-48B, InstructRetro i Megatron.
"Pročitali" 500 TB podataka
Ključni dokazi u proširenoj tužbi su interni e-mailovi i dokumenti koji sugeriraju da je Nvidia izravno kontaktirala platformu Anna’s Archive, poznatu kao jedno od najvećih središta piratskog materijala na Internetu. Tužitelji tvrde da su Nvidijini predstavnici tražili brzi pristup podacima te ilegalne knjižnice.
Dokumentacija navodi kako je Anna’s Archive upozorila predstavnike Nvidije da su njihove kolekcije stečene i održavane ilegalno. Unatoč tim upozorenjima, uprava Nvidije navodno je u roku od tjedan dana dala "zeleno svjetlo" za nastavak suradnje, čime je tvrtka dobila pristup do otprilike 500 terabajta podataka, uključujući milijune zaštićenih djela. Nije poznato jesu li i koliko za taj pristup platili.
Kršenje autorskih prava
Ovaj slučaj predstavlja značajno proširenje prvotne tužbe iz 2024. godine, koja se fokusirala na skup podataka "Books3". Taj je set sadržavao radove preuzete s piratske stranice Bibliotik, no novi dokazi ukazuju na to da je Nvidia koristila i ostale ilegalne izvore poput LibGen-a, Sci-Huba i Z-Libraryja – dakle, "pokupili" su otprilike sav pisani sadržaj kojeg su se uspjeli domoći.
Dok se Nvidia ranije branila argumentom "poštene upotrebe" (fair use), tvrdeći da su knjige za njihove modele tek puke statističke korelacije, a ne autorska djela, tužitelji sada naglašavaju da je takvo postupanje izravno i svjesno kršenje zakona.
Osim same obuke modela, Nvidia je optužena i za distribuciju alata i skripti koji su njezinim korporativnim klijentima omogućavali automatsko preuzimanje piratskih baza podataka. Time se tvrtka tereti ne samo za izravno kršenje autorskih prava, već i za doprinos ilegalnoj distribuciji, čime je navodno ostvarila i značajnu financijsku korist.