Umjetna inteligencija

Pravo i umjetna inteligencija (2.): tipkovnica ≤ ili ≥ kist?

UI alat generira, a umjetnik slikovno dirigira 📷 Izvor: Microsoft Designer
Mihael Mudrić nedjelja, 3. ožujka 2024. u 09:10

U seriji tekstova na temu regulacije umjetne inteligencije razmatrat će se brojna regulatorna i pravosudna nastojanja da se uredi problematika pravne inkorporacije alata umjetne inteligencije (UI) u svakodnevni život i poslovanje

Početak prošle godine pozdravio nas je pokretanjem nekoliko značajnih sudskih postupaka u području alata umjetne inteligencije za generaciju slikovnog sadržaja. Srž takvih postupaka, od koja će se dva posebno istaknuti u daljnjem tekstu, odnosi se na problematiku izrade i korištenja baza podataka za strojno učenje algoritama kojima se generira slikovni sadržaj. Ujedno, jedno od osnovnih pitanja na koje tek treba dati odgovor odnosno smjernice odnosi se na pojmovno razlikovanje izvedenih radova, transformativnih radova i izvornih radova. Oba aspekta bitna su za problematiku zaštite autorskog prava i zaštite tržišnog natjecanja.

Kompanije koje stoje iza ovakvih alata i baza podataka načelno (još uvijek) ostaju pri tvrdnjama kako njihovi alati u pravilu nisu sposobni generirati izlazni sadržaj koji predstavlja izravnu kopiju materijala korištenog za strojno učenje. Ponekad njihovi alati „haluciniraju“ i ne pogađaju očekivani sadržaj odnosno želju korisnika alata, ali u pravilu, kako kažu kompanije, alati sve bolje i bolje generiraju izvorni sadržaj temeljen na uputama korisnika.

Kada se dogode slučajevi da alat za generaciju slika generira zapis koji je očigledno identičan sa postojećim materijalom (primjerice, slika poznate osobe) ili kada neki pametan bot predloži tekst koji je identičan tekstu koji se može pronaći na određenim mrežnim stranicama (primjerice, stranicama New York Timesa), kompanije tvrde kako je riječ o iznimnim slučajevima. U takvim iznimnim slučajevima riječ je, prema tipičnim pojašnjenjima kompanija, o činjenici kako su baze podataka koje se koriste za strojno učenje „prezastupljene“ sa određenim motivima i temama (overrepresented images). U takvim slučajevima, kompanije pojašnjavaju, izrazito rijetko se događa da izlazni sadržaj (output), obzirom na preveliku prilagodbu upute korisnika sa prezastupljenim modelom (overfitting), na očigled izgleda jako slično (close representation) izvornim materijalu koji je korišten za treniranje algoritma. Ovakva argumentacija pomalo podsjeća na izjave (odnosno halucinacije) političara u predizbornom razdoblju.

Umjetnici i autori navedenu pojavu i cijeli sustav treniranja algoritma i generacija slika UI alatima nazivaju krađom odnosno, elegantnije sročeno, povredom autorskog prava. Navedenu tvrdnju trenutačno pokušavaju legitimirati sudskom praksom koja će, ako uspiju, poslužiti kao presedan za sve buduće slučajeve odnosno čitavu industriju generativnih alata umjetne inteligencije. Ulozi su poprilično veliki.

U istom kontekstu umjetnici i autori nadalje preciziraju kako je riječ o povredi tržišnog natjecanja jer navedeni alati plagiraju radove stvarnih umjetnika, odnosno, konkretnije, njihove prepoznate motive i stilove. Posljednje navedeno je poglavito naglašeno činjenicom da sve više UI generatora slikovnog sadržaja dopušta dodavanje posebne kategorije u tzv. prompt uputi (tekstualna uputa zadana alatu od strane korisnika) u vezi imitacije određenog općeg ili pojedinačnog stila prilikom generacije slikovnog zapisa.

Primjerice, autor ove kolumne za potrebe teksta generira slike koristeći alate o kojima je u ovom tekstu riječ. Na kraju prompta kojim se opisuje načelni sadržaj slikovnog prikaza, često se dodaje uputa o stilu, poput „Cyberpunk style“ (kategorija umjetničkog stila ili izričaja) ili „Oleg style“ (pojedinačni prepoznati umjetnik). Zahvaljujući činjenici kako baze podataka za strojno učenje sadrže doslovno milijarde individualnih zapisa i materijala, određeni (dostatan) broj zapisa koji se odnose na pojedinačnog umjetnika odnosno pojedinačni umjetnički stil nakon obrade omogućavaju alatima da izlazni sadržaj prilagode takvim umjetničkim stilovima odnosno umjetnicima.

Google se sprema digitalizirati još jednu knjigu 📷 Izvor: Microsoft Designer
Google se sprema digitalizirati još jednu knjigu Izvor: Microsoft Designer

Brojni autori i umjetnici diljem svijeta upozoravaju kako je ovdje također riječ o povredi autorskog prava jer se njihova djela i umjetnički izričaji koriste bez prethodnog dopuštenja odnosno posljedične naknade. Pritom je važno za istaknuti kako se brojni alati o kojima je ovdje riječ koriste uz naknadu (različiti modeli pretplate ili kupovine tokena), što izlazni sadržaj generiran takvim alatima postavlja u izravnu konkurenciju umjetnicima i autorima koji „ručno“ kreiraju svoja djela. Autor ovoga teksta autor je i određenih tekstualnih djela (znanstvenih knjiga, poglavalja, radova…) koje je Google bez autorovog znanja i dopuštenja digitalizirao, i koje sada, vrlo vjerojatno također koristi i za strojno učenje Geminija (već sad bivšeg Barda) i tko zna čega još ne. U tom smislu, želim svim umjetnicima toplu dobrodošlicu u vrli novi svijet – dobro jutro, dobro došli!.

Dajte mi vaše slike, ilustracije i fotografije koje žude biti plagirane

Prvi sudski postupak koji se posebno ističe odvija se u poznatom mjestu radnje, San Franciscu, američkom gradu-pilotu u kojem se sva tehnološka čudesa današnjice suočavaju sa ograničenjima svakodnevnoga života. Riječ je o kolektivnoj tužbi protiv tri javnosti relativno poznate kompanije, StabilityAI, Midjourney i DevianArt (kasnije im se nevoljko pridružio i Runway). Pravna osnova izvornog tužbenog zahtjeva počiva na tvrdnjama kako je došlo do povrede saveznog Zakona o autorskim pravima digitalnog milenija, povredi prava na javnost, i povredi pravila o tržišnom natjecanju. Primjetno je kako je riječ o vrlo sličnim osnovama na kojima počiva i kolektivna tužba uperena protiv GitHuba, Microsofta i OpenAI, o čemu je bilo više riječi u prethodnoj kolumni. Navedeno ne iznenađuje obzirom kako je riječ o istom odvjetničkom uredu koji zastupa tužitelje u oba predmeta. Slično kao i kod Copilot predmeta, i ovdje je riječ o generativnom alatu umjetne inteligencije, ovoga puta za generaciju slikovnog zapisa. Konkretno, alat se zove DreamStudio i koriste ga alati DreamUp (iteracija kompanije DevianArt) te Midjourney odnosno Runway. Na strani tužitelja stoje umjetnici koje tvrde kako će generativni alati umjetne inteligencije (poput osporavanih Stable Diffusion, Midjourney i DreamUp modela odnosno alata) u konačnici dovesti do kraha cijele profesije obzirom da razvojni programeri koji stoje iza takvih alata odnosno baza podataka koje se koriste za treniranje takvih alata bezobzirno i u potpunosti protuzakonito prisvajaju (neovlašteni data scraping ili korištenja sada već kontroverznih baza podataka poput LAION-5B) i koriste rezultate mukotrpnog rada nebrojenih umjetnika. Umjetnici kažu kako je nemoguće natjecati se sa generativnim alatima umjetne inteligencije koji ih nezakonito i ubrzano istiskuju sa tržišta. Poglavito glasna rasprava vodila se među umjetnicima koji su koristili DevianArt platformu za prodaju svojih dijela, a koja su se, bez njihova znanja i pitanja, koristila za izradu alata koji im sada, putem iste platforme (DreamUp, verzija Stable Diffusiona), predstavlja jaku konkurenciju.

Bilo kuda, StabilityAI svuda 📷 Izvor: Microsoft Designer
Bilo kuda, StabilityAI svuda Izvor: Microsoft Designer

Drugi poznati slučaj također se vodi protiv kompanije StabilityAI, no ovoga puta na strani tužitelja nastupa javnosti relativno poznata kompanija Getty Images. U dva odvojena postupka predu sudovima u Sjedinjenim Američkim Državama i Ujedinjenom Kraljevstvu Getty Images tvrdi kako je StabilityAI bez znanja, dopuštenja, licencije i dogovorene naknade preuzeo milione (preciznije 12 miliona) slikovnih prikaza i pratećih metapodataka (i drugih podataka) sa Gettyevih baza (uključujući poznatu iStock bazu). StabilityAI je, prema navodu tužitelja, činio navedene radnje s ciljem stvaranja konkurentske usluge odnosno konkurentskog poslovanja, pri čemu je uklanjao i autorske podatke o Getty Images kompaniji sa preuzetih slikovnih prikaza. Dok se u vezi predmeta koji se vodi pred sudom u Delawareu (SAD) još uvijek iščekuje prvotno očitovanje suda, predmet u Ujedinjenom Kraljevstvu nedavno je prihvaćen te se iščekuje prvo ročište za raspravu.

StabilityAI je ustao sa zahtjevom za odbacivanje tužbenog zahtjeva u vezi korištenja slikovnih prikaza iz Getty Images baza obzirom kako, prema tvrdnjama kompanije, strojno učenje odnosno treniranje algoritma nije rađeno unutra Ujedinjene Kraljevine. Sud je, međutim, odlučio kako se o ovom zahtjevu treba provesti rasprava. Druga osnova po kojoj je StabilityAI tražio odbacivanje tužbenog zahtjeva tiče se tumačenja odredbe britanskog Zakona o autorskom pravu na dizajn i patente iz 1988. godine koja govori o povredi autorskog prava korištenjem sredstva koje je uvezeno na tržište Ujedinjene Kraljevine. StabilityAI je, naime, ustvrdio kako mora biti riječ o fizički opipljivom sredstvu, a Stable Diffusion model to nije. No, sud je također rekao kako se o ovome pitanju mora provesti rasprava, osobito iz razloga što predmet potencijalno može ponuditi sasvim novo tumačenje izrazito bitnog pojma u opusu pravnih instrumenata zaštite autorskog prava i prava na zaštitu patenata.

Daljnja razmatranja ove problematike izvode se kroz primjere vezane uz prvi spomenut pravni slučaj analize (umjetnici protiv StabilityAI i drugih), no pravni izazovi o kojima je ovdje riječ u jednakoj se mjeri odnose na oba predmeta gdje glavnog protagonista na strani tuženika predstavlja StabilityAI.

Samo jednom se generira

Problem koji se veže uz očitu potrebu zadovoljavanja osnovnih postavki autorskog vlasništva jest praktične prirode. Mnogi komentatori vjeruju kako bi strogo tumačenje autorskog prava dovelo do situacije kada većina kompanija koje se bave razvojem ovakvih alata više ne bi bila u mogućnosti koristiti bogate baze podataka obzirom da bi za svaki pojedinačni materijal u bazi bilo potrebno osigurati individualni dogovor o korištenju, vjerojatno uz određenu matematički izračunatu naknadu. Većina kompanija u takvom slučaju ne bi bila u financijskoj mogućnosti koristiti velike baze, a što bi posljedično dovelo do lošije kvalitete generacije izlaznog sadržaja. Upravo iz tog razloga kompanije nevoljko iznose podatke o materijalima koji se koriste za strojno učenje.

Tužba umjetnika nadalje navodi kako alati poput Stable Diffusiona predstavljaju kolaže gotovih radova iz koje alat samo izvlači kopije radova i predstavlja ih kao izlazni sadržaj (tzv. izvedeni radovi, derivative works). Brojni kritičari ovog segmenta tužbenog zahtjeva upozorili su kako ovakva vrsta alata ne funkcionira na navedeni način, te je evidentno da odvjetnici ovom segmentu tužbenog zahtjeva nisu posvetili dostatno pažnje. Pojednostavljeno rečeno, dobar umjetnik i dobar generativni alat umjetne inteligencije mogu proizvesti kopiju slike Mona Lise, a što bi u slučaju pokušaja prodaje vrlo vjerojatno predstavljalo povredu autorskog prava. No, autorsko pravo ne štiti individualne činjenice poput podatka da Mona Lisa predstavlja žensku (ili?) osobu koja ima takvu i takvu kosu, takvu i takvu boju očiju, usne i sl. Razvojni programeri koji stoje iza navedenih algoritama pojašnjavaju kako se alati uče kreirati slikovne sadržaje temeljeni uopćenih podataka i činjenica, a da korištenje gotovih materijala za strojno učenje služi isključivo tome da alati nauče prepoznavati objekte, stanja, stilove, i sl., kako bi kasnije kroz metodu tzv. difuzije (diffusion, razbijanje slike dodavanjem više slojeva piksela odnosno novog sadržaja, te denoising, odnosno ponovno sastavljanje slike) stvarali nove sadržaje korištenjem naučenih obrazaca uopćenih objekata i prikaza. Tako stečeno znanje, prema pojašnjenjima inženjera, ne služi pukoj reprodukciji, već služi generaciji sadržaja koji je originalan u odnosu na sve materijale korištenje tijekom strojnog učenja.

Problem sa prethodno iznesenim pojašnjenjem jest činjenica kako isto nije uvijek točno. Više znanstveno utemeljenih studija pokazalo je kako u nekim (vrlo rijetkim) slučajevima generativni alati umjetne inteligencije generiraju sadržaj koji predstavlja de facto kopiju originalne slike (verbatim copy). Isto se odnosi i na dokazane slučajeve kada alati generiraju slike koje sadrže vodene žigove (watermark) originalnih fotografija, ili poznate animirane i druge likove. Posljednje je poglavito primjetno u novijim iteracijama Midjourney alata (vjerojatno najkvalitetnijeg alata u masovnoj uporabi) koji generira izlazne sadržaje koje je često teško razlikovati od izvornika (poznati animirani i igrani likovi, poznate scene iz animiranih i igranih filmova, i sl.).

Joker i generativni alati UI 📷 Izvor: Microsoft Designer
Joker i generativni alati UI Izvor: Microsoft Designer

Sve i ako se prihvati teza kako je riječ o zanemarivom postotku gotovo identičnih generacija, ostaje prethodno iznesena činjenica kako ovakvi alati generiraju novi sadržaj zahvaljujući čitavom nizu korištenih predložaka za što nisu dani pristanci ili plaćene naknade za korištenje. Teško je za pretpostaviti kako će sudovi presuditi protiv razvojnih programera samo zato što njihovi alati imaju kapaciteta istisnuti ručne crtače sa tržišta. No, moguće je zamisliti sudsku praksu koja analizirajući doktrinu poštenog korištenja dolazi do zaključka kako baze podataka korištene za strojno učenje ne počivaju na osnovnim postavkama zaštite autorskog prava. Tome u prilog ide i činjenica kako postojeće kinesko, predloženo europsko i načelno predviđeno američko zakonodavstvo inzistiraju na poštivanju autorskog prava.

U listopadu prošle godine savezni sud u većoj je mjeri odbio niz navoda iz tužbe, poglavito po pitanju tuženika DevianArta i Midjourneya. Sud je posebno upozorio kako konkretni umjetnici koji su imenom i prezimenom ustali kao tužitelji u sporu nisu uspjeli dokazati da su njihovi konkretni radovi korišteni prilikom generacije sadržaja kroz DreamStudio algoritam. Tuženici su ustali sa protutužbenim navodima u kojima tvrde da tužitelji krše kalifornijske anti-SLAPP mjere (zaštita osoba od strateški tužbi koje se podižu s ciljem ušutkavanja protivnika), no sud je također odbacio i ovaj zahtjev uz napomenu kako je zadovoljen preduvjet javnog interesa za pokretanje spora.

Tuženici su također pokušali zatvoriti cijeli slučaj pozivanjem na Prvi amandman odnosno pravo na slobodu izričaja. Logika iza navedene strategije očitovala se u pokušaju prikazivanja generativnih alata umjetne inteligencije kao sredstva generacije umjetnosti koja promiče nove ideje i koncepte. Tuženici su ustvrdili kako je takva aktivnost zajamčena ustavom te kako tužitelji u biti krše njihovo ustavno pravo na slobodan govor i slobodu djelovanja. Sud se o ovom navodu još nije u cijelosti očitovao.

Ujedno, DevianArt je ustao sa tvrdnjom kako puko korištenje alata koji je razvio netko drugi, odnosno implementacija verzije takvog alata ne bi trebala automatski osobu koja implementira takvu tehnologiju poistovjetiti sa razvojnim programerima alata odnosno baze podataka za strojno učenje. Također se očekuje očitovanje suda i o ovom pitanju, te se postavlja otvoreno pitanje hoće li sud prihvatiti logiku kanadskog suda (vidi prethodni tekst) u slučaju chat bota i pogrešno izračunate cijene avionske karte (izmišljeni popust).

Runway u posljednjim navodima u bitnome ponavlja ono što je sud primijetio u listopadu 2023. kada je ukazao na nedostatak jasnih dokaza da su dijela konkretnih tužitelja prepoznata u generaciji Stable Diffusion iteracija. Runway se posebno dotiče problematike navodnog kopiranja stila odnosno umjetničkog izričaja te upozorava kako umjetnički izričaj kao takav nije pokriven zaštitom autorskog prava, te kako proces kreacije umjetničkih djela općenito počiva na učenju iz tuđih stilova, reprodukcije istih, te nadogradnje kroz koju se stvaraju novi umjetnički izričaji. Autor ovoga teksta (kao i brojni drugi komentatori) slaže se sa ovom konstatacijom, te se ističe kako je teško za očekivati kako će sud odlučivati o nečemu što se u određenoj mjeri može poistovjetiti sa problematikom ukusa (De gustibus non est disputandum!).

Nismo mi krivi što ljudi koriste naš kod

Sud je, međutim, dopustio nastavak postupka (izmijenjeni tužbeni zahtjev) protiv StabilityAI u vezi najinteresantnije stavke tužbenog zahtjeva: pitanja potencijalne povrede autorskog vlasništva korištenjem zaštićenih materijala za izradu modela umjetne inteligencije Stable Diffusiona bez dopuštenja autora tih materijala i plaćanja adekvatne naknade. Zaštićeni materijali, prema navodu iz nadopunjenog tužbenog zahtjeva, uključuju i prepoznatljive oznake prepoznatljivih autora i umjetnika, kao što je to, primjerice, potpis umjetnika. Po pitanju korištenih baza podataka (izrijekom se spominju LAION-400M i LAION-5B), tužbeni zahtjev sada navodi kako navedene baze ne sadrže same materijale veće metapodatke o materijalima i poveznice na njihovu stvarnu lokaciju. To, prema navodu tužitelja, znači da je svaki materijal prethodno uvrštavanju u bazu podataka za strojno učenje, bio preuzet od StabilityAI u navedenu svrhu, a što samo po sebi predstavlja povredu autorskog prava zbog preuzimanja odnosno kreacije i korištenja neautorizirane kopije izvornog materijala. Tužitelji sada jasnije osporavaju i sam proces difuzije za koji tvrde da ima kapacitete uklanjanja dodatnih slojeva piksela kako bi se povratio izvorni materijal odnosno stvorila kopija izvornog materijala.

e-Umjetnost ne poznaje granice 📷 Izvor: Nightcafe Studio
e-Umjetnost ne poznaje granice Izvor: Nightcafe Studio

StabilityAI u tom kontekstu djelomično mijenja narativ obrane te koristi klasične metode disrupcije kako bi promijenio narativ sudskog postupka. U najnovijem podnesku ističu kako njihov alat ne predstavlja povredu autorskog prava obzirom kako je riječ o računalnom kodu, a ne umjetničkom djelu, a sama kompanija ničime ne potiče korisnike da njihov računalni kod koristi za kopiju tuđih umjetničkih djela (!). Drugim riječima, StabilityAI raspravu sa generiranog sadržaja želi prebaciti na sam alat generacije. Midjourney se pridružuje ovoj argumentaciji/retorici i kao dodatne primjere navodi strojeve za fotokopiranje i mrežne preglednike koji su u stanju reproducirati kopije izvornog sadržaja. Pritom se pozivaju na sudski presedan iz 1984. kojim se štiti proizvođače protiv tužbi povrede autorskog prava ako se proizvod, protivno svojoj izvornoj namjerni, koristi na način kojim se krše autorska prava. Na taj se način narativ sa problematike izgradnje baze podataka za strojno učenje alata pokušava prebaciti na korisnike alata i njihovo navodno protupravno korištenje istoga.

No, odvjetnici StabilityAIa i Midjourneya propuštaju opovrgnuti jednu ključnu stavku tužbenog zahtjeva. Nije sporno da stroj za fotokopiranje može proizvesti kopiju originala. Sporno je međutim u kakve se sve svrhe ta kopija može koristiti, odnosno je li ta kopija napravljena uz dopuštenje autora ili temeljem doktrine poštenog korištenja. Dok je drugo pitanje primarno vezano uz razvojne programere poput StabilityAI, prvo pitanje dopušta puno šira tumačenja i, prema mišljenju autora ovog teksta, argumenti tuženika po ovom pitanju nose određenu težinu. Iščekuje se novo ročište, a na strani tužitelja okuplja se sve brojnija skupina umjetnika, neki od kojih su se i poimence uključili u proces na strani tužitelja (ime Rutkowski možda će biti poznato nekih zaljubljenicima videoigara i igara na ploči).

Trudit ćemo se izvještavati o ishodima ovih izuzetno važnih predmeta. Ovisno o tome kakva se praksa uspostavi, odluke sudova potencijalno će izvršiti ogroman utjecaj na način na koji kompanije posluju odnosno kako raspolažu materijalima i podacima koji su relativno lako dostupni preko Interneta. U idućem broju kolumne nastaviti će se pregled značajnih predmeta koji se također bave problematikom generativnih alata umjetne inteligencije, ovoga puta u vezi generacije tekstualnog sadržaja.

Mihael Mudrić je izvanredni profesor na Pravnom fakultetu Sveučilišta u Zagrebu gdje predaje teme iz područja prometnog prava, prava osiguranja, energetskog prava i prava privatne zaštite. Posebno se bavi problematikom regulacije umjetne inteligencije u kontekstu privatne i javne sigurnosti, automatizacije vožnje u svim modalitetima prijevoza, i zaštite osobnih podataka. Sudjelovao je na više međunarodnih znanstvenih projekata uključujući HORIZON 2020, aktivan je član međunarodne radne skupine za autonomna plovila pri Međunarodnom pomorskom odboru, i predstavnik je Republike Hrvatske pri Zajedničkoj radnoj skupini za autonomna plovila Međunarodne pomorske organizacije. Voditelj je sveučilišnog projekta Pravni okvir za autonomna vozila, Pravni fakultet Sveučilišta u Zagrebu. Potpredsjednik je Hrvatskog društva za pomorsko pravo, arbitar pri Arbitražnom sudištu HGK, i član Instituta za sigurnosne politike. Doktorirao je na Max Planck institutu i Pravnom fakultetu Sveučilišta u Hamburgu, Njemačka.