Iako je Adobe isprva tvrdio da je Firefly primarno obučen na slikama iz njegove kolekcije Adobe Stock, naglašavajući komercijalnu sigurnost i etičku prihvatljivost u odnosu na druge AI modele koji prikupljaju slike s interneta, otkriveno je da je tvrtka koristila i AI sadržaj od konkurenata, uključujući Midjourney. O tome se Adobe nije izjašnjavao sve dok nije došlo do otkrića. Potom je naveo da je samo pet postotak slika korištenih za treniranje Fireflyja povučeno s drugih platformi. Inače, Adobe Stock sadrži 57 milijuna slika, oko 14% od ukupnog broja je označeno kao slike generirane umjetnom inteligencijom.

U svoju obranu Adobe navodi da je vodio brigu od početaka, već od 2023. godine, kada je kao beta verzija razvijen Firefly, kako će obeštetiti autore čija će djela koristiti na svojim AI platformama.

U rujnu prošle godine Adobe je napisao na svojim stranicama:

„Adobe je razvio model naknada za autore čiji su radovi korišteni u treniranju modela Firefly. Ova inicijativa je dio Adobevih napora da osigura da kreatori imaju koristi od svojih doprinosa Firefly bazi podataka, u skladu s njihovim opredjeljenjem za odgovoran i etički razvoj umjetne inteligencije.“

Ovaj slučaj samo nastavlja već započetu raspravu o etičkom i pravnom korištenja AI sadržaja za obuku AI sustava, s fokusom na izvore i autorsko vlasništvo. O tome je nedavno The New York Times objavio veliki tekst o tome kako „tehnološki divovi prečicom žanju podatke za AI“. Zanimljivi dio iz tog članka je prikaz kako platforme, u ovom slučaju Google, mijenjaju uvjete korištenja i proširuju svoja prava. Drugi zanimljiv dio članka odnosi se na OpenAI i transkribiranje više od milijuna sati videa s YouTubea, kako bi došli do podataka za treniranje. Za to su koristili posebno razvijen softver Whisper.

Potencijalne posljedice

Nekoliko je potencijalnih posljedica korištenja neovlaštenog sadržaja za obuku platformi umjetne inteligencije.

Prvo, kad se, kao u slučaju s Firefly otkrije neovlašteno preuzimanje s tuđih platformi, po kompaniju nastaju reputacijski problemi. Kada Adobea svoje modele predstavljaju kao "etične" ili "odgovorne", korištenje neovlaštenog sadržaja u podacima za obuku potkopava te tvrdnje i stvara probleme. To oštećuje reputaciju AI tvrtke i narušava povjerenje javnosti u njihovu platformu.

Drugo, tu su mogući sudski problemi. Oni koji se osjećaju pokradeni, zasigurno će pokrenuti sudsku tužbu za povredu autorskih prava. Primjera već ima. Getty Images i The New York Times podnijeli su tužbe protiv Stability AI-a i OpenAI-a. Ishodi ovih tužbi mogli bi imati velike implikacije na budućnost generativnog AI-a, s obzirom na to da sudovi određuju potpada li korištenje zaštićenih autorskih djela za obuku AI modela pod zaštitu prava.

Treće, moguće je potpuno kompromitirati tržište licenciranih AI podataka za obuku, dakle onih koji se legalno prodaju AI platformama na primjer, Reddit. Mnogi nositelji autorskih prava, poput Getty Imagesa, nude licence za uključivanje njihovih djela u AI podatke za obuku. Korištenje neovlaštenog sadržaja potkopava ovo tržište licenci i lišava nositelje autorskih prava potencijalnih prihoda.

Četvrto, možda i najvažnije, stvara se potpuni nered na tržištu jer budući korisnici ne žele riskirati i kupovati licence za novonastala djela sumnjivog porijekla ako ih se jednog dana može utužiti.