YouTube sadržaj, od MIT-a do MrBeasta, poslužio za obuku AI, ali uzet bez dozvole
Nedavna istraga otkrila je da vodeće tehnološke tvrtke poput Applea, Nvidije, Anthropica i Salesforcea koriste titlove s YouTube videa za obuku svojih modela umjetne inteligencije bez izričitog dopuštenja autora sadržaja
Industrija umjetne inteligencije u potrazi je za zlatom, a to su podaci. Zato YouTube s milijardama videozapisa predstavljaju vrlo primamljiv rudnik. Toliko je poželjan da neki vodeći igrači u industriji posežu za njihovim blagom, transkriptima, bez da zatraže dozvolu i dopuštenja njihovih autora.
173.536 videa s 48.000 kanala
Istraga koju su proveli portal Proof News i magazin Wired je otkrila da skup podataka poznat kao "YouTube Subtitles" sadrži transkripte 173.536 videa s 48.000 kanala. Sadržaj u ovom skupu podataka varira od edukativnog materijala Khan Academy i MIT-a do popularnih YouTubera poput MrBeasta i Marquesa Brownleeja.
Skup podataka stvorila je EleutherAI, neprofitna istraživačka grupa za umjetnu inteligenciju, kao dio veće kompilacije nazvane "the Pile".
Ono što značajno zakonski komplicira situaciju jest činjenica da YouTubeovi uvjeti korištenja izričito zabranjuju automatizirano prikupljanje videa i povezanih podataka. Neki su autori, nakon što su saznali za korištenje svog sadržaja, izrazili iznenađenje i ljutnju.
Jasno kršenje pravila
Marques Brownlee, poznat pod svojim online imenom MKBHD, američki je YouTuber s milijunskim brojem pratitelja, napisao je: “ Apple izbjegava krivnju jer oni nisu ti koji “stružu”.
Neal Mohan, izvršni direktor YouTubea, izjavio je da je korištenje YouTube sadržaja, uključujući transkripte, za obuku modela umjetne inteligencije jasno kršenje pravila platforme. Kao odgovor na ovu situaciju, YouTube planira uvesti ažuriranja koja će zahtijevati od autora da otkriju kada su stvorili izmijenjeni ili sintetički sadržaj koristeći AI alate. Platforma će također implementirati nove oznake kako bi informirala gledatelje kada sadržaj izmijenjen ili napravljen sintetički, posebno za osjetljive teme poput izbora ili kriza javnog zdravlja. Osim toga, YouTube radi na razvoju zaštitnih mjera kako bi spriječio svoje AI alate da generiraju sadržaj koji krši njihove smjernice.
Hoće li na sud?
Praksa koju su iskoristile tvrtke poput Applea, Nvidije, Anthropica i Salesforcea ne samo da krši YouTubove uvjete korištenja, već otvara i brojna etička pitanja. U utrci za napretkom u području umjetne inteligencije, ove AI kompanije balansiraju na tankoj liniji između inovacija i zakonitosti. Bit će zanimljivo vidjeti hoće li ovaj slučaj završiti na sudu.