Novi standardi za transparentnost podataka u umjetnoj inteligenciji

Skupina od 19 vodećih svjetskih kompanija, uključujući American Express, Humana, IBM, Mastercard, Pfizer i Walmart, udružila je snage kako bi stvorila međuindustrijske standarde za podrijetlo, stvaranje i zakonito korištenje podataka

Bug.hr utorak, 9. srpnja 2024. u 09:38
📷 Foto: Stephen Dawson
Foto: Stephen Dawson

U svijetu koji sve više ovisi o umjetnoj inteligenciji, kvaliteta podataka postaje ključni faktor konkurentske prednosti. 

Data & Trust Alliance

Nakon mjeseci testiranja i validacije s više od 50 organizacija, Savez za podatke i povjerenje (Data & Trust Alliance - D&TA, dataandtrustalliance.org) danas objavljuje izlazak prve verzije Standarda za podrijetlo podataka. Ovi standardi predstavljaju značajan korak naprijed u regulaciji kvalitete podataka koji se koriste u aplikacijama umjetne inteligencije i tradicionalnim podatkovnim sustavima.

Standard za "početak" podataka

Inicijativa je potaknuta rastućom potrebom poslovnog svijeta za jasnijim pravilima u području kvalitete podataka. S ubrzanim usvajanjem umjetne inteligencije, postalo je očito da su podaci bitni da bi se ostvarila konkurentnost ali i izbjegle blamaže brenda ili čak sudski procesi. Ideja o razvoju standarda za "početak" podataka - njihovo podrijetlo i namjeravanu uporabu - proizašla je iz razgovora s vodećim stručnjacima iz industrije.

Sve počinje sa standardima, a ovo je važan korak u osiguranju transparentnosti " Greg Ulrich, Mastercard

Trenutna situacija u svijetu umjetne inteligencije karakterizirana je nedostatkom standardnih definicija za ključne elemente. Evaluacija modela je otežana zbog nedovoljne transparentnosti podataka koji se koriste za treniranje i napajanje tih modela. Posljedice ovog nedostatka mogu biti dalekosežne - od kršenja autorskih prava i privatnosti do pitanja autentičnosti - što može utjecati na poslovnu vrijednost tehnologije i njezino prihvaćanje u društvu.

IBM i Mastercard potvrdjuju

Rob Thomas, viši potpredsjednik IBM Softwarea i glavni komercijalni direktor, ističe: "Ovi praktični standardi, koje su zajednički stvorili iskusni stručnjaci iz različitih industrija, osmišljeni su kako bi pomogli u procjeni usklađenosti AI procesa s promjenjivim regulativama, istovremeno generirajući povećanu poslovnu vrijednost."

Greg Ulrich, glavni direktor za AI i podatke u Mastercardu, dodaje: "Zalažemo se za odgovorni AI, a važan dio toga je povjerenje u podatke i pristup koji se koristi za treniranje i implementaciju AI modela. Vjerujemo da AI tehnologija može pomoći kupcima, tvrtkama i društvu. Ona može učiniti trgovinu pametnijom, sigurnijom i personaliziranijom. Sve počinje sa standardima, a ovo je važan korak u osiguranju transparentnosti i odgovornih inovacija."

Poslovna vrijednost i izvedivost implementacije

Standardi su kreirani s ciljem usvajanja od strane poslovnih subjekata, imajući na umu dvije perspektive. Prva je poslovna vrijednost: pomoći organizacijama svih vrsta i veličina u procjeni koji skupovi podataka su više kvalitete, pružajući im transparentnost potrebnu za učinkovitost, točnost i pouzdanost korištenja podataka. To uključuje minimiziranje rizika povezanih s pravnim pitanjima, autorskim pravima i regulatornom usklađenošću.

Druga perspektiva je izvedivost implementacije: kako bi se potaknulo usvajanje, odabrani su samo najnužniji meta podaci potrebni za razumijevanje podrijetla skupa podataka, metode njegovog stvaranja i mogućnosti zakonitog korištenja.

Verzija 1.0.0.

Od prvotnog prijedloga Standarda za podrijetlo podataka u studenome, radna skupina fokusirala se na stvaranje standarda prilagođenih poslovnom usvajanju. Temeljem povratnih informacija, validacije i testiranja, stvorena je verzija 1.0.0. To je dovelo do nekoliko poboljšanja, uključujući pojednostavljenje kategorija s osam na tri standarda, fokusiranje na meta podatke koji "pokazuju, a ne govore" kako bi podatkovni, AI i pravni timovi imali dokaze za informirano donošenje odluka, preciznije ispitivanje tehnologija za poboljšanje privatnosti radi dobivanja točnijih informacija, te isticanje jezika pristanka koji je prikazan korisniku prilikom prikupljanja osobnih podataka kako bi se procijenili rizici povezani s upotrebom potrošačkih podataka.

Verzija 1.0.0 sadrži 22 kategorije metapodataka, grupiranih u tri standarda 📷 Izvor: D&TA
Verzija 1.0.0 sadrži 22 kategorije metapodataka, grupiranih u tri standarda Izvor: D&TA

Mjeseci testiranja

Mjeseci testiranja rezultirali su studijama, od kojih je prva objavljena od strane IBM-a. Ovo testiranje otkrilo je moć Standarda za podrijetlo podataka u povećanju ukupne kvalitete podataka i smanjenju vremena potrebnog za pregled i odobrenje skupova podataka koji se koriste za treniranje AI modela.

Standardi za podrijetlo podataka trenutno se implementiraju od strane članova Saveza, od kojih mnogi imaju opsežne ekosustave. Međutim, cilj je povećati transparentnost u cijelom poslovnom svijetu. Savez potiče sve organizacije da iskoriste ovaj besplatni alat. Više informacija o kontekstu i poslovnoj potrebi za Standardima, uključujući Pregled za izvršne direktore, može se pronaći na njihovoj web stranici.

Potpuni komplet za usvajanje, namijenjen stručnjacima za nabavu podataka, upravljanje podacima i usklađenost, dostupan je u njihovom središtu za tehničke resurse.