Umjetna inteligencija otkriva anomalije u velikim skupovima podataka
Nova tehnika strojnog učenja mogla bi točno odrediti potencijalne kvarove električne mreže ili kaskadna uska grla u prometu u stvarnom vremenu
Otkrivanje kvara u električnoj mreži može biti poput traženja igle u ogromnom plastu sijena. Stotine tisuća međusobno povezanih senzora diljem zemlje hvataju podatke o električnoj struji, naponu i drugim kritičnim informacijama u stvarnom vremenu.
Učinkovita metoda
Istraživači MIT-IBM Watson AI Laba osmislili su računski učinkovitu metodu koja može automatski odrediti anomalije u tim tokovima podataka u stvarnom vremenu. Pokazali su da je njihova metoda umjetne inteligencije, koja uči modelirati međusobnu povezanost električne mreže, puno bolja u otkrivanju ovih propusta od nekih drugih popularnih tehnika.
Obuka ovog modela strojnog učenja ne zahtijeva označene podatke o anomalijama električne mreže. Ovaj model ujedno je vrlo fleksibilan i može se primijeniti na druge situacije u kojima veliki broj međusobno povezanih senzora prikuplja i javlja podatke. Pomoću njega moglo bi se tako identificirati uska grla u prometu ili otkriti kako nastaju prometne gužve.
“U slučaju električne mreže, ljudi su pokušali prikupiti podatke pomoću statistike, a takvi sustavi zahtijevaju puno rada i stručnosti. Ovaj proces može se automatizirati, a uzorci iz podataka naučiti naprednim tehnikama strojnog učenja", objašnjava voditelj laboratorija Jie Chen.
Distribucija vjerojatnosti
Podatke iz elektroenergetske mreže tretirali su kao distribuciju vjerojatnosti; ako mogu procijeniti gustoću vjerojatnosti, mogu identificirati i vrijednosti niske gustoće u skupu podataka.
Procjena tih vjerojatnosti nije lak zadatak, pogotovo jer svaki uzorak obuhvaća više vremenskih serija, a svaka vremenska serija je skup višedimenzionalnih točaka podataka zabilježenih tijekom vremena. Istraživači su koristili posebnu vrstu modela dubokog učenja nazvanog normalizirajući tok, posebno učinkovitog u procjeni gustoće vjerojatnosti uzorka.
Složena struktura
Taj su model proširili pomoću Bayesove mreže koja može naučiti složenu strukturu između različitih senzora i istraživačima omogućuje da vide obrasce u podacima i točnije procijene anomalije, objašnjava Chen. Nakon implementacije, model nastavlja učiti iz stalnog toka novih senzorskih podataka, a ujedno je i fleksibilan pa se može se podešavati za učinkovita predviđanja anomalija u drugim situacijama, poput obrazaca prometa.
Istraživači sad žele razviti modele koji će moći obraditi i ogromne grafove s milijunima, milijardama međusobno povezanih čvorova. I umjesto da samo pronalaze anomalije, ovim pristupom žele poboljšali i točnost predviđanja na temelju skupova podataka.