Umjetna inteligencija otkriva anomalije u velikim skupovima podataka

Nova tehnika strojnog učenja mogla bi točno odrediti potencijalne kvarove električne mreže ili kaskadna uska grla u prometu u stvarnom vremenu

Mladen Smrekar četvrtak, 3. ožujka 2022. u 22:52

Otkrivanje kvara u električnoj mreži može biti poput traženja igle u ogromnom plastu sijena. Stotine tisuća međusobno povezanih senzora diljem zemlje hvataju podatke o električnoj struji, naponu i drugim kritičnim informacijama u stvarnom vremenu.

Učinkovita metoda

Istraživači MIT-IBM Watson AI Laba osmislili su računski učinkovitu metodu koja može automatski odrediti anomalije u tim tokovima podataka u stvarnom vremenu. Pokazali su da je njihova metoda umjetne inteligencije, koja uči modelirati međusobnu povezanost električne mreže, puno bolja u otkrivanju ovih propusta od nekih drugih popularnih tehnika.

Otkrivanje kvara u električnoj mreži može biti poput traženja igle u ogromnom plastu sijena
Otkrivanje kvara u električnoj mreži može biti poput traženja igle u ogromnom plastu sijena

Obuka ovog modela strojnog učenja ne zahtijeva označene podatke o anomalijama električne mreže. Ovaj model ujedno je vrlo fleksibilan i može se primijeniti na druge situacije u kojima veliki broj međusobno povezanih senzora prikuplja i javlja podatke. Pomoću njega moglo bi se tako identificirati uska grla u prometu ili otkriti kako nastaju prometne gužve.


“U slučaju električne mreže, ljudi su pokušali prikupiti podatke pomoću statistike, a takvi sustavi zahtijevaju puno rada i stručnosti. Ovaj proces može se automatizirati, a uzorci iz podataka naučiti naprednim tehnikama strojnog učenja", objašnjava voditelj laboratorija Jie Chen.

Distribucija vjerojatnosti

Podatke iz elektroenergetske mreže tretirali su kao distribuciju vjerojatnosti; ako mogu procijeniti gustoću vjerojatnosti, mogu identificirati i vrijednosti niske gustoće u skupu podataka. 

Procjena tih vjerojatnosti nije lak zadatak, pogotovo jer svaki uzorak obuhvaća više vremenskih serija, a svaka vremenska serija je skup višedimenzionalnih točaka podataka zabilježenih tijekom vremena. Istraživači su koristili posebnu vrstu modela dubokog učenja nazvanog normalizirajući tok, posebno učinkovitog u procjeni gustoće vjerojatnosti uzorka.

Složena struktura

Taj su model proširili pomoću Bayesove mreže koja može naučiti složenu strukturu između različitih senzora i istraživačima omogućuje da vide obrasce u podacima i točnije procijene anomalije, objašnjava Chen. Nakon implementacije, model nastavlja učiti iz stalnog toka novih senzorskih podataka, a ujedno je i fleksibilan pa se može se podešavati za učinkovita predviđanja anomalija u drugim situacijama, poput obrazaca prometa.

Model je nadmašio očekivanja i otkrio veći postotak anomalija u svakom skupu podataka
Model je nadmašio očekivanja i otkrio veći postotak anomalija u svakom skupu podataka

Istraživači sad žele razviti modele koji će moći obraditi i ogromne grafove s milijunima, milijardama međusobno povezanih čvorova. I umjesto da samo pronalaze anomalije, ovim pristupom žele poboljšali i točnost predviđanja na temelju skupova podataka.