Istraživači MIT-a procijenili koliko informacija sadrže podaci

Novi način procjene dobrih aproksimacija otvara nove primjene u medicini, znanstvenim otkrićima, kognitivnoj znanosti i umjetnoj inteligenciji

Mladen Smrekar utorak, 3. svibnja 2022. u 06:00

Nisu svi podaci stvoreni jednaki. Ali koliko informacija će vjerojatno sadržavati bilo koji dio podataka? Ovo je pitanje ključno za medicinska testiranja, osmišljavanje znanstvenih eksperimenata pa i za svakodnevno ljudsko učenje i razmišljanje. Istraživači MIT-a razvili su novi način rješavanja ovog problema, otvarajući nove primjene u medicini, znanstvenim otkrićima, kognitivnoj znanosti i umjetnoj inteligenciji.

Ideja entropije

Teoretski odgovor ponudio je još pokojni profesor MIT-a Claude Shannon u članku "Matematička teorija komunikacije" iz 1948. godine, u kojem je iznio ideju entropije koja nam omogućuje kvantificiranje količine informacija svojstvene bilo kojem slučajnom objektu, uključujući slučajne varijable koje modeliraju promatrane podatke. 

Detalj iz "Kaosa kao spontanog sloma topološke supersimetrije" Billa Smitha, objavljen na stranicama MIT-a
Detalj iz "Kaosa kao spontanog sloma topološke supersimetrije" Billa Smitha, objavljen na stranicama MIT-a

Nažalost, korištenje Shannonove formule može brzo postati računski nerješivo. Ako je proces generiranja podataka jednostavan, kao kod bacanja novčića, takav je i izračun entropije. No, uz samo 10 nepoznanica, a to je obično slučaj kod medicinskih nalaza, već postoji 1000 mogućih objašnjenja za podatke. S nekoliko stotina, postoji više mogućih objašnjenja od atoma u poznatom svemiru, što izračunavanje entropije čini upravo neupravljivim problemom.

Nova metoda

No, sad su istraživači s MIT-a predvođeni Vikashom Mansinghkom, glavnim znanstvenikom Odjela za mozak i kognitivne znanosti, razvili novu metodu procjene dobrih aproksimacija korištenjem probabilističkog zaključivanja, a svoj su rad predstavili na nedavnoj virtualnoj konferenciji o umjetnoj inteligenciji i statistici AISTATS 2022.

Claude Shannon, pokojni profesor emeritus na MIT-u
Claude Shannon, pokojni profesor emeritus na MIT-u

Umjesto da nabrajaju sva objašnjenja, upotrijebili su algoritme vjerojatnosti zaključivanja kako bi prvo zaključili koja su objašnjenja vjerojatna, a zatim su ta vjerojatna objašnjenja iskoristili za izradu visokokvalitetnih procjena entropije. 

Ova metoda otvara nove mogućnosti u medicinskoj dijagnostici, naprimjer bolesti jetre ili dijabetesa. Algoritmi vjerojatnosti zaključivanja mogu se, kažu istraživači, koristiti za procjenu rigoroznih granica informacijskih mjera za koje inženjeri umjetne inteligencije često misle da ih je teško izračunati. A to otvara mnoge nove primjene.