Prednosti modela izučenih na sintetičkim podacima

Upotreba takvih modela eliminira neka pitanja privatnosti, autorskih prava i etike zbog korištenja stvarnih podataka

Mladen Smrekar petak, 4. studenog 2022. u 12:14

Naučiti stroj da prepozna ljudske radnje ima mnogo potencijalnih primjena, poput automatskog otkrivanja pada radnika na gradilištu ili omogućavanja pametnom kućnom robotu da tumači geste korisnika. Kako bi to učinili, istraživači obučavaju modele strojnog učenja koristeći goleme skupove podataka video isječaka koji prikazuju ljude dok izvode radnje. 

Osjetljivi podaci

Prikupiti i označiti milijune, milijarde videozapisa skupo je i zamorno, a ti isječci često sadrže osjetljive podatke, poput lica ljudi ili brojeva registarskih pločica. Korištenje ovih videozapisa također može kršiti zakone o autorskim pravima ili zaštiti podataka. 

Skup podataka SynAPT sadrži 150 akcijskih kategorija, s 1000 videoisječaka po kategoriji
Skup podataka SynAPT sadrži 150 akcijskih kategorija, s 1000 videoisječaka po kategoriji

Zbog toga se istraživači okreću sintetičkim skupovima podataka. Te podatke izrađuje računalo koje koristi 3D modele scena, objekata i ljudi za brzu proizvodnju mnogo različitih isječaka specifičnih radnji — bez potencijalnih problema s autorskim pravima ili etičkih problema koji dolaze sa stvarnim podacima.

Sintetički zapisi

No jesu li sintetički podaci jednako "dobri"? Koliko dobro funkcionira model obučen s ovim podacima kada se od njega traži da klasificira stvarne ljudske radnje? Istraživači MIT-a, MIT-IBM Watson AI Laba i Sveučilišta u Bostonu izradili su sintetički skup podataka od 150.000 video isječaka koji su zabilježili širok raspon ljudskih radnji. Ti su podaci potom korišteni za treniranje modela strojnog učenja. 

Voditeljice istraživanja Aude Oliva, SouYoung Jin i Emilie Josephs
Voditeljice istraživanja Aude Oliva, SouYoung Jin i Emilie Josephs

Istraživači su koristili tri javno dostupna skupa podataka sintetičkih video isječaka koji bilježe ljudske radnje. Njihov skup podataka, Synthetic Action Pre-training and Transfer (SynAPT), sadrži 150 akcijskih kategorija s 1000 videoisječaka po kategoriji i korišten je za prethodnu obuku tri modela strojnog učenja za prepoznavanje radnji. 

Krajnji cilj

Na kraju se pokazalo da su sintetički obučeni modeli imali čak i bolje rezultate od modela obučenih na stvarnim podacima. Ovaj bi rad mogao pomoći istraživačima da koriste sintetičke skupove podataka kako bi modeli bili točniji u stvarnim zadacima. To bi također moglo pomoći znanstvenicima da identificiraju aplikacije strojnog učenja, najprikladnije za obuku sa sintetičkim podacima.

Rezultati istraživanja pokazuju kako sintetički obučeni modeli postižu i bolje rezultate od modela obučenih na stvarnim podacima
Rezultati istraživanja pokazuju kako sintetički obučeni modeli postižu i bolje rezultate od modela obučenih na stvarnim podacima

"Krajnji cilj našeg istraživanja je zamijeniti prethodnu obuku stvarnih podataka sintetičkom predvježbom podataka. To ima cijenu, ali kad se učini, možete generirati neograničen broj slika ili videozapisa promjenom poze, osvjetljenja... To je ljepota sintetičkih podataka,” kažu istraživači koji planiraju izraditi katalog modela prethodno obučenih korištenjem sintetičkih podataka.