Aplikacija otkriva Covid-19 slušanjem promjena u glasu

Fino podešeni algoritmi umjetne inteligencije mogu postići visoku preciznost u otkrivanju zaraze. Besplatni su, omogućuju testiranje na daljinu, a obrada traje manje od minute

Mladen Smrekar nedjelja, 4. rujna 2022. u 19:11

Umjetna inteligencija može se koristiti za otkrivanje infekcije COVID-19 u glasovima ljudi pomoću aplikacije za mobilne telefone, pokazalo je istraživanje predstavljeno na Međunarodnom kongresu Europskog respiratornog društva koji se upravo održava u Barceloni.

Visoka preciznost

Model istraživača Sveučilišta u Maastrichtu i tamošnjeg Instituta za podatkovnu znanost pokazao se točnim u 89% slučajeva, dok je preciznost brzih antigenskih testova pomoću imunološkog ispitivanja bočnog protoka (RDT) uvelike varirala ovisno o proizvođaču. Ti su testovi bili i znatno manje precizni u otkrivanju asimptomatskih slučajeva zaraze. 

UI model korišten u ovom istraživanju točniji je od brzih antigenskih testova i ujedno je jeftin, brz i jednostavan za korištenje
UI model korišten u ovom istraživanju točniji je od brzih antigenskih testova i ujedno je jeftin, brz i jednostavan za korištenje

Ovi rezultati sugeriraju da jednostavne glasovne snimke i fino podešeni algoritmi umjetne inteligencije mogu postići visoku preciznost u otkrivanju infekcije Covidom-19. Besplatni su i jednostavni za tumačenje. Štoviše, omogućuju daljinsko, virtualno testiranje, a obrada traje manje od minute. A to pak, kažu autori istraživanja, omogućuje brzi pregled stanovništva.

Zvukovi covida

Istraživači su koristili su podatke aplikacije COVID-19 Sounds Sveučilišta u Cambridgeu koja sadrži 893 audio uzorka uzetih od 4352 zdrava i 308 zaraženih Covidom-19. Aplikacija se instalira na mobilni telefon korisnika koji prijavljuju neke osnovne podatke, o demografiji, povijesti bolesti i statusu pušenja, a zatim se od njih traži da snime neke respiratorne zvukove. To uključuje kašljanje, duboko disanje na usta i čitanje kratkih rečenica koje se prikazuju na zaslonu.

Aplikacije COVID-19 Sounds Sveučilišta u Cambridgeu
Aplikacije COVID-19 Sounds Sveučilišta u Cambridgeu

Istraživači su potom pomoću Mel-spektrogramske analize identificirali različite karakteristike glasa: glasnoću, snagu i varijacije tijekom vremena. A kako bi razlučili glasove oboljelih od glasova zdravih, izgradili su različite modele umjetne inteligencije; najboljim se pokazao model dugog kratkoročnog pamćenja (long short-term memory, LSTM).

Neuronske mreže

Ovaj model temelji se na neuronskim mrežama koje oponašaju način na koji ljudski mozak funkcionira i prepoznaje temeljne odnose u podacima. Radi sa sekvencama, što ga čini prikladnim za modeliranje signala prikupljenih tijekom vremena, poput glasa, zbog svoje sposobnosti pohranjivanja podataka u svoju memoriju.

Njegova ukupna točnost bila je 89%, kao i sposobnost ispravnog otkrivanja pozitivnih slučajeva, a sposobnost ispravnog identificiranja negativnih slučajeva iznosila je 83%. Za usporedbu, dok RDT testovi obično propuštaju 44 od 100 slučajeva, umjetna inteligencija s LSTM modelom propušta samo 11 od 100 slučajeva koji bi nastavili širiti zarazu.

Mel-spektrogramskom analizom identificirane su različite karakteristike glasa
Mel-spektrogramskom analizom identificirane su različite karakteristike glasa

Istraživači rezultate žele potvrditi velikim brojevima. Dosad su prikupili 53.449 audio uzoraka od 36.116 sudionika koji se mogu koristiti za poboljšanje i provjeru točnosti modela. Produbit će i analizu kako bi razumjeli koji to parametri u glasu utječu na model umjetne inteligencije.