Britanija krivo brojala zaražene koronavirusom

Britanske vlasti koriste Excel za praćenje širenja pandemije COVID-19, što baš i nije najbolji izbor za baratanje velikim bazama podataka. Dodatno, netko je podatke postavio u stupce umjesto u retke

Sandro Vrbanus ponedjeljak, 5. listopada 2020. u 16:00

Microsoftov tablični kalkulator Excel je jedan od najkorisnijih softvera u svijetu biznisa, analiza podataka, financija, istraživanja tržišta i mnogim drugim područjima, no kao takav ima svoja ograničenja. Profesionalcima je jasno za što se Excel treba, a za što ne treba koristiti. U potonju skupinu spadaju obrade velikih količina podataka, za što je preporučljivije upotrebljavati kakvo rješenje za manipuliranje bazama podataka. Međutim, vlastima Ujedinjenog Kraljevstva to izgleda nisu objasnili.

U medijima na Otoku se tako pojavila informacija da je njihov zdravstveni sustav od 25. rujna do 2. listopada prijavio oko 16 tisuća manje pacijenata oboljelih od koronavirusa nego je to zaista bio slučaj. Nadležni su tako iz evidencije "izgubili" točno 15.841 slučaj pacijenata s pozitivnim testom na COVID-19, a analiza je pokazala da je "krivac" za to upravo Excel.

Naravno, pravi krivac je onaj tko je softver na pogrešan način koristio i tako drastično podcijenio broj zaraza u ovoj zemlji. A njega se i dalje traži.

Podaci u ograničenom broju stupaca

Do pogreške je došlo jer je nepoznat netko u Excelov dokument (ručno ili automatizmom) bilježio službene podatke o oboljelima, da bi nakon nekog vremena dostigao njegov ugrađeni limit koji je postavljen na 16.384 stupca i 1.048.576 redaka. Analiza je pokazala da je retke u slučaju zaraze COVID-om nemoguće iscrpiti, jer ih je u Ujedinjenom Kraljevstvu manje od milijun, pa je izgledno da je Excel datoteka bila popunjavanja po stupcima.

Kada je dosegnut limit stupaca (zadnja oznaka stupca je XFD, ako ste se pitali), dokument je jednostavno prestao primati nove zapise, što je dovelo do pogrešno izvještavanog broja novih slučajeva zaraze u navedenom razdoblju.

Osim pogrešnog izvještavanja ova pogreška uzorkovala je probleme i u procesu traganja za kontaktima zaraženih, pa je moguće da su tisuće ljudi zbog ovoga zaraženi iako je to moglo biti spriječeno. Engleski zavod za javno zdravstvo (PHE) i zdravstveni sustav (NHS) incident opisuju kao "tehnički problem s unosom podataka koji je sada riješen".

To rješenje problema je, kako se neslužbeno doznaje, primijenjeno tako da je jedna prevelika problematična Excel tablica razlomljena u više manjih dokumenata.

Nadopuna: BBC je doznao kako su podaci o zaraženim u Excel tablici bili zapisivani u recima, a ne u stupcima. Međutim, korišten je stari format .xls datoteka koji ima ograničenje broja redaka na 65.536. Dokument se nadopunjavao automatski, iz manjih dokumenata koje su slale institucije koje su provodile testiranja. Jednom kada je dosegnut limit ugrađen u Excel prije verzije 2007, softver je jednostavno prestao primati nove zapise.