Najveće ljudsko obiteljsko stablo ima 231 milijun loza predaka

Istraživači Sveučilišta Oxford uspjeli su više od 3600 pojedinačnih sekvenci iz 215 populacija povezati u jedno, ogromno stablo

Mladen Smrekar nedjelja, 27. veljače 2022. u 21:25

U lipnju 2000. dvije suparničke skupine istraživača zajednički su došle do grubog nacrta ljudskog genoma. Ono što je započelo nepotpunom mapom naših kromosoma od tada je procvjetalo u ogromno mnoštvo individualiziranih sekvenci koje često sežu daleko u prošlost. Negdje u tom oceanu dekodirane DNK nalazi se priča o našem zajedničkom podrijetlu. 

Povezivanje sekvenci

Potrazi za prapočetkom ispriječilo se niz problema: ogromna masa podataka koje treba obraditi, suptilne razlike u uzorcima, različiti formati i tehnike... No, sada su istraživači Big Data Instituta (BDI) sa Sveučilišta Oxford uspjeli više od 3600 pojedinačnih sekvenci iz 215 populacija povezati u jedno, ogromno stablo, predstavljeno u časopisu Science.

Grane stabla sastoje se od čak 231 milijuna loza predaka. U osnovi ovog stabla nalazi se korijen koji predstavlja osam drevnih, vrlo detaljnih sekvenci ljudskog genoma, s tisućama manjih isječaka. Među njima su tri genoma neandertalaca, genom denisovanaca i mala obitelj koja je živjela u Sibiru prije više od četiri tisuće godina.

"U suštini, rekonstruiramo genome naših predaka i koristimo ih za formiranje niza povezanih evolucijskih stabala koje nazivamo sekvencom drveća", kaže genetičar Anthony Wilder Wohns. "Tada možemo procijeniti kada i gdje su ti preci živjeli."

Sažeta struktura podataka

Njihova metoda slijeda stabla koristi sažetu strukturu podataka, računalni koncept koji predstavlja podatke u optimalnoj količini prostora i ograničava količinu vremena potrebnog da se sve ispita. U ovom slučaju, slijed stabla pronalazi korelacije između različitih grana kako bi olakšao proučavanje velikih skupova informacija.

Rute raspršivanja diljem Azije
Rute raspršivanja diljem Azije

Pretvaranjem podataka u grafove s čvorovima koji predstavljaju različite loze i mapiranjem mutacija duž rubova, ogromne genetske baze podataka mogu se stisnuti u relativno mali prostor, a pristup im je olakšan algoritmima dizajniranim za traženje zanimljivih statistika.


Uključivanje oznaka na zemljopisne lokacije sekvenci omogućilo je timu da procijeni gdje su neki zajednički preci nekada živjeli i kako su se kretali. To otkriva kako je ljudska populacija migrirala iz Afrike i nagovještava promjene u gustoći stanovništva unutar grupa predaka o kojima još uvijek učimo, poput denisovaca.

Kasnopleistocensko okruženje i ljudska rasprostranjenost u srednjoj i istočnoj Aziji
Kasnopleistocensko okruženje i ljudska rasprostranjenost u srednjoj i istočnoj Aziji

Od bakterija do orangutana

Zahvaljujući učinkovitosti ovog procesa, već impresivno stablo ima dovoljno prostora za rast kako u budućnosti bude dostupno više genetskih podataka. 

Širenje ljudskih populacija
Širenje ljudskih populacija

"Genealogija nam omogućuje da vidimo kako je genetska sekvenca svake osobe povezana sa svakom drugom, duž svih točaka genoma", kaže evolucijski genetičar Yan Wong.

Štoviše, isti pristup mogao bi se primijeniti i na druge vrste, što bi jednoga dana moglo pridonijeti globalnoj tapiseriji života na Zemlji, od bakterija do orangutana. A ti bi se podaci mogli koristiti u medicinskoj genetici, u odvajanju pravih veza između genetskih regija i bolesti od lažnih veza, onih za koje vjerujemo da proizlaze iz zajedničke povijesti naših predaka."