DeepMind može predvidjeti oblik svakog proteina u ljudskom tijelu

Razumijevanje strukture proteina može pomoći istraživačima da uđu u uzroke bolesti i omogući otkriće novih lijekova

Mladen Smrekar nedjelja, 1. kolovoza 2021. u 06:00

DeepMind, Alphabetova tvrtka za razvoj i implementaciju umjetne inteligencije, uskoro će objaviti bazu podataka o obliku svakog proteina poznatog znanosti, njih više od 100 milijuna. Riječ je o svakom strukturiranom proteinu u ljudskom tijelu, kao i u 20 istraživanih vrsta, uključujući kvasac, bakteriju E. coli, voćne muhe i miševe.

Točnost na atomskoj razini

Prije nego što je pokrenut projekt AlphaFold, koji umjetnu inteligenciju koristi za predviđanje oblika proteina, samo je 17% proteina u ljudskom tijelu imalo identificirane strukture, javlja MIT-ov Technology Review.  

Slaganje proteina nevjerojatno je složeno. Proteini se sastoje od dugih niti gradivnih blokova, aminokiselina koje se umataju u čudne i komplicirane oblike kako bi oblikovali funkcionalne strukture. Otkrivanje ovih struktura u laboratoriju traje dugo, ali DeepMind je u prosincu objavio da njegov AlphaFold algoritam može odrediti oblik proteina do atoma u nekoliko minuta. 


Dosad je AlphaFold predvidio 36% ljudskih proteina s točnošću na atomskoj razini, a više od polovice predvidio je s točnošću dovoljno dobrom da potakne istraživanje funkcija proteina. Otprilike trećina proteina u tijelu nema strukturu ako se ne vežu za nešto drugo pa DeepMind ne može točno predvidjeti njihov oblik.


Predviđanja pomoću neuronske mreže

AlphaFold ta predviđanja koristi pomoću neuronske mreže, vrste algoritma namijenjenog oponašanju načina na koji mozak obrađuje informacije, osobito dobrog u prepoznavanju obrazaca u velikim količinama podataka, poput interakcije određenih nizova aminokiselina.

AlphaFold jr dosad predvidio 36% ljudskih proteina s točnošću na atomskoj razini
AlphaFold jr dosad predvidio 36% ljudskih proteina s točnošću na atomskoj razini

Predviđene oblike još treba potvrditi u laboratoriju. Održe li se ti rezultati, to će pomoći proučavanju proteoma ili proteina u određenom organizmu. Istraživači DeepMinda objavili su svoj otvoreni kod i izložili metodu u dva recenzirana rada objavljena u časopisu Nature.

DeepMind je dosad omogućio slobodan uvid u bazu podataka o oko 350.000 proteinskih struktura. To uključuje oko 20.000 proteina izraženih ljudskim genomom. Kada se proteini "izraze", to znači da se informacije pohranjene u genomu pretvaraju u upute za stvaranje proteina, koji zatim obavljaju određenu funkciju u tijelu.

Biologija virusa i recikliranje plastike

U sljedećim mjesecima tvrtka u bazu podataka planira dodati gotovo svaki sekvencionirani protein poznat znanosti.

Razumijevanje strukture proteina može pomoći istraživačima da uđu u uzroke bolesti i omogući otkriće novih lijekova. Prema DeepMindu, istraživači već koriste otkrića AlphaFolda za proučavanje rezistencije na antibiotike, za proučavanje biologije virusa SARS-CoV-2 koji uzrokuje COVID-19 te za traženje novih enzima koji se mogu koristiti za recikliranje plastike.