Aquest any el premi nobel de química s’ha concedit per estudis sobre l’estructura de les proteïnes emprant intel·ligència artificial (IA).
Les proteïnes són cadenes formades per 20 aminoàcids diferents en un nombre i seqüència determinada que adopta una estructura tridimensional gràcies a les unions laterals entre aminoàcids llunyans.
La diversitat de la vida demostra la sorprenent capacitat de les proteïnes com a eines químiques. Controlen i condueixen totes les reaccions químiques que junts són la base de la vida. Les proteïnes també funcionen com a hormones, substàncies de senyal, anticossos i els blocs de construcció de diferents teixits.
Fins fa poc a partir d’una seqüència d’amioàcids no es podia conèixer l’estructura tridimensional. Ara s’ha relacionat cada seqüència amb una única estructura.
David Baker ha tingut la meitat del premi per construïr proteïnes completament noves.
Demis Hassabis i John Jumper han aconseguit l’altre meitat per desenvolupar un model d’IA per predir estructures tridimensionals a partir da cada seqüència d’aminoàcids: «Alphafold2».
Així han predit l’estructura d’uns 200 milions de proteïnes conegudes.
Com a part del desenvolupament d’AlphaFold2, el model d’IA s’ha entrenat en totes les seqüències d’aminoàcids conegudes i estructures de proteïnes determinades.
Una seqüència d’aminoàcids amb estructura desconeguda s’alimenta a AlphaFold2, que cerca a les bases de dades seqüències d’aminoàcids i estructures de proteïnes similars.
El model d’IA alinea totes les seqüències d’aminoàcids similars, en espècies diferents, i investiga quines parts s’han conservat durant l’evolució.
En el següent pas, AlphaFold2 explora quins aminoàcids podrien interactuar entre ells en l’estructura de la proteïna tridimensional. Els aminoàcids que interaccionen coevolucionen. Si un està carregat, l’altre té la càrrega contrària, de manera que se senten atrets l’un per l’altre. Si un és substituït per un aminoàcid hidrofòbic, l’altre també és hidrofòbic (que fuig de l’aigua).
Amb aquesta anàlisi, AlphaFold2 produeix un mapa de distància que estima la proximitat dels aminoàcids entre si a l’estructura.
Emprant un procés iteratiu, AlphaFold2 perfecciona l’anàlisi de seqüències i el mapa de distància. El model d’IA utilitza xarxes neuronals anomenades transformadors, que tenen una gran capacitat per identificar elements importants per centrar-se. També s’utilitzen dades sobre altres estructures de proteïnes que es van trobar abans.
AlphaFold2 reuneix un trencaclosques de tots els aminoàcids i prova vies per produir una hipotètica estructura de proteïnes. Això es torna a executar tres vegades fins que AlphaFold2 arriba a una estructura particular.
El model d’IA calcula la probabilitat que diferents parts d’aquesta estructura corresponguin a la realitat.
Alphafold2 ha estat utilitzat per més de dos milions de persones de 190 països. Entre una infinitat d’aplicacions científiques, els investigadors poden comprendre millor la resistència als antibiòtics i crear enzims que poden descompondre plàstic.
La vida no podia existir sense proteïnes.
Ara podem predir estructures de proteïnes i dissenyar noves proteïnes que poden ser útils per un major benefici a la humanitat.