Inteligencia artificial en el estudio del plegamiento de proteínas

La idea es inferir posibles errores, los cuales causan enfermedades graves, como la de las vacas locas.

Científicos de la UNAM estudian desde la Física, Química y Medicina el plegamiento de proteínas (proceso natural que ocurre a nivel molecular) y su eventual representación computacional utilizando inteligencia artificial para predecir sus potenciales formas y funciones.


Esta disciplina, en la frontera del conocimiento entre la biología molecular y la inteligencia artificial, busca desarrollar herramientas computacionales para predecir potenciales errores en el plegamiento de proteínas, los cuales causan enfermedades graves, como la de las vacas locas.


“Una proteína es una estructura biológica que está conformada a partir de aminoácidos que pueden unirse a través de un enlace químico (llamado enlace peptídico) y forman estructuras dimensionales lineales denominadas péptidos, los cuales generan funciones cuando tienen una estructura tridimensional específica”, explicó José Israel León Pedroza, del Departamento de Bioquímica de la Facultad de Medicina.


La organización de estas configuraciones individuales determina la función de la proteína, la cual “depende de su estructura”, señaló.


En tanto, la inteligencia artificial está básicamente formada por algoritmos que se entrenan para predecir un resultado, así que la información biológica se representa utilizando ecuaciones y muchos cálculos numéricos y de este modo puede estimarse cómo será la proteína.


Muchas secuencias posibles

Ramón Garduño Juárez, del Instituto de Ciencias Físicas, expuso que las proteínas tienen muchas estructuras y funciones, cuyo problema principal es predecirlas.


Detalló que con cada aminoácido que se añade a una secuencia proteica se multiplican por 20 las posibilidades y “sumamos un número gigantesco de secuencias posibles”.


El físico mencionó que “el problema en la predicción de estructura es cómo pasar del genotipo, que es la información genética, a aminoácidos que van codificados en ARN mensajero y en otras unidades muy precisas que, una a una, se van ensamblando hasta que forman una hilera. Aún no sabemos en qué momento la proteína se pliega”.


Los científicos han desarrollado en los últimos 100 años diversas técnicas para representar este proceso biológico en computadoras cada vez más potentes. “Lo que nos limita, precisamente, es el número de cálculos que tenemos que hacer para predecir. Sabemos que las proteínas se pliegan naturalmente en una escala de milisegundos a segundos. Si consideramos que una típica tiene 100 aminoácidos y cada uno de ellos tiene un número fijo de grados de libertad, el caso mínimo es de tres, la cifra crece a 1047, un número astronómico”, dijo.


Concurso CASP

Rogelio Rodríguez Sotres, del Departamento de Bioquímica de la Facultad de Química, destacó que para avanzar en la representación del plegamiento de proteínas con inteligencia artificial, la comunidad científica internacional realiza el concurso CASP (siglas en inglés de Validación Crítica de la Estructura de las Proteínas), donde en varias ediciones no se logró superar 60 por ciento de las predicciones.


En la edición 13 del certamen la compañía Deep Mind, que contaba con un programa campeón de ajedrez (AlphaZero), logró el reto de 60 por ciento de éxito, utilizando un conjunto de algoritmos llamados Redes Neurales de Inteligencia Artificial, los cuales buscan imitar la capacidad humana para pensar y resolver problemas imitando a las neuronas humanas en forma digital.


Puntualizó que una neurona digital recibe información numérica, ejecuta operaciones y decide si contesta 0 o 1. Pero como en el cerebro, se necesitan miles de conexiones para tener un resultado.


En esta compañía, asentada en Inglaterra, “lograron codificar la información del plegamiento de la proteína de una manera adecuada para dársela a una red neural, que contiene algoritmos que no son fáciles de programar y además hay que entrenarlas”, apuntó.


Hasta ahora, los intentos para utilizar la inteligencia artificial en el campo de la biología molecular concentran esfuerzos científicos y tecnológicos en varias partes del mundo.