La inteligencia artificial y el aprendizaje de las máquinas (machine learning) están descubriendo nuevos elementos de diagnóstico que hasta ahora habían pasado inadvertidos a los investigadores. Y es que la capacidad de cálculo de los superordenadores con datos masivos (big data) permite que se encuentren nuevas coincidencias entre individuos afectados por el mismo mal o fármacos utilizados para tratarlo. Hasta ahora se han conseguido datos nuevos del párkinson y la diabetes de tipo 2, pero extenderlo a nuevas enfermedades es uno de los retos de la bioinformática.

Un estudio del Barcelona Supercomputing Center (BSC) publicado en la revista Nature Communications sobre datos de 70.000 individuos existentes en bases públicas ha permitido identificar siete nuevas regiones del genoma asociadas a un mayor riesgo de padecer diabetes de tipo 2, y otra investigación conjunta con el Centro de Regulación Genómica (CRG), también en Barcelona, ha descubierto un mecanismo que regula la expresión de la proteína alfa-sinucleína en la enfermedad de Parkinson y la atrofia multisistémica, una dolencia considerada rara que mina el sistema nervioso.

En el caso de la diabetes de tipo 2, los investigadores del BSC destacan que hasta ahora ya estaban identificados casi un centenar de patrones genéticos asociados, pero que daban un riesgo de padecerla de entre el 5% y el 30%. El nuevo rasgo genético descubierto, un marcador raro en el cromosoma X, eleva ese riesgo de padecerla al 200% en varones, aunque no tienen aún claro por qué solo les afecta a ellos, si es porque tienen el cromosoma más identificado o porque son los únicos susceptibles. Lo que sí está claro es que señala al gen AGTR2 como posible diana para tratamientos eficientes, afirman los autores del estudio, Silvia Bonàs y otros, dirigidos por Josep Mercader y David Torrents. Hasta ahora, recuerdan, el cromosoma X no se contemplaba en muchos estudios, pese a que afecta al 5% del genoma humano.

Y es que las capacidades de los superordenadores permiten a los investigadores echar imaginación y tener en cuenta detalles que antes pasaban desapercibidos. «Hay muchos estudios que usan datos muy difíciles de obtener solo para sus propias conclusiones y esas muestras pueden tener una segunda vida. Al ver los datos desde otra perspectiva descubres cosas que no se han visto antes y que relacionan enfermedades o efectos. Es plantearse nuevas preguntas desde otro punto de vista», afirma Alfonso Valencia, director del área de ciencias de la vida del BSC y catedrático de ICREA.

«INVESTIGACIÓN PARASITARIA» / El científico, presidente también de la Sociedad Internacional de Biología Computacional, señala que esta nueva perspectiva permite averiguar más sobre la comorbilidad (cómo una enfermedad influye en la posibilidad de tener otra) o para descubrir cómo fármacos que se usan para una dolencia pueden actuar para otra. Este reaprovechamiento es lo que se conoce como «investigación parasitaria», un término creado por la prestigiosa revista New England Journal of Medicine para denostar la práctica de reutilizar datos médicos (caros y difíciles de obtener). Una práctica que, sin embargo, ha logrado ganarse el respeto de la comunidad científica por los hallazgos que supone. «Los autores se retractaron después porque la comunidad bioinformática lo vivió como insulto, aunque luego se han creado unos premios anuales que se conceden a los mejores trabajos», dice Valencia.

«Los datos que usamos son los de las grandes bases, de historiales médicos, las imágenes y la que brindan los pacientes a dispositivos conectados», señala el catedrático. Para los científicos, generar esos datos es vital y piden que se prestigie a quienes los obtienen: los llamados biocurators. «En una investigación se reconoce más el trabajo del que analiza los datos que el del que los recopila. Esto es preocupante, porque la biología informática vive de mantener un conjunto de datos y sus profesionales no ven desarrollarse sus carreras porque no publican».