Región de Murcia
Fundación Séneca
FSE

Computational perspectives in the development of graph neural network models of human variation pathogenicity

Nace en Cartagena en 1999. En 2022 obtiene el grado de ingeniero en informática y el grado de matemáticas por la Universidad de Murcia, cursando el programa conjunto de estudios simultáneos (PCEO). A continuación cursa el máster universitario en tecnologías de análisis de datos masivos: Big Data en la Universidad de Murcia, obteniendo el título de máster en el año 2023. Obtuvo en el curso 2021-2022 la beca de colaboración del ministerio para iniciación a la investigación en la universidad de Murcia. Estuvo contratado como becario de investigación de 2022 a 2023 asociado a un contrato de investigación para el departamento de ingeniería de la información y las comunicaciones de la universidad de Murcia. En el año 2023 obtiene una ayuda de la Fundación Séneca para realizar la tesis doctoral en la Universidad de Murcia. Domina la lengua española y tiene conocimientos de la lengua inglesa.

Resumen de tesis

En el campo de la genética constantemente se producen descubrimientos de nuevos genes asociados a enfermedades concretas mediante mutaciones de su código genético. El proceso mediante el cual se cataloga una variante genética a una enfermedad o fenotipo es complejo, ya que requiere determinar que función cumple la variante en el organismo del individuo. Es posible predecir el carácter dañino de esa función con métodos computacionales. En la actualidad, estos modelos se han construido a partir de datos tabulares, como los predictores CADD y REVEL. Sin embargo, muchos de los datos usados para describir conocimiento asociado con salud y enfermedades, también las genéticas, tiene naturaleza de grafo.

Esta tesis se va a centrar en el uso de redes neuronales de grafos para la predicción de asociaciones entre fenotipos y genes. Con los métodos actuales, se han mostrado más precisos sistemas de predicción de patogenicidad de las variantes cuando se centran en enfermedades concretas, por lo que exploraremos específicamente las asociaciones relacionadas con las epilepsias. Además,  trabajaremos también con todas las variantes comparando que hace único a las epilepsias del resto de enfermedades con base genética.

Una de las principales dificultades que nos encontramos con el deep learning cuando lo aplicamos en entornos médicos, consiste en que las predicciones realizadas por dichos modelos pierden efectividad si no somos capaces de explicar qué lleva al proceso de inferencia a generarlas. El ML explicable estudia cómo desarrollar predicciones que puedan explicarse a los usuarios receptores de dichas predicciones. En esta tesis contamos con esta dificultad por ser crítica en entornos médicos. Por tanto, la abordaremos desde el principio desarrollando técnicas específicas del modelo de red neuronal para proporcionar explicaciones.

Área de conocimiento

Informática

Grupo de investigación

Director: Juan Antonio Botía Blaya
Codirector: Alejandro Cisterna García

Programa de doctorado

Doctorado en Informática

Período de Actividad

01/03/2024 - 28/02/2027

Estado de tesis

En desarrollo

Aviso legalPolítica de privacidad