Región de Murcia
Fundación Séneca
FSE

Metodología para la población automática de ontologías. Aplicación en los dominios de medicina y turismo

Nace en Lorca  en 1981. En 2004 obtiene la Licenciatura en Filología Hispánica y en 2006 la licenciatura en Documentación, ambas por la Universidad de Murcia. A continuación cursa los estudios de doctorado en la Universidad de Murcia obteniendo la suficiencia investigadora en el año 2009. En 2005 obtiene una beca de intercambio SICUE/SÉNECA cursando un año académico en la Facultad de Biblioteconomía y Documentación de la Universidad de Granada. En  2006 obtiene una beca de la Fundación Séneca "i+d+i innovación y transferencia de tecnología" formando parte durante un año de un proyecto desarrollado por la empresa Inmédica y la Universidad de Murcia.  En el año 2008 obtiene una beca de la Fundación Séneca para realizar la tesis doctoral en la Universidad de Murcia, donde participa en actividades docentes en los años 2010 y 2011. Paralelamente está asociada a numerosos proyectos del grupo Tecnologías de Modelado y Gestión del Conocimiento, al que pertenece. Ha realizado estancias externas en Macquarie University en el año 2008, en la Univerta' di Roma La Sapienza en los años 2009 y 2011 y en la University of Illinois at Urbana Champaign en el año 2010.
Posee publicaciones y comunicaciones en revistas y congresos nacionales e internacionales. Domina las lenguas inglesa e italiana.
 

Resumen de tesis

En esta tesis se proponen dos metodologías para la instanciación  automática de ontologías. 

El punto de partida de la primera metodología es el análisis discursivo de los textos de los que se extraerán las instancias. Una vez interpretada la información que  arroja el análisis lingüístico se procede al desarrollo de la metodología, que consta de diversas fases: (1) desarrollo e integración en GATE de patrones lingüísticos y listas de entidades, (2) obtención de un conjunto de anotaciones, (3) clasificación de las anotaciones en las clases o propiedades ontológicas correspondientes. Para el desarrollo de esta tarea se tienen encuenta la distancia cotextual, entendida como la distancia física que existe entre dos entidades en el texto, y en la ganancia de conocimiento, que se refiere a la cantidad de conocimiento que una instancia, y las que con ella se relacionan, puede aportar a la ontología. (4) Finalmente, se comprueba la consistencia de la ontolgía mediante un razonador.

En la segunda metodología propuesta se combinan ontologías de alto nivel del dominio biomédico con frames semánticos extraídos de FrameNet. El resultado es un modelo ontológico, que permite la extracción de relaciones entre entidades en textos de carácter biomédico mediante roles semánticos. Las entidades implicadas en dichas relaciones se convierten en candidatas a instancias de la ontología. Finalmente, un razonador comprueba la consistencia e infiere nuevas instancias, en función de los axiomas definidos. La validación de la metodología se lleva cabo mediante el mapeo del modelo ontológico con una ontología de dominio biomédico y la instanciación de la misma.

Área de conocimiento

Ciencia de la computación e inteligencia artificial

Grupo de investigación

Tecnologíasde Modelado y Gestión del Conocimiento
Director: Rodrigo Martínez Béjar
Codirector: Rafael Valencia García

Programa de doctorado

Técnicas y métodos actuales en información y documentación

Período de Actividad

01/01/2008 - 31/12/2011

Estado de tesis

Defendida

Principales indicadores de producción científico/tecnológicos

Las principales publicaciones con índice de impacto son las siguientes:

Ruiz-Martínez, J.M., Miñarro-Giménez, J.A., Castellanos-Nieves, D., García-Sánchez, F. and Valencia-García, R. Ontology Population: An Application for the E-Tourism Domain. International Journal of Innovative Computing, Information and Control. 7(11) pp. 6115-6134, (2011) (impact factor 2010: 1.664)

Ruiz-Martínez J.M., Valencia-García R., Fernández-Breis J.T., García-Sánchez, F., Martínez Béjar, R. Ontology Learning from Biomedical Natural Language Documents Using UMLS. Expert Systems with Applications, VOL. 38, 12365-- 12378, (2011) (impact factor 2010: 1.926)

Valencia-García R., Fernández-Breis J.T., Ruiz-Martínez J.M., García-Sánchez, F., Martínez-Béjar, R. A Knowledge Acquisition Methodology to Ontology Construction for Information Retrieval from Medical Documents. Expert Systems with Applications, VOL. 25, 314--334, (2008) (impact factor 2009: 1.231)

Entre las comunicaciones a congresos internacionales se pueden destacar las siguientes:

Velardi, P., Navigli, R., Faralli, S., Ruiz-Martínez, JM., A New Method for Evaluating Automatically Learned Terminological Taxonomies. LREC 2012: 8th Language Resources And Evaluation Conference. Istanbul, Turkey, 2012.

Ruiz Martínez J.M., Valencia García R., Martínez Béjar, R., Hoffmann A. Populating Biomedical Ontologies from Natural Language Texts. IC3K 2010, 2nd International Joint Conference On Knowledge Discovery, Knowledge Engineering And Knowledge Management. Valencia, Spain, 2010.

Resultados mas destacados de la tesis doctoral

Desarrollo y evaluación de dos metodologías para la instanciación automática de ontologías que combinan el análisis lingüístico tradicional y tecnologías para la extracción de conocimiento textual. El resultado son recursos de Procesamiento de Lenguaje Natural adaptados a las características lingüísticas de los textos objeto de procesamiento y que proporcionan resultados más exhaustivos y precisos. La inclusión un análisis discursivo sistemátco como parte del proceso de extracción de conocimiento textual es una de las princpales aportaciones de la tesis.

Integración de  recursos lingüísticos y ontológicos ya desarrollados, y ampliamente difundidos entre la comunidad científica, com FrameNet, OBO relations ontology o BioTop ontology que permiten llevar a cabo el proceso de instanciación en dominios como la biomedicina.

Estancias anteriores

Ha realizado diversas estancias externas, en Macquarie University en el año 2008 bajo la supervisión del Dr. Diego Mollà Aliod con el objetivo de desarrollar un sistema de Reconocimiento de Entidades Nombradas en el ámbito de la biomedicina.

En la Univerta' di Roma La Sapienza en los años 2009 y 2011 bajo la supervisión de la Dra. Paola Velardi en donde ha anotado un corpus para la extracción de definiciones de glosario y ha contribuido al desarrollo y evaluación de una herramienta para la extracción automática de taxonomías; y, finalmente. 

Y finalmente una estancia en la University of Illinois at Urbana Champaign en el año 2010 bajo la supervisión de la Dra. Roxana Girju en donde ha realizado un estudio para la  anotación y extracción automática de relaciones de causalidad.
 

Aviso legalPolítica de privacidad