Qasar+: aseguramiento de calidad de ontologías para organizaciones
La digitalización de la actividad científica e industrial está provocando que las organizaciones dispongan de grandes cantidades de datos, que deben gestionar de manera adecuada para poder responder a las necesidades estratégicas de dichas organizaciones. Esto requiere que los datos sean interoperables entre sí, lo cual exige que estén descritos de forma que las máquinas puedan entenderlos y procesarlos adecuadamente, lo cual también facilitaría la aplicación de técnicas de inteligencia artificial sobre estos datos. La forma más adecuada para lograr la interoperabilidad es describir los datos usando ontologías. Las ontologías se han usado como este propósito con éxito en distintos dominios como biomedicina, finanzas, internet de las cosas o ciudades inteligentes. Su popularización y uso como componente importante en sistemas informáticos hace necesario prestar atención a la calidad de estos recursos, aspecto en el que se centra nuestra propuesta, ya que las organizaciones carecen de metodologías y de herramientas que permitan un control de la calidad de las ontologías.
Los métodos de aseguramiento de calidad de recursos semánticos tienen como objetivo identificar posibles problemas de los recursos, tanto para su utilización por parte de humanos como por parte de máquinas, así como sugerir posibles soluciones a dichos problemas. Sin embargo, actualmente no existe ninguna herramienta gratuita ni comercial que apoye a los desarrolladores de recursos en la detección y corrección de errores de modelado, ni que analice las características técnicas de dichos recursos semánticos. Hay que tener en cuenta que muchos de estos recursos son grandes, por lo que el aseguramiento de su calidad requiere un tiempo prohibitivo si se tiene que realizar manualmente.
En los últimos años hemos empezado a desarrollar la plataforma QASAR, que integra distintos resultados de nuestro grupo de investigación: (1) OQuaRE proporciona un conjunto de métricas que piden distintos aspectos relacionados con la calidad de recursos semánticos; (2) OntoEnrich proporciona métodos para analizar los recursos semánticos desde el punto de vista léxico y métricas que se centran en estudiar las correspondencias entre el contenido de los recursos en lenguaje natural para humanos y el contenido en forma de axiomas para la máquina; (3) HURON proporciona un conjunto de métricas relacionadas con la legibilidad del contenido de las ontologías para humanos, y (4) Evaluome permite seleccionar qué métricas tienen un mejor rendimiento desde el punto de vista de la clasificación de recursos semánticos. Estos resultados han sido validados con conjuntos de recursos semánticos ampliamente usados.
En este proyecto se pretende completar el desarrollo de la plataforma QASAR para responder a necesidades identificadas en el sector empresarial, de forma que además de cumplir con las necesidades fundamentales de aseguramiento de la calidad de ontologías, se pueda integrar fácilmente con los entornos de desarrollo y criterios de calidad aplicados en las organizaciones. Es por ello que se definen los siguientes objetivos del proyecto:
- (OB1) Desarrollo de métodos para flexibilizar la ingesta de ontologías, de forma que se pueda importar contenido para QASAR directamente desde plataformas estandarizadas de almacenamiento de ontologías
- (OB2) Personalización del proceso de evaluación de ontologías, de forma que cualquier organización pueda configurar su estructura de proceso de evaluación de ontologías partiendo de una representación estandarizada
- (OB3) Experimentación con repositorios de ontologías existentes, para evaluar y demostrar el potencial de la herramienta
- (OB4) Despliegue de la plataforma global en un entorno de producción realista, para poder ponerla en funcionamiento y facilitar la realización de acciones orientadas a la transferencia