18/02/2014
Roque Luis Marín Morales
AIKE
Ingeniería de la Información y las Comunicaciones
Facultad de Informática
Universidad de Murcia
Murcia
España
Esta tesis supone distintas aportaciones al campo de la minería de datos de secuencias (SDM). En primer lugar, proponemos una clasificiación clara de los patrones y algoritmos dentro de la SDM. Hacemos un estudio claramente diferenciado en tres distintas dimensiones: representación de sus patrones, su expresividad, y la estrategia de búsqueda utilizada para la extracción de los patrones frecuentes. En esta clasificación hemos encontrado algunas lagunas en los algoritmos existentes en el estado del arte. En segundo lugar, con el fin de completar las lagunas que aún no han sido exploradas, ofrecemos cinco nuevos algoritmos que utilizan diferentes representaciones y estrategias. Finalmente, discutimos la conveniencia de utilizar un algoritmo determinado en función de las propiedades de la base de datos y los patrones que son objeto de nuestro interés.