Distintos niveles de abstracción en patrones no derivables.
En este proyecto, estamos trabajando con tareas propias de Minería de Datos (MD). La MD se centra en extraer conocimiento implícito en grandes cantidades de datos (bases de datos). Una importante rama de la MD es la Minería de Datos Temporal (MDT), en la que este análisis de de bases de datos, una componente temporal es de suma importancia.
Problema combinatorio
Los principales inconvenientes que presentan las técnicas existentes hasta la fecha (estudiadas la mayoría de ellas sobre el tipo de patrones más simple), se dirigen a una necesidad de recursos en cuanto a memoria y tiempo de ejecución, que sobrepasa la tecnología presente en nuestros días, así como el ingente número de patrones que se deduce de estos algoritmos (los cuales son en su mayoría de poca importancia). Estos inconvenientes están directamente relacionados con el problema combinatorio que hay tras la búsqueda de patrones frecuentes en los datos sometidos a análisis. Además de lo anterior, conforme se aumenta en abstracción y en complejidad de los patrones, estos problemas cada vez se agudizan más, con lo que nuevas soluciones serían de una gran ayuda.
Soluciones
Entre las distintas formas de solucionar los principales inconvenientes que presenta el problema de búsqueda de patrones en bases de datos temporales, hay dos principales vertientes:
- Aquellos que añaden restricciones a la hora de encontrar los patrones frecuentes.
- Encontrar patrones que cumplen ciertas particularidades: los conocidos como patrones Closed, Maximales o No-Derivables. Se trata de patrones a partir de los cuales se pueden deducir otros patrones.
Colaboración con ADrem y objetivos
Respecto a esta segunda vertiente, El investigador Dr. Bart Goethals y su grupo de investigación ADrem, persona y grupo con los que proponemos hacer una colaboración en forma de estancia investigadora, son los creadores del tercer tipo de patrones "especiales" o "peculiares": los patrones No-Derivables. De esta forma, el objetivo que se espera alcanzar para la tesis actual, es incorporar este tipo patrones singulares a las distintas formas de abstracción de patrones.
Además, intentaremos fusionar, y crear si es necesario, este tipo de patrones singulares, en los distintos algoritmos de búsqueda que ya tenemos desarrollado, así como aquellos que tenemos desarrollar. Por supuesto, la estancia investigadora también pretende que una figura reconocida en el campo de la minería de datos temporal, tal y como es D. Bart Goethals, evalúe nuestro trabajo realizado, así como nos aporte su conocimiento, para un desarrollo más profundo del trabajo que estamos realizando.
Por último, en esta estancia también se desearía poder obtener distintas fuentes de datos (bases de datos) del grupo ADreM, sobre los que seguir probando y trabajando las técnicas desarrolladas y por desarrollar en nuestra tesis.