Región de Murcia
Fundación Séneca
FSE

Metodologías basadas en Minería de Datos para el diseño y optimización de técnicas de Clasificación Automática

Nace en Murcia en 1986. En 2009 obtiene la licenciatura de ingeniero en informática por la Universidad de Murcia y obtiene mención honorífica a la excelencia académica por la facultad de Informática. A continuación cursa el máster “Tecnologías de la Información y Telemática Avanzadas” en la Universidad de Murcia obteniendo el título de máster en el año 2010.  En 2010 obtiene el titulo de Grado en Informática por la Universidad de Murcia. Desde 2009 hasta la obtención de la beca FPI actual trabaja como investigadora en el grupo de investigación de Sistemas Inteligentes y Telemática en el departamento de Ingeniería de la Información y las Comunicaciones  en la facultad de Informática de la Universidad de Murcia. En el año 2011 obtiene una beca de la Fundación Séneca para realizar la tesis doctoral en la Universidad de Murcia, donde participa en actividades docentes en los años 2011 y 2012. Paralelamente está asociada al desarrollo del proyecto TIN2011-27696-C02-02. Posee comunicaciones en congresos nacionales e internacionales, así como publicaciones científicas en revistas de carácter internacional. Domina las lenguas inglesa y española.

Resumen de tesis

"La calidad del conocimiento descubierto no solo depende del algoritmo de Data Mining usado, sino también de la calidad del conjunto de instancias empleadas. En la fase de preparación de datos se selecciona y prepara el conjunto de instancias de entrada. Este paso es necesario ya que algunos de los datos son irrelevantes para la clasificación. Además, puede haber datos que afectan a la calidad de la información: datos erróneos, datos faltantes, etc.
A veces debe de cambiarse el tipo de los datos para facilitar el uso de técnicas que requieren tipos de datos específicos, por ejemplo, los atributos continuos pueden ser discretizados. A veces, esta transformación provoca una mejora tanto en precisión como en comprensibilidad. Cuando en la fase de preparación de los datos no es posible mejorar la calidad de los datos de entrada, la modificación de los mismos puede conllevar una pérdida relevante de información, así que la alternativa es adaptar los algoritmos para que puedan trabajar con datos de baja calidad. Este tipo de información de baja calidad aparece bastante en los problemas del mundo real, por esta razón los algoritmos deben ser capaces de adaptarse y poder trabajar con ella."

Área de conocimiento

Ciencias de la Computación e Inteligencia Artificial

Grupo de investigación

Sistema inteligentes
Director: María Del Carmen Garrido Carrera

Programa de doctorado

Doctorado en Informática

Período de Actividad

10/01/2011 - 09/01/2015

Estado de tesis

Defendida

Principales indicadores de producción científico/tecnológicos

J.M. Cadenas, M.C Garrido, R.Martínez and P.P.Bonissone. Extending information processing in a Fuzzy Random Forest ensemble. Soft Computing, pp.1-177, 2011.

J.M. Cadenas, M.C. Garrido, R. Martínez, P.P. Bonissone. OFP CLASS: A hybrid method to generate Optimized Fuzzy Partitions for CLASSification. Soft Computing , 2011. DOI 10.1007/s00500-011-0777-1.

J.M. Cadenas, M.C. Garrido, R. Martínez, P.P. Bonissone. Towards the Learning from Low Quality Data in a Fuzzy Random Forest ensemble. Proceedings of FUZZIEEE-2011, pp. 2897-2904, Taiwan 2011.

J.M. Cadenas, M.C. Garrido, R. Martínez. Generating Optimized Fuzzy Partitions to Classification and Considerations to Management Imprecise Data. Lecture Notes in Computer Science. Studies in Computational Intelligence. Springer 2011.

J.M.Cadenas, M.C.Garrido and R.Martínez. Construing fuzzy partitions from imprecise data. Proceeding FCTA 201, pp.379-388, Paris, 2011.

Resultados mas destacados de la tesis doctoral

- Diseño e implementación de técnicas basadas en Data Mining y Soft Computing para realizar discretización o particionamiento fuzzy.

- Integración de las técnicas de discretización en el ensamble Fuzzy Random Forest, FRF v1.0, con el propósito de mejorar la precisión de clasificación.

- Desarrollo de nuevos métodos de combinación del ensamble Fuzzy Random Forest.

- Adaptación de las técnicas mencionadas anteriormente para proporcionales la capacidad de poder trabajar con datos de baja calidad.

- Mejoras  en la herramienta NIP1.5 que es capaz de trabajar con grandes volúmenes de información. La herramienta cuenta con la  incorporación de nuevas técnicas de particionamiento fuzzy, además de la capacidad de poder trabajar con datos de baja calidad.

Ampliación y estudio de nuevas técnicas y aplicaciones en el campo de los sistemas inteligentes

Resumen actividad a desarrollar

El grupo de investigación ”Automated Scheduling, Optimisation and Planning(ASAP)”realiza una investigación multidisciplinar sobre modelos formales y técnicas para una variedad de problemas de optimización del mundo real: i) Modelización de la complejidad y la incertidumbre inherente en problemas  del mundo real (optimización del transporte público, corte y empaquetado, diseño de horarios educativos, problemas sanitarios, enrutamiento de red, optimización de la cartera, logística de transporte, etc., ii) Desarrollo de sistemas inteligentes que pueden ayudar de forma automática el diseño y construcción más eficiente de métodos de búsqueda, y iii) el desarrollo de nuevas teorías para una comprensión más profunda de los problemas del mundo real y el diseño eficaz de los sistemas inteligentes de ayuda a la decisión.

La experiencia del grupo ASAP le permite ofrecer una perspectiva única y novedosa a distintos problemas, y también proponer y/o trasladar nuevos problemas del mundo real a la comunidad científica informática.

En concreto, y en el marco de los objetivos marcados para el desarrollo de la tesis doctoral, el principal fin a conseguir en esta estancia es el desarrollo y evaluación de nuevas técnicas optimizadas que mejoren el comportamiento y la precisión de los sistemas ante aplicaciones del mundo real.

Para ello, será muy importante el estudio de nuevos métodos y técnicas que traten la incertidumbre presente en distintos problemas reales  y de nuevos métodos y técnicas para realizar las tareas propias de los Sistemas Inteligentes en su aplicación en problemas reales, tales como, clasificación, regresión, modelado, etc. Además, se aplicarán los distintos métodos y técnicas desarrolladas por  el doctorando, como el clasificador fuzzy random forest, la discretización fuzzy de atributos,…  como componentes de los sistemas inteligentes desarrollados en el grupo ASAP.

Es por ello, que el plan estimado de trabajo durante mi estancia en el grupo ASAP lo establecemos como sigue:

i)   Análisis y estudio de las distintas metodologías de optimización desarrolladas por el grupo ASAP y analizar la posible incorporación de sus principales componentes a las distintas técnicas desarrolladas por el doctorando.

ii)   Análisis y estudio de las distintas técnicas de modelado de la incertidumbre desarrolladas por el grupo ASAP.

iii)  Adaptación de técnicas de modelado de la incertidumbre con las que estoy trabajando para incorporar  nuevas fuentes de incertidumbre existentes en la bases de datos de las aplicaciones con las que trabaja el grupo

iv)   Evaluación de las técnicas diseñadas y/o adaptadas.

v)   Estudio de la posible integración de algunas de las técnicas propuestas en las herramientas que he diseñado.

En qué medida favorece la estancia tu línea de investigación en el desarrollo de tu tesis doctoral

La estancia en el grupo de investigación Automated Scheduling, Optimisation and Planning (ASAP research group) de la School of the Computer Science of the University of Nottingham, Nottingham, UK, es de gran importancia y utilidad debido, en general, a tres aspectos:

a)   El grupo de investigación ASAP, liderado por el Profesor Robert John, es de gran visibilidad y prestigio internacional y trata aspectos de gran relevancia en el campo de la tecnología informática y los sistemas inteligentes.

b)   La complementariedad en algunos temas que tratan con la línea de la tesis doctoral, en concreto las técnicas de Optimización y el tratamiento de la incertidumbre, y

c)    La posible aplicación de las técnicas y modelos que estoy desarrollando en mi tesis doctoral a los distintos problemas reales con los que trata el grupo ASAP.ndo está desarrollando en su tesis doctoral a los distintos problemas reales con los que trata el grupo ASAP.

Año de programa

2013

Actualmente investigas en la línea

Sistemas Inteligentes para Entornos Reales Mediante el Diseño y Uso de Técnicas de Soft Computing.

Fecha de Inicio

01/10/2013

Fecha de Fin

31/12/2013

País

REINO UNIDO

Nombre del Centro

School of Computer Science

Departamento del Centro

Automated Scheduling, Optimisation and Planning (ASAP)

Defínelo en una frase

Un grupo de investigación activo y dinámico con gente joven de diferentes culturas que trabajan en diversas y heterogeneas líneas de investigación.

Dinos por qué elegistes este centro

El grupo de investigación Automated Scheduling, Optimisation and Planning(ASAP),  es de gran visibilidad y prestigio internacional y trata aspectos de gran relevancia en el campo de la tecnología informática y los sistemas inteligentes. Además este grupo trabaja directamente en la resolución y optimización de problemas del mundo real, aplicando técnicas de optimización que siguen una línea común con las técnicas desarrollas en mi doctorado.

¿Cómo beneficiará al grupo de investigación de origen las técnicas y conocimientos adquiridos durante la estancia?

Uno de los objetivos de esta estancia es analizar las distintas técnicas de modelado de la incertidumbre desarrolladas por el grupo ASAP. La metodología llevada a cabo en el desarrollo de las técnicas podría aplicarse a las técnicas que se han desarrollado en el grupo de investigación origen, con el objetivo de mejorar desde el punto de vista de robustez y calidad.

¿Los conocimientos adquiridos podrán originar una nueva línea de investigación?

Los conocimiento adquiridos nos permitirán ampliar la línea de investigación actual y además sería posible crear una nueva línea de investigación aplicando técnicas de softcomputing con el fin de mejorar los datos y los resultados que se obtienen en  problemas reales donde se mezlcan  problemas de scheduling con  problemas de routing

Mantiene el grupo de acogida y de origen una relación investigadora estable?¿Crees que en caso de no existir se establecerá?

Actualmente el grupo de origen y el de acogida no mantienen una relación investigadora estable, pero desde mi estancia aquí se iniciará una colaboración de investigación entre ambos grupos.

Háblanos de tu ciudad, aquello que desees resaltar de ella, que te ha llamado más la atención, lo esencial

A la ciudad de Nottinghan puedes llegar desde muchos lugares del Reino Unido, es una ciudad que está muy bien conectada tanto por tren como por bus con sus ciudades adyacentes. Además dispone de un aeropuerto "East Midlands" que se encuentra situado a una hora en bus desde el centro de la ciudad. La ciudad es muy tranquila y el transporte público muy eficiente. Algunos lugares para visitar son: los lagos que se encuentran tanto en el Jubilee Campus como en el University Park Campus, el castillo de Nottingham y entre otros muchos parques, el que más me ha llamado la atención ha sido Wollaton Park. Por último y respecto al alojamiento, la ciudad tiene varias residencias para estudiantes y demás hay muchas casas/apartamentospara alquilar, en la siguiente dirección web se pueden consultar algunas de ellas opciones de alojamiento:  http://www.nottingham.ac.uk/accommodation

Aviso legalPolítica de privacidad