21/06/2010
José Luis Sancho Gómez y Aníbal R. Figueiras Vidal
Teoría y Tratamientos de Señal
Tecnologías de la información y las Comunicaciones
Escuela Técnica Superior de Ingenieria de Telecomunicación - ETSIT
Universidad Politécnica de Cartagena
Cartagena
España
La clasificación de patrones es una línea de investigación multi-disciplinar aplicada en infinidad de ámbitos científicos. Un inconveniente muy común es la presencia de "datos incompletos". La imputación de datos es la solución más extendida en la práctica; sin embargo, falla en un propósito de vital importancia: se lleva a cabo sin considerar que no sólo se deben imputar los valores que faltan, sino que se debe imputar para conseguir buenas prestaciones en clasificación. Para ello, esta Tesis se ha basado en los conceptos de sesgo inductivo y "hint". Un "hint" proporcina una nueva información en el modelado de una tarea y conlleva la incorporación de un sesgo inductivo, facilitando la optimización de parámetros del modelo.
Siguiendo esta filosofía, se poroponen distintas técnicas de aprendizaje máquina que combinan las tareas imputación y la clasificación, proporcionando una estimación de datos incompletos orientada y dirigida por el aprendizaje de la tarea de decisión.