Región de Murcia
Fundación Séneca
Ficha descriptiva

Técnicas eficientes de análisis de datos para un mundo conectado.

Un impulsor clave de la revolución digital es el denominado Internet de las Cosas (Internet of Things, IoT), donde multitud de dispositivos heterogéneos (desde dispositivos móviles personales hasta complejas estaciones meteorológicas) están completamente conectados a una red global, interactuando entre sí en tiempo real. Dos factores clave que sustentan esta revolución son:

  1. (1) los datos, que pueden llevar patrones ocultos, correlaciones, así como otro tipo de información valiosa,
  2. (2) el análisis de datos en tiempo real, ya que el conocimiento a menudo es sensible a un contexto temporal y útil solo en un marco de tiempo específico.

El mundo basado en IoT genera zettabytes de "datos oscuros" que nunca llegan a ser analizados. Además del volumen de datos generados, otro reto importantes es la velocidad con que dichos datos se generan. Así, por ejemplo, el 90% de los datos almacenados en el mundo se generaron en los dos últimos años.

Un amplio catálogo de técnicas, algoritmos y procedimientos enmarcados en el aprendizaje máquina (machine learning) se han vuelto herramientas esenciales para el análisis predictivo de cantidades masivas de datos, pero la computación de alto rendimiento (High Performance computing, HPC) desempeña un papel igualmente importante, especialmente cuando la respuesta en tiempo real es fundamental para el dominio de aplicación. La intersección entre ambas disciplinas, machine learning y HPC, es crucial cuando se dispone de grandes conjuntos de datos, complejos y que además deben ser calculados, almacenados y analizados muy rápidamente en un entorno altamente escalable.

Tradicionalmente, los algoritmos de machine learning se han realizado de manera centralizada en grandes repositorios de datos, donde el rendimiento prevalece sobre la eficiencia energética, utilizando un enfoque de computación en la nube. Sin embargo, recientemente se han propuesto otros enfoques, en donde cómputos relacionados con el tratamiento preliminar sobre los datos (tales como borrado de outliers y/o agregación simple) se llevan a cabo cerca de (o en realidad en) el dispositivo de captura. Para poder realizar este enfoque, se debe proveer de recursos computacionales, de almacenamiento y de red en los extremos de las redes (es decir, en el "borde" de la red). Este paradigma emergente se conoce como edge o fog computing, donde el procesamiento cercano a dispositivos móviles o sensores puede proporcionar ahorros de energía, servicios web altamente receptivos para computación móvil, escalabilidad y aplicación de políticas de privacidad para Internet de las Cosas, así como la capacidad para enmascarar las interrupciones transitorias de la nube.

Este proyecto se desarrolla exactamente en esta intersección hardware-software para habilitar el análisis de datos en tiempo real en entornos de IoT. Para ello, se desarrollarán técnicas eficientes y optimizadas de machine learning para el análisis de datos provenientes de un amplio rango de sensores que permitan cumplir con requisitos así como abordar las limitaciones del análisis en tiempo real, así como un framework de software para la computación en el borde de la nube integrada en la infraestructura de IoT. Tomando estos elementos en conjunto, este proyecto seguirá un enfoque holístico, trabajando en todas las capas computacionales (desde hardware hasta software). Después de la finalización de este proyecto, es de esperar que diversas empresas y organizaciones en sectores privados y públicos se beneficien de nuestra infraestructura para el análisis de datos masivos en tiempo real y sensible al contexto en entornos de IoT.

Programa

Generación de Conocimiento Científico de Excelencia

Convocatoria

Ayudas a la realización de proyectos para el desarrollo de investigación científica y técnica por grupos competitivos 2018

Área

Tecnologías de la información y de las comunicaciones (TIC) / Computación de Altas Prestaciones (C4)

Expediente

20813/PI/18

Investigador

Muñoz Ortega, Andrés

Grupo de Investigación

UKEIM: Universal Knowledge Enhancem