Aprendizaje supervisado eficiente para el análisis de datos geográficos a gran escala

The present thesis aims to test the viability of the integration of  machine learning capabilities into web map servers. The validation of this hypothesis has been carried out by the  development of a pre-operational prototype. The developed prototype is a platform for thematic mapping by supervised learning from very high resolution remote sensing imagery data  through a web platform. This contribution overcomes the current state of art, characterized by the separation of the two areas, which requires a continuous involvement of remote sensing experts in thematic mapping intensive tasks: labour intensive tasks are supplemented by the integration of the scalability capabilities from machine learning engines and web map servers. With this hypothesis the application field referred to the semi-automatic creation of large scale thematic maps can open up different fields, from agriculture to the environmental monitoring field, to expert users of these applications domains with limited specific knowledge of remote sensing techniques. Semantic tagging algorithms based on supervised classification methods can be exploited for thematic map creation from raster data based on user needs. This requires the integration of machine learning capabilities within web map servers, along with a simple interface that enables navigation and the monitoring of geospatial learning. The adaptive nature of this learning, along with its integration into a web server, requires a classification algorithm characterized by efficient management and processing of data in time scales compatible with traditional web browsing. At the same time, the volume of data managed by remote sensing applications motivates the transfer of the developed methodology to cloud environments under the Big Data paradigm.

Date

2015-12-14

Place

Escuela Técnica Superior de Ingeniería de Bilbao

Abstract

El presente trabajo de tesis doctoral tiene como objetivo comprobar la viabilidad de la integración de funcionalidades de aprendizaje automático en servidores de mapas web. La validación de esta hipótesis se ha realizado mediante su implementación en un prototipo pre-operacional. Esta implementación ha consistido en el desarrollo de una plataforma para el mapeo temático sobre imágenes de teledetección de muy alta resolución mediante aprendizaje supervisado a través de una plataforma web. Integrando las capacidades de escalabilidad de los modernos algoritmos de aprendizaje automático y las de los servidores de mapas web, la hipótesis supera el estado del arte actual, caracterizado por la separación de los dos ámbitos que requiere la continua aportación del experto de teledetección en tareas de mapeo temático intensivo. Mediante esta aportación, se abre el campo aplicativo referido a la creación semi-automática de mapas temáticos dedicados y a gran escala en diferentes ámbitos. Estos van desde la agricultura hasta la monitorización medioambiental, por parte de usuarios expertos de dichos dominios aplicativos y sin conocimientos específicos sobre técnicas de teledetección. Dicho desarrollo se fundamenta en facilitar la explotación de datos de teledetección mediante plataformas de aprendizaje automático de fácil acceso que aumenten las capacidades de análisis de datos, de forma que los campos aplicativos puedan expandirse. Estas capacidades pueden concretarse en algoritmos de etiquetado semántico basados en métodos de clasificación supervisada, de forma que un mapa temático pueda ser generado a partir de datos raster adquiridos por sistemas de teledetección y en función de las necesidades del usuario. Para ello, es necesaria la integración de capacidades de aprendizaje automático dentro del servidor de mapas web, junto con una interfaz sencilla que permita la navegación geoespacial y la supervisión del aprendizaje. El carácter adaptativo del aprendizaje, junto con su integración en un servidor web, requiere un algoritmo de clasificación con una gestión y procesamiento de datos eficiente en términos de tiempo de procesamiento compatibles con la navegación web tradicional.  Al mismo tiempo, el volumen de datos gestionado por aplicaciones de teledetección motiva el traslado de la metodología a entornos en la nube bajo el paradigma Big Data. 

Author

Javier Lozano Silva

University

UPV/EHU