Modelado estadístico y deep learning para traducción automática de alta calidad.

Modela

Duración:

01.04.2016 - 31.12.2017

El objetivo principal de MODELA es la investigación, desarrollo y validación de técnicas avanzadas de ingeniería lingüística basadas en Deep Learning y
modelado estadístico para la configuración de sistemas de traducción automática de alta calidad en el ámbito de la generación de noticias.

Este objetivo se descompone en una serie de objetivos científico-tecnológicos y objetivos de alcance e impacto. Los objetivos para el ejercicio 2016 han estado encaminados hacia la conceptualización y la especificación de requisitos del proyecto de cara a alcanzar los objetivos definidos inicialmente. En este sentido, los objetivos que se describen a continuación constituyen una serie de objetivos parciales alcanzados en 2016 y cuyo desarrollo se completará en 2017. Los siguientes puntos muestran el objetivo inicial y el objetivo parcial definido dentro del mismo para 2016.

Objetivos científico-tecnológicos 

1. Desarrollo de técnicas y herramientas para la recolección de recursos lingüísticos de fuentes heterogéneas.
a. Identificación de fuentes de recursos lingüísticos: se analizarán las Webs de Argia, EiTB y Consumer para el ámbito de las noticias.
b. Desarrollo de técnicas y herramientas de creación de recursos.
2. Configuración de un sistema de traducción automática estadística para euskera, inglés y castellano.
a. Definición de ámbitos de aplicación y pares de idiomas: se van a abordar los dominios de noticias y el administrativo jurídico, para el primero se trabajará en el par de idiomas español euskera y para el segundo se trabajará en el par inglés español.
b. Desarrollo de un sistema de traducción automática estadística básico
3. Investigación y desarrollo de técnicas y herramientas basadas en Deep Learning para su integración con sistemas de traducción automática estadística.
a. Análisis del estado de la tecnología para el desarrollo de sistemas de traducción automática neuronales basados
en Deep Learning.
b. Definición de requisitos para sistemas de traducción neuronal: se han definido los requisitos de hardware y software adecuado para el desarrollo de estos sistemas. 

4. Desarrollo de un prototipo de sistema para la traducción automática de euskera, inglés y castellano integrando técnicas de Deep Learning.
a. Definición del alcance del prototipo: se ha acordado dedicar el paquete de trabajo 4 a desarrollar un prototipo híbrido entre los sistemas estadísticos y neuronales denominado SMT++ y dedicar el paquete de trabajo 5 a desarrollar un sistema neuronal puro denominado PNMT.

¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.

Vicomtech

Parque Científico y Tecnológico de Gipuzkoa,
Paseo Mikeletegi 57,
20009 Donostia / San Sebastián (España)

+(34) 943 309 230

Zorrotzaurreko Erribera 2, Deusto,
48014 Bilbao (España)

close overlay

Las cookies de publicidad comportamental son necesarias para cargar el contenido

Aceptar cookies de publicidad comportamental