Política de cookies

Utilizamos cookies propias y de terceros para ofrecerte una mejor experiencia de navegación.

Si continúas navegando, consideramos que aceptas su uso. Puedes obtener más información en nuestra  Política de cookies.

 visual interaction & communication technologies

Procesamiento del Habla

Tecnologías de texto a voz, conversión y transformación de voz, reconocimiento del habla, clasificadores y otras

El procesamiento del habla es el análisis (con técnicas de procesamiento digital de la señal) del habla humana.El procesamiento del habla consta de varios aspectos, según el enfoque del análisis: síntesis del habla, reconocimiento de voz o del habla, reconocimiento del interlocutor, análisis de voz, codificación y compresión del habla, realce del habla, diarización del locutor, etc.

La investigación de Vicomtech-IK4 se centra en las siguientes líneas:

  • Las tecnologías de texto a voz (TAV) se utilizan para sintetizar el texto hablado generado por ordenador, que se asemeja a la voz humana, con un texto redactado que se utiliza como entrada. El TAV produce un habla humana de manera artificial.
  • La conversión y la transformación de la voz permiten modificar digitalmente cualquier voz (voz de origen) para que se asemeje perceptiblemente a la voz de un interlocutor específico (voz de destino).
  • El reconocimiento automático del habla (RAH) consiste en la conversión automática, asistida por ordenador, del lenguaje humano hablado en su correspondiente texto escrito.
  • Los clasificadores y otras tecnologías de reconocimiento de patrones permiten la clasificación de la información según unos criterios predefinidos. La información puede ser de naturaleza diversa:visual, textual, acústica, etc.

 

Galería

Proyectos destacados