Vídeos Deep Fake: Tecnología, aplicaciones y límites

< Volver

01.02.2021

Para realizar un vídeo de Deep Fake hacen falta dos vídeos, uno para la persona que se quiere suplantar y el otro para la persona suplantada.

El proceso automático de generación de un Deep Fake consiste en utilizar una Red Generativa Adversarial (GAN) basada en Inteligencia Artificial entrenada con millones de imágenes de caras. En esta Red Neuronal se realiza un entrenamiento de las caras de los 2 vídeos, realizando ajustes por cada iteración. En la red existe la parte generativa y la adversarial. La generativa crea el Deep Fake y la adversarial decide si esa cara es fake o real. Cuando el sistema adversarial es engañado por el generativo, la cara se va suplantando en el video fotograma a fotograma.

Como normalmente el resultado del Deep Fake suele tener pequeños fallos, se aplican técnicas de retoque fotográfico por cada fotograma.

Implicaciones éticas y responsabilidad. Riesgo de desinformación

Con las tecnologías orientadas a Deep Fake, ya sea para generar vídeos o audios, hay que tener especial cuidado por el realismo del que dotan a las aplicaciones. Cada día la tecnología está más avanzada y se consiguen resultados más reales; por lo tanto, el peligro de desinformación, confusión y suplantación indebida crece.

Desde Vicomtech apostamos por investigar y aprovechar las oportunidades que ofrecen los avances tecnológicos, pero siempre se debe prestar especial atención al uso que se hace de los mismos, y en este caso concreto, de los vídeos Deep Fake generados. No es lo mismo realizar un vídeo para una campaña publicitaria, que la generación de un vídeo de una persona pública transmitiendo ciertos mensajes que pueden tener un impacto muy grande en la población en general.

Sin embargo, consideramos que es una herramienta más en un cambio que ya estamos viviendo desde hace años y hay que adaptarse. En Vicomtech, cuando surge una propuesta de desarrollo para vídeos o voces Deep Fake, aplicamos nuestro código ético y analizamos detenidamente el origen de la solicitud, el sector al que se dirige la aplicación y las consecuencias de su implementación.

Aunque el desarrollo de las tecnologías propiamente dichas no tiene límites, sí los tienen, y es un tema que hay que analizar muy bien, las aplicaciones concretas de estas tecnologías y su ámbito de transferencia. Un camino claro es la apuesta por la educación en espíritu crítico y regulación, combinando con herramientas de inteligencia artificial que identifiquen cuándo un vídeo es real o no.

En Vicomtech impulsamos también la investigación y desarrollo de este tipo de herramientas que ayudan a analizar los vídeos y a validar tanto su origen como su veracidad antes de ser publicados, cuando sea preciso.

Oportunidades de mercado de los vídeos Deep Fake y aplicaciones futuras

Hay dos vertientes de mercado para este tipo de soluciones. Por un lado, se demandan contenidos digitales de soporte a campañas publicitarias y de marketing en general. En segundo lugar, están las estrategias de comunicación corporativa. En general lo que se solicita es el desarrollo de nuevas aplicaciones dotadas de alto contenido tecnológico con o sin animación que impacten en el público objetivo.

La tecnología ya lleva muchos años ayudando a buscar un buen balance de automatización de las comunicaciones, manteniendo un alto nivel de personalización y todavía queda un largo camino que recorrer. Por ejemplo, muchos de los “bots de software” que actualmente ya nos hablan o escriben, en un futuro cercano probablemente tendrán también su propia “cara”.

Una tercera aplicación que también se está presentando está relacionada con la privacidad, es decir, utilizar la tecnología para preservar la privacidad de las personas en ciertos foros

Está claro que el realismo va a incrementarse y la tecnología va a estar cada vez más accesible en el mercado, lo que va a contribuir a multiplicar las posibilidades de aplicación.

En Vicomtech, tras generar la voz sintética de Franco para el podcast X-Rey, se están recibiendo peticiones de diversa índole de aplicación de estas tecnologías; por ejemplo, de personas con enfermedades que implican un deterioro de voz y quieren asegurar que en un futuro podrán comunicarse con sus seres queridos con su voz actual. Esto da una idea de la envergadura y la infinidad de aplicaciones y sectores a los que se dirigen estas tecnologías.

Algunos consejos para detectar un Deep Fake

A continuación, facilitamos algunos consejos prácticos para detectar un Deep Fake.

Expresiones faciales: ¿Son las expresiones faciales naturales? ¿Los labios se mueven correctamente en coordinación con la voz? ¿Las mejillas se deforman correctamente? ¿Las arrugas de la frente se mueven de acuerdo con las expresiones faciales?
Sombras: en los ojos y cejas, el sistema generativo, genera caras con patrones pero no es capaz de entender en que consiste una sombra, por lo tanto estas anomalías son visibles si uno se fija.
Gafas: el reflejo de las gafas muchas veces genera ciertos brillos en la imagen que hace que el resultado no sea natural.
Parpadeo: la persona parpadea de media 20 veces por minuto, en el algoritmo de generación de DeepFakes, esto no se tiene en cuenta.

Vídeos Deep Fake: Tecnología, aplicaciones y límites

Implicaciones éticas y responsabilidad. Riesgo de desinformación

Oportunidades de mercado de los vídeos Deep Fake y aplicaciones futuras

Algunos consejos para detectar un Deep Fake

Descubre qué mas soluciones desarrollamos para TICs y Media