La inteligencia artificial resucita la voz de Franco

Los ‘deep fakes’ de personajes históricos abren un debate sobre el uso de la tecnología en el periodismo y los medios

Francisco Franco durante discurso en el acto de  jura de lealtad ante las Cortes lealtad al Jefe del Estado del príncipe Don Juan Carlos de Borbón el 23 de julio de 1969.
Francisco Franco durante discurso en el acto de jura de lealtad ante las Cortes lealtad al Jefe del Estado del príncipe Don Juan Carlos de Borbón el 23 de julio de 1969.

“Mi querido infante, en los momentos en que en cumplimiento del artículo sexto de la Ley de Sucesión, tomo la decisión de proponer a Las Cortes mi sucesor en la jefatura del Estado en favor de vuestro hijo Don Juan Carlos...”. Así empezaba la carta con la que Francisco Franco comunicaba a Juan de Borbón la elección de su hijo como futuro rey de España. En la serie Xrey, podcast sobre la vida del monarca Juan Carlos I disponible ya en Spotify, la escuchamos en la voz del propio dictador. Pero Franco nunca leyó esa carta en voz alta, al menos no existe grabación alguna de ese hecho. Es un algoritmo de inteligencia artificial el que ha generado la voz del difunto para conseguir un recurso narrativo ―nunca antes utilizado en español― en el podcast escrito, narrado y dirigido por Álvaro de Cózar y producido por Toni Garrido.

Los narradores difuntos no son ninguna novedad. El crepúsculo de los dioses de Billy Wilder empezaba con el cadáver su narrador, el joven guionista Joe Gillis, flotando en la piscina de la antigua estrella Norma Desmond. Pero ahora el recurso sobrepasa lo narrativo. Dar voz a personajes históricos se ha hecho con actores e imitadores, pero hoy la técnica permite ir mucho más allá, permite resucitar la voz de los protagonistas de la historia.

La capacidad tecnológica tampoco es nueva. En 2018, conmemorando el centenario de su nacimiento, el diario The Times recreó la voz de John F. Kennedy para dar el discurso que iba a pronunciar el día de su asesinato el 22 de noviembre de 1963. Creada por la agencia Rothco, la campaña JFK Unsilenced utilizaba tecnología de inteligencia artificial para recrear el discurso de The Dallas Trade Mart: “Nosotros en este país, en esta generación, somos, por destino más que por elección, los vigilantes en los muros de la libertad mundial”. La empresa escocesa Cereproc tardó ocho semanas en producir el discurso de 22 minutos. Aislaron todos y cada uno de los fonemas para el inglés americano en la voz de JFK y unieron nuevamente estas pequeñas unidades de habla para conseguir las palabras del expresidente americano. Un complejo puzzle solo posible de resolver con ayuda de la inteligencia artificial.

En el caso de la voz del dictador español el proceso ha sido muy diferente. La empresa vasca Vicomtech, un centro de investigación aplicada sobre inteligencia artificial e interacción del Parque Científico y Tecnológico de Gipuzkoa en Donostia, desarrolló un sistema capaz de convertir un texto en una voz no reutilizando los fonemas sino aprendiendo de los discursos de la persona cuya voz quiere ser replicada. Esta tecnología de machine learning requiere de horas de grabación para tener suficiente material con el que alimentar el algoritmo y que este pueda aprender y entrenarse para replicar con exactitud las características vocales del personaje: tono, articulación, timbre e intensidad, que además pueden ir cambiando a lo largo de la vida de la persona por lo que el sistema debería ser capaz de reproducir la voz de esa persona en un momento preciso de su existencia. En el caso de la voz de Franco se utilizaron multitud de registros.

El primero de ellos, el discurso de Salamanca en 1937, en plena guerra civil Franco avanza la dictadura que planea imponer. El último, solo 20 días antes de su muerte, un enésimo aviso del riesgo de las conspiraciones judeomasónicas. Entre medias, horas de grabaciones recuperadas de Internet y de coleccionistas privados que las conservaban en viejos vinilos. Muchas de ellas con poca calidad de sonido y mucho ruido ambiente por lo que el equipo de Vicomtech explica que los discursos navideños son la materia prima que mejor les ha servido para entrenar al algoritmo.

El resultado es un sistema capaz de convertir en la voz del dictador cualquier texto. Desde cartas de enorme importancia histórica a la letra de la Macarena. Un deep fake con enormes posibilidades narrativas pero que también abre un debate sobre el uso de la tecnología en el periodismo y los medios. ¿Cual es el límite de hacer entrevistas que nunca existieron o escuchar discursos que nunca se pronunciaron? ¿ Dónde está el límite entre la historia y la ficción cuando la tecnología las hace imposibles de distinguir?

Lo más visto en...

Top 50