_
_
_
_

La realidad tras el vídeo viral de dos IAs que se comunican con pitidos cuando no hay humanos: “Es muy marginal”

La historia de dos agentes digitales que pasan de hablar en inglés a emitir sonidos para ganar eficiencia muestra un escenario de futuro poco probable

Dos IAs hablan con pitidos
Captura del vídeo viral que muestra dos agentes de IA comunicándose a través de pitidos.
M. G. Pascual

Una voz sintética, que se presenta como el agente de inteligencia artificial (IA) de un particular, le pide a otra voz sintética, en este caso el asistente virtual de un hotel, disponibilidad para celebrar bodas en el establecimiento. Están hablando por teléfono. En cuanto los dos interlocutores se dan cuenta de que son asistentes de IA, el del hotel le pregunta al otro si pueden “cambiar a modo GibberLink para tener una comunicación más eficiente”. Acto seguido, las dos máquinas intercambian sonidos que recuerdan a los que hacía el módem en los años 90 cuando se conectaba a internet, aunque más rápidos, o a los pitidos y silbidos con los que hablan R2D2 y otros droides de la saga de La Guerra de las Galaxias.

Este vídeo se ha viralizado en X y nos presenta un escenario que pronto empezaremos a ver, aunque todavía no está claro si en estos mismos términos. Los grandes desarrolladores de IA generativa, desde Google a Microsoft, pasando por OpenAI o Anthropic, ya han anunciado que 2025 será el año en que se popularizarán los llamados agentes de IA, unos asistentes personales que realizarán acciones (como reservar una habitación de hotel) en nombre de los usuarios y en comunicación con otras personas o máquinas. Es un paso más en la evolución de la IA generativa: ya no solo le podremos pedir que procese textos, que nos resuelva dudas o que nos ayude a programar: lo siguiente es darles instrucciones para que hagan gestiones con nuestras contraseñas.

Así definió Sam Altman, director general de OpenAI (la empresa desarrolladora de ChatGPT), a los agentes de IA, que, en su opinión, cambiarán nuestro día a día: “Es un colega supercompetente que sabe absolutamente todo de mi vida, cada correo electrónico, cada conversación que he tenido, pero no se siente como una extensión. Puede abordar algunas tareas al instante y, para las más complejas, salir y hacer una propuesta o regresar con preguntas si es necesario”.

¿Se relacionarán los agentes de IA hablando en su propio idioma robot, tal y como muestra el vídeo? No parece lo más práctico, aunque causa un efecto llamativo. “Si uno quiere que un modelo de IA se comunique con otro, puede enviar directamente la información en modo texto, sin audio, a través de Internet y todavía sería muchísimo más eficiente. No sé si lo que se muestra en la demo podría tener alguna aplicación, pero si la tiene sería muy marginal”, opina Carlos Gómez Rodríguez, catedrático de Computación e Inteligencia Artificial de la Universidad de La Coruña y experto en procesamiento del lenguaje natural, la rama de la IA que busca comprender y generar textos.

En el ejemplo, mientras los asistentes emiten esos sonidos, en las pantallas de los dispositivos (un portátil y un móvil) se muestra el subtítulo de lo que están diciendo. El tiempo en que dura la emisión de los sonidos es mucho menor de lo que se tardaría en articular las frases a las que supuestamente equivalen.

Los desarrolladores responsables del experimento han usado la librería ggwave, disponible en GitHub, para que los asistentes de IA se comuniquen de forma rápida en una llamada telefónica. “Lo que han hecho es programar dos modelos de lenguaje para que, cuando se reconocen el uno al otro como tales, cambien a una forma de codificar la información por tonos de sonido, algo parecido a lo que usaban los antiguos módems. Realmente sigue siendo lenguaje, solo que lo codifican de esa manera. Y tampoco es que los dos modelos decidan espontáneamente hacer eso, como podría parecer si uno ve el vídeo fuera de contexto, sino que les han dado instrucciones explícitas al respecto”, dice Gómez Rodríguez.

En cuanto a la codificación que usan los asistentes en el vídeo, es más eficiente que la voz humana (se transmite más información en menos tiempo), pero sería más práctico todavía mandar la información en formato texto, tal y como señala Gómez Rodríguez.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Sobre la firma

M. G. Pascual
Es redactor de la sección de Tecnología. Sigue la actualidad de las grandes tecnológicas y las repercusiones de la era digital en la privacidad de los ciudadanos. Antes de incorporarse a EL PAÍS trabajó en Cinco Días y Retina.
Rellena tu nombre y apellido para comentarcompletar datos

Más información

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_