Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra
INNOVACIÓN

El GREC de Cataluña gana el concurso mundial de Aibos

La robótica evolutiva aplica redes neuronales artificiales en cada articulación del juguete

Olivia tiene madera para el baile. Lo ha demostrado en el concurso mundial de Aibos a la que presentó Diego Pardo. Olivia cautivó con su coreografía de la canción Technlogy, de Daft Punk, y se llevó el primer premio: un viaje a la Expo de Aichi.

Como los otros robots Aibos, Olivia camina; pero esta ciberperrita ha aprendido a hacerlo sola, sin programación. Los amos del juguete, el grupo de investigación en Ingeniería del Conocimiento (GREC) de la Universidad Politécnica de Cataluña, han trabajado dos años con técnicas de robótica evolutiva.

El GREC investiga el desarrollo de robots completamente autónomos, "que vayan solos, sin que nadie les diga cómo han de hacer las tareas asignadas ni cómo deben reaccionar ante circunstancias imprevistas", explica Cecilio Angulo, uno de los investigadores.Aibo ERS-7 sale de fábrica caminando de forma programada, aunque con el uso cada robot acaba comportándose de forma única. Prever todas las situaciones que encontrará un robot es imposible. "Se le ha de dotar de una capacidad de reacción frente a situaciones no previstas", cuenta Ricardo A. Téllez, ingeniero de telecomunicaciones y otro investigador del grupo.

Esta capacidad de reacción la estudia la robótica evolutiva, según la cual los robots no se programan en el sentido estricto de la palabra, sino que aprenden ellos mismos a programarse según sus necesidades. El método es similar a la evolución de las especies descrita por Darwin. Angulo propuso utilizar la inteligencia artificial distribuida, aplicando una arquitectura de redes informáticas en los mecanismos que generan las acciones del robot, para hacerla independiente de la plataforma robótica.

En los robots evolutivos, explica Téllez, las conexiones entre motores y sensores se hacen con una red neuronal artificial. Una red neuronal es un programa informático inspirado en el funcionamiento de las neuronas humanas como elemento de procesado de la señal; intenta simular el comportamiento conjunto de las neuronas. En este Aibo las redes neuronales se entrenan de forma que se autoorganizan aprendiendo que actúan sobre cuatro patas. La red define cómo se conectan entre ellos los sensores y los motores del juguete y es una descripción completa del razonamiento del robot.

El modelo ERS-7 tiene 24 tipos de controladores (12 sensores y 12 actuadores). En la primera fase de entrenamiento no supervisado de la red, el perro no sabe nada. Se genera un conjunto de redes con conexiones aleatorias: una población inicial de 40 grupos de 24 redes neuronales. Cada población se simula durante 12 segundos. Se escogen los 20 mejores grupos de redes neuronales que no han hecho caer al ciberperro, según el acelerómetro interno. "Mezclamos estos valores con el algoritmo genético estándar ESP y se crean 20 grupos nuevos de 24 redes neuronales", dice Téllez.

Cada población de redes se prueba unas 10 veces. El proceso se repite hasta que las supervivientes definen un comportamiento del robot adaptado a la tarea deseada y a sus variaciones. Son 400 pruebas por generación y 80 horas de simulación informática para cada uno de los 12 entrenamientos. La red neuronal resultante se copia en la tarjeta de memoria que lleva la panza del robot. Y a caminar.

"Las redes forman una especie de sociedad de cooperación entre ellas, consiguiendo que el robot realice correctamente la tarea solicitada", continúa Téllez. Aprenden a coordinarse: cuando la pata delantera avanza se lo comunica a la pata trasera. El objetivo final es aplicar este método a un gran número de sensores y motores, "y que el conjunto aprenda a autogobernarse de forma similar a como parece que lo hace el cerebro humano, según apuntan diversas teorías sobre el funcionamiento de la mente". A diferencia del programa estándar, las redes neuronales no son tan rígidas y se pueden adaptar a imprevistos como pequeños obstáculos o cambios del terreno.

Ahora Olivia está aprendiendo el conocimiento, como lo hace un recién nacido. Mientras pulen su forma de caminar, buscan 24.000 euros para realizar un experimento pavlovniano. Se trata de añadir al comportamiento reactivo la deliberación. Si el robot huele comida y corre hacia ella y el dueño le regaña para que no se la coma, podría dudar entre esperar a que se marche el amo o a recibir algo mejor. Como si se tratara de conciencia, sería capaz de comprender su entorno y actuar; pero sería añadir tanta información que haría imposible programar el aparato. El robot lo debe ir aprendiendo con el tiempo, asegura Téllez.

GREC: www.upc.edu/web/GREC PROYECTO AIBO : www.ouroboros.org PREMIO: www.aibo-does-daftpunk.com

* Este artículo apareció en la edición impresa del Jueves, 29 de septiembre de 2005