_
_
_
_
_

Un algoritmo informático se convierte en el mejor jugador de póquer del mundo

Ni siquiera un humano que jugara 12 horas al día durante 70 años podría vencer a un programa diseñado por investigadores canadienses

Miguel Ángel Criado
En la modalidad Texas hold'em del póquer, los jugadores juegan con dos cartas ocultas y el resto descubiertas.
En la modalidad Texas hold'em del póquer, los jugadores juegan con dos cartas ocultas y el resto descubiertas.Thomas van de Weerd/Wikipedia

Las máquinas ya lo hacen mejor que los humanos cuando se trata de jugar al tres en raya, a las damas o al ajedrez. Pero, por complejos que sean, en estos juegos todo se resume a conocer las reglas y poder de computación (mental o artificial) para simular todas las posibles estrategias. Con el póquer la cosa se complica. Interviene el azar, y los jugadores no tienen toda la información, ya que el rival esconde sus cartas. Sin embargo, incluso en esa situación de incertidumbre, un nuevo algoritmo ha sido capaz de resolver el juego hasta el punto de que ningún jugador humano o máquina podrá ganarle la partida, según una investigación que se publica en la revista Science.

Desde mediados del siglo pasado, con pioneros de la computación moderna como Alan Turing, la inteligencia artificial (IA) siempre ha usado juegos para probar sus teorías. Como dice el profesor del departamento de informática de la Universidad de Alberta (Canadá), Mike Johanson, "para los investigadores de la inteligencia artificial, con cualquier juego, hay dos grandes hitos: la primera vez que un programa informático derrota a un campeón humano y la primera vez que un programa resuelve el juego creando una estrategia matemáticamente perfecta e imbatible, de modo que nunca más pierda con cualquier oponente, humano o máquina, aunque este lo sepa todo del programa".

Eso es lo que ha conseguido CFR+, un algoritmo desarrollado por un equipo de investigadores de la universidad canadiense entre los que está Johanson. Un algoritmo matemático es un conjunto de reglas a seguir durante pasos sucesivos. En la Wikipedia hay un ejemplo gráfico muy sencillo y que también se puede encontrar al final de cualquier manual de instrucciones: Punto de partida, la lámpara no funciona. Paso 1, ¿está enchufada? Si no lo está, enchufar. Si lo está, paso 2, ¿está fundido el foco? Si lo está, reemplazarlo y, si no lo está, paso 3, comprar una nueva lámpara. El problema con el póquer es que las posibles situaciones son casi astronómicas: 319 billones de posibilidades.

Para las máquinas, el póquer es más difícil que el ajedrez por el azar y el desconocimiento de las cartas del rival

Al menos, esos son los conjuntos de información posibles en la versión del póquer descubierto con dos jugadores llamada Texas hold 'em, la más popular y la que se juega en los campeonatos mundiales de este juego de cartas. Aquí, el juego se inicia con el reparto de dos cartas boca abajo para cada jugador. Apuestan, y el que da las cartas saca tres boca arriba con las que tienen que jugar ambos. Si los dos vuelven a apostar se saca una cuarta y hasta una quinta carta. Solo al final del juego, si los dos han apostado, se descubren sus dos cartas.

Esta modalidad del póker, que se puede jugar con o sin límite en la apuesta, es mucho más complicada para una máquina que otros tipos de juegos. En el caso de las damas o Connect-4 (versión del tres en raya ampliado a cuatro), se trata de juegos con información completa donde no hay margen para el azar y los jugadores pueden ver todas las piezas y saben todas las reglas.

Dos de los autores del algoritmo, Michael Bowling (sentado) y Mike Johanson.
Dos de los autores del algoritmo, Michael Bowling (sentado) y Mike Johanson.John Ulan, Universidad de Alberta.

"El póquer es todo lo contrario. Incluye el azar aleatorio de las cartas que te tocan y también cuenta con una información imperfecta, ya que no podemos ver las cartas que tiene el rival", recuerda Johanson. Su algoritmo puede contra el azar, la falta de información y hasta el faroleo. "Ahora es imposible para cualquier rival humano o informático derrotarle, aunque el oponente lo sepa todo del programa, su código fuente, la estrategia que usará, todo salvo las dos cartas que esconde", añade.

En realidad, el algoritmo no es aún perfecto, puede que el humano le gane alguna mano. "Sin embargo, aún usando la contra estrategia perfecta para vencerle, si alguien se pasara toda su vida jugando al póquer contra nuestro programa, jugando 200 partidas a la hora, 12 horas al día, los siete días de la semana durante 70 años, unos 660 millones de partidas, no tendría la certeza estadística de que le va a gana", sostiene el investigador canadiense. Y retan a cualquiera, ya sea humano o máquina a intentarlo. Han habilitado una página donde se puede jugar al póquer con CFR+.

Los investigadores han habilitado una página donde se puede jugar al póquer con CFR+

Este mismo equipo de investigadores es el responsable de Polaris, el primer programa informático que ganó a un profesional del póquer en los campeonatos mundiales de 2008. Pero entonces era imperfecto, el humano ganó algunas partidas. Es decir, podía ganar la mayoría de las veces pero no había resuelto el juego encontrando siempre la mejor estrategia para ganar.

Es más, el algoritmo en que se apoyaba, una versión previa de CFR, habría necesitado disponer de 523 terabytes (TB) de memoria y unos 10.000 años de procesamiento medido en tiempo de uso de un procesador para resolver matemáticamente todas las jugadas del Texas hold 'em. Con CFR+, han conseguido un algoritmo manejable que reduce el juego en subpartidas y que solo necesita 32 gigabytes (GB) de memoria RAM, 11 TB de espacio y apenas 900 años de tiempo de procesamiento. Con 200 nodos de 24 procesadores cada uno, en apenas dos meses, tiene la estrategia imbatible.

Por fortuna, el algoritmo aún tiene sus limitaciones. Está diseñado para el póquer donde hay límite en las apuestas. Además, CFR+ puede vencer a los humanos, pero uno a uno. En el póquer a varias bandas, ya no sería invencible, por ahora.

Más información
Documento: 'Heads-up limit hold’em poker is solved'

Cronología de la victoria de las máquinas

Desde mediados del siglo pasado los teóricos de la computación o de la teoría de juegos, como John von Neumann han ideado programas y máquinas para ganar a los humanos en sus juegos. Estas son algunas de sus victorias.

- 1988, el juego Conecta 4 es resuelto. Ideado en los 70 como una versión más compleja del tres en raya, Conecta 4 se hizo muy popular en la década siguiente. En 1988, el matemático James Allen diseñó la estrategia para ganar siempre. Poco después surgieron algoritmos que, si ellos empezaban el juego, podrían ganar el 100% de las veces.

- Chinook, el primer programa en ganar a un campón humano. En los años 90, se aceptó que las máquinas participaran en el campeonato mundial de damas. En 1996, el programa Chinnok, desarrollado por el actual decano de la facultad de informática de la Universidad de Alberta, se convirtió en el campeón del mundo. Sin embargo, la solución matemática perfecta del juego hubo de esperar hasta 2007. Desde entonces, un humano jamás podría ganar a algoritmos como el de Chinook.

- La guerra inacabada del ajedrez. La serie de duelos entre el ordenador Deep Blue y el campón de ajedrez Gary Kasparov acabó con la derrota de éste en 1997. Hoy, los algoritmos ganarían casi siempre a los humanos pero aún no se ha creado el algoritmo capaz de desarrollar la estrategia matemática imbatible. El problema, sin embargo, es de poder de computación. Las posibles combinaciones son tantas que se necesitarían máquinas que aún no existen, pero es solo cuestión de tiempo.

- La gran victoria de la inteligencia artificial. En 2011, Watson, otro sistema de inteligencia artificial creado por IBM, derrotó a los mejores jugadores humanos del concurso televisivo estadounidenses Jeopardy. La máquina tiene la habilidad de entender cualquier pregunta en lenguaje natural y acceso a todo el conocimiento humano.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Sobre la firma

Miguel Ángel Criado
Es cofundador de Materia y escribe de tecnología, inteligencia artificial, cambio climático, antropología… desde 2014. Antes pasó por Público, Cuarto Poder y El Mundo. Es licenciado en CC. Políticas y Sociología.

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_