Una de las claves para este logro que publica Science fue conseguir que Pluribus consiguiera simplificar enormemente la inabarcable cantidad de información y decisiones posibles que se ponen en marcha en una partida tan compleja. El éxito de esta inteligencia artificial es justo lo contrario que aquel DeepBlue que derrotó a Garry Kaspárov. En lugar de tenerlo todo en mente a la hora de decidir la jugada, se trata de lograr simplificar las variables para centrarse de forma intuitiva en las jugadas ganadoras.

Por ejemplo, Pluribus no trata de adelantar los que sucederá hasta el final de la partida, porque incorpora un algoritmo de búsqueda que limita deliberadamente su mirada hacia el futuro. Además, los investigadores descubrieron que, de todas las opciones que tienen en mente los jugadores rivales, a la máquina le bastaba con tener en cuenta tan solo cinco para ganar. La capacidad de abstracción de Pluribus se manifiesta en dos aspectos más: las cantidades apostadas y las distintas jugadas. Por ejemplo, a la máquina le da igual que la apuesta sea de 200 o 201, y sus apuestas se centran en unas pocas opciones limitadas.

Del mismo modo, para no tener que estudiar cada una de las infinitas combinaciones de cartas por separado, Pluribus las agrupa: una escalera hasta el diez y una escalera hasta el nueve son, para la máquina, estratégicamente lo mismo. "La abstracción informativa reduce drásticamente la complejidad del juego, pero puede eliminar diferencias sutiles que son importantes para el rendimiento sobrehumano. Por lo tanto, durante el juego real contra humanos, Pluribus solo la usa para razonar sobre situaciones en futuras rondas de apuestas, nunca en la ronda de apuestas actual", detalla el estudio. Esta máquina, por el momento, se centra en sus propias estrategias y no busca explotar tendencias en sus oponentes, asegura el estudio. Combinados, estos avances hicieron posible ejecutar Pluribus utilizando muy poca capacidad de procesamiento y memoria, el equivalente a menos de 150 dólares en recursos de computación en la nube, según explica Facebook.

Libratus, la versión previa del programa, aprendió sola a echar faroles. Uno de los aspectos más interesantes de Pluribus es su capacidad para poner cara de póker. No tiene una expresión corporal que pueda revelar su jugada, pero los profesionales sí aprenden a reconocer patrones en el juego de los demás: cómo apuestan cuando tienen buenas cartas, cómo reaccionan cuando les retan, etc. "Su mayor fortaleza es su habilidad para usar estrategias mixtas", ha asegurado Darren Elías, jugador profesional que ostenta el récord de títulos ganados en el World Poker Tour. "Eso es justo lo que los humanos intentan hacer. Es una cuestión de ejecución para los humanos: hacer esto de una manera perfectamente aleatoria y hacerlo de manera consistente. La mayoría de la gente simplemente no puede", apunta el jugador. Pluribus calcula cómo actuaría con cada mano posible y luego decide una estrategia equilibrada con todas esas posibilidades: un farol algorítmico para desconcertar a sus rivales.