Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra
TRIBUNA i

El ajedrez ha muerto, larga vida al ajedrez

El nuevo rey de este juego ya no es subsidiario de la maestría humana

El ajedrecista Anish Giri, durante la 81 edición del torneo Tata Steel Chess, en Holanda, el 12 de enero.
El ajedrecista Anish Giri, durante la 81 edición del torneo Tata Steel Chess, en Holanda, el 12 de enero. AFP

La expresión “el rey ha muerto, larga vida al rey” se ha hecho popular en algunas monarquías para despedir a un rey fallecido, dar la bienvenida a su sucesor y evitar además la incertidumbre que en general se sitúa en los interregnos. La frase bien podría aplicarse también a la historia del ajedrez desde que las computadoras han comenzado a disputarnos el reinado en el juego. Veámoslo.

El primer programa para jugar al ajedrez nunca se llegó a ejecutar. Lo escribió a mediados del siglo pasado Alan Turing, genial matemático y uno de los padres de la computación y la Inteligencia artificial. Hubo que esperar hasta finales de los setenta para disponer de programas informáticos capaces de jugar al ajedrez a un gran nivel. Dos décadas más tarde, en 1997, Deep Blue, una máquina diseñada por IBM, ganó al entonces campeón del mundo de ajedrez, Gari Kaspárov. El reinado humano acabó ahí.

La proeza de Deep Blue se logró tras invertir IBM varios años en investigación y muchos millones de dólares. La estrategia seguida por este y otros programas informáticos ha consistido básicamente en aunar capacidad de cálculo y conocimiento estratégico en el juego. El conocimiento humano directamente inyectado en el software y el extraído de ingentes repositorios de partidas sirve para guiar qué movimientos explorar y cómo decidir cuál será finalmente el elegido para pasar del análisis a la acción.

La estrategia seguida por 'Deep Blue' y otros programas informáticos ha consistido básicamente en aunar capacidad de cálculo y conocimiento estratégico en el juego

A finales de 2018 se vivió un nuevo hito en el mundo del ajedrez, yo diría que un hito mundial, sin más apelativos. Una empresa británica, Deep Mind, adquirida por Google en 2014, diseñó un programa denominado AlphaZero, capaz de aprender a jugar al ajedrez y a algunos otros juegos, como el Go, partiendo únicamente del conocimiento de sus reglas. Para ello no necesita más que jugar contra sí misma, e ir mejorando su competencia a medida que lo hace.

Después de dedicar unas pocas horas a aprender a jugar, AlphaZero se enfrentó a Stockfish, el mejor programa de ajedrez hasta la fecha, jugando un centenar de partidas. AlphaZero ganó 28 y empató las restantes. Eso sí, Stockfish jugó, digámoslo así, con un mano atada a la espalda, al serle limitada su librería de aperturas y el tiempo disponible para cada movimiento.

En diciembre de 2018 se publicaron los resultados de una nueva contienda con reglas del juego menos restrictivas. AlphaZero volvió a apabullar a Stockfish. De un millar de partidas ganó 155 y solo perdió 6, empatando el resto.

AlphaZero aprende a través de complejos algoritmos que se basan en el denominado aprendizaje por refuerzo, común en el aprendizaje humano y de otros seres vivos. Si se toma una decisión que con el tiempo se muestra adecuada, se obtiene un refuerzo positivo que reafirma dicha decisión para el futuro. Del mismo modo, se penalizan decisiones equivocadas. Esto permite a la máquina aprender sin ningún conocimiento previo, más allá, evidentemente, del de las reglas del juego y su objetivo. Tras el aprendizaje, AlphaZero opera en general como cualquier programa de ajedrez, analizando un gran conjunto de posibles movimientos y eligiendo finalmente el más prometedor de ellos.

Estamos muy lejos de lograr que una máquina tenga la capacidad de aprendizaje general de una persona. Eso sí, esperemos que antes de que lo logren hayamos previsto cómo hacer que sea solo para nuestro bien

Pero también aquí hay una diferencia importante con programas como Stockfish. AlphaZero reduce en un millar de veces el número de movimientos explorados en cada etapa por este. Aún así, la cantidad sigue siendo muy superior a los pocos cientos de movimientos que en general tiene en cuenta un experto en el juego antes de mover una de sus piezas, lo que pone en evidencia que la habilidad humana en el juego es una obra maestra de la inteligencia natural. Además, un experto humano podría de pronto jugar a una variante del ajedrez en la que, pongamos por caso, los caballos en lugar de moverse en “L” se moviesen en diagonal, como los alfiles. Sin embargo, AlphaZero tendría que volver a aprender a jugar desde el principio a este nuevo juego. Estamos muy lejos de lograr que una máquina tenga la capacidad de aprendizaje general de una persona. Eso sí, esperemos que antes de que lo logren hayamos previsto cómo hacer que sea solo para nuestro bien.

Uno de los resultados que más ha sorprendido a los expertos es que AlphaZero ha aprendido estrategias que se habían escapado hasta ahora al desarrollo humano del ajedrez. Quizás la mejor forma de describirlo la ha dado el gran maestro del ajedrez Peter Heine, al afirmar que siempre se había preguntado cómo jugarían al ajedrez seres de una especie superior, más inteligente que la nuestra, pero que ya tenía la respuesta.

De nuevo, a rey muerto, rey puesto, pero en este caso con ambos reyes pertenecientes a una nueva dinastía, la de las máquinas inteligentes. Al rey muerto le enseñamos sobre todo nosotros a jugar pero el nuevo rey del ajedrez ya no es subsidiario de la maestría humana en el juego. Incluso ha aprendido y nos enseña cosas que desconocíamos. Eso sí, nos debe su creación como una asombrosa máquina de aprendizaje de problemas específicos y muy sencillos de describir, aunque enormemente complejos de resolver.

Senén Barro. CiTIUS, Centro Singular en TI de la Universidad de Santiago de Compostela

Crónicas del Intangible es un espacio de divulgación sobre las ciencias de la computación, coordinado por la sociedad académica SISTEDES (Sociedad de Ingeniería de Software y de Tecnologías de Desarrollo de Software). El intangible es la parte no material de los sistemas informáticos (es decir, elsoftware), y aquí se relatan su historia y su devenir. Los autores son profesores de las universidades españolas, coordinados por Ricardo Peña Marí (catedrático de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).

Se adhiere a los criterios de The Trust Project Más información >

Más información