| Foto: 123rf, montaje: javier de la torre - semana

TECNOLOGÍA

AlphaZero, la máquina que revolucionó el ajedrez y podría cambiar el mundo

En ese juego, las máquinas siguen superando a los humanos. Un robot logró jugar con intuición y creatividad, habilidades hasta ahora consideradas exclusivas del hombre. Ahora, ellas les enseñan a los grandes maestros.

22 de diciembre de 2018

En 1997 la batalla definitiva entre el hombre y la máquina parecía resuelta. El campeón mundial de ajedrez Gary Kasparov había caído estrepitosamente ante un frío y calculador rival, la computadora Deep Blue, desarrollada por IBM. Pero la semana pasada surgió un nuevo capítulo de esta historia. En efecto, un grupo de científicos publicó en la revista Science 210 partidas de ajedrez entre AlphaZero, un programa de inteligencia artificial, y Stockfish, la mejor computadora del mundo en este juego. Muchos describieron el resultado como un punto de inflexión en este campo.

En total, AlphaZero jugó 1.000 partidas. Perdió seis, ganó contundentemente 155 y quedó en tablas en las demás. Pero los desarrolladores y los grandes maestros del ajedrez no quedaron atónitos por esas cifras, sino por su estilo de juego excepcional. Mientras que los computadores entrenados en ajedrez prefieren aferrarse a sus fichas, AlphaZero, un programa desarrollado por DeepMind, sacrificó sus peones para tener una posición de ventaja en el juego. Además, demostró que la jugada más popular para empezar, mover el peón del rey hacia adelante –utilizada incluso por los jugadores más avezados–, es una salida errada que los pone en desventaja desde el principio. AlphaZero prefirió comenzar el juego con el peón de la reina dos casillas o el caballo a la posición f3, cuando jugaba con las piezas blancas.

En otras palabras, AlphaZero no decidió sus movimientos como una máquina, sino “con creatividad”, dice Demis Hassabis, quien fundó DeepMind en 2010 para desarrollar inteligencia artificial, y se la vendió a Google cuatro años después. El propio Kasparov, que tuvo acceso a los juegos, manifestó sorprendido que “AlphaZero generó su propio conocimiento”. Al hacer jugadas totalmente diferentes a las conocidas, la máquina ayudó a expandir la sabiduría de los humanos en este deporte. “Fue como descubrir las notas secretas de un gran jugador del pasado”, dice Mathew Sadler, gran maestro británico. Natasha Regan, también maestra internacional, se refirió a los juegos como “excelentes. No es común encontrar en la vida algo más maravilloso de lo soñado”.

La verdad, AlphaZero no es como los demás. A diferencia del computador Deep Blue y otros, programados con instrucciones y trucos de los grandes maestros con siglos de experiencia, este software recibió muy poca información: las reglas básicas del juego y la intención de ganar. Y AlphaZero se autoentrenó mediante técnicas de aprendizaje profundo y de refuerzo, con base en prueba y error. Después de 1.000 partidas contra sí mismo se convirtió en un maestro. No solo aprendió por sí solo las habilidades de los más grandes jugadores, sino que creó nuevas jugadas de su propia cosecha.

Le sugerimos: Mundial de ajedrez: el campeonato donde no todos los países tienen el mismo derecho

Además, logró todo esto en cuestión de horas. Según Hassabis, en la mañana AlphaZero jugaba al azar, pero para la hora del té ya tenía un nivel de superhumano, y para la cena ya era el mejor ajedrecista virtual de la historia. “Es ajedrez de otro planeta, sacrifica piezas para abrir nuevas líneas de ataques porque en realidad le interesa la movilidad, algo completamente diferente a la forma como juegan la gente y otros computadores”.

Hassabis ya había visto algo similar un par de años atrás cuando desarrolló AlphaGo. Entonces, el reto era lograr un programa que aprendiera a jugar Go, la prueba oriental milenaria que consiste en encerrar con unas fichas de piedra áreas de territorio en un tablero cuadriculado. Hasta ese momento, los expertos consideraban que las máquinas no podrían derrotar a los humanos porque el Go, mucho más complejo que el ajedrez, depende mucho de la intuición. Mientras que en el ajedrez cada jugador tiene 35 posibles movimientos para escoger en cada turno, en Go pueden tener 200. O como Hassabis prefiere decirlo, “El número de posibles posiciones en Go excede el número de átomos en el universo”. En 2016, AlphaGo se enfrentó en Seúl contra Lee Sedol, el Roger Federer del Go. En un evento de varios días que tuvo al país en vilo, la computadora ganó cuatro de los cinco juegos. Sedol estaba abrumado, pues nunca pensó que perdería, pero reconoció que el computador le había ayudado a mejorar. “Me ha dado muchas nuevas ideas”, dijo en su momento.

Este programa utiliza una red neuronal profunda, ya común en procesos digitales. Facebook las usa para etiquetar caras en las fotos, y Google lo hace para identificar comandos hablados en los celulares Android. El proceso funciona de la misma manera que las redes del cerebro humano. Los científicos le enseñan a una red de estas suficientes fotos o lenguaje y al cabo del tiempo esta logra reconocerlos. Lo mismo sucedió cuando la alimentaron con los 30 millones de movimientos de Go. David Silver, programador de esta compañía, explica que las redes neuronales tienen millones de parámetros diferentes, y cada uno aprende sus propias reglas sobre lo acertado en estos juegos. Tanto es así que toma decisiones basada ya no en las normas que sus creadores le codificaron, sino en algoritmos que ella misma aprendió.

La inteligencia artificial ayudaría a crear medicamentos menos costosos para males como el Párkinson y el Alzhéimer

Así, el programa puede determinar un resultado a partir de condiciones que nunca había visto antes. “Tiene un sentido muy sutil de intuición, lo que le ayuda a balancear los diferentes factores en el juego”, dijo Silver al diario The Telegraph. Entender cómo nacen la intuición y la creatividad es crucial porque esas habilidades hasta ahora eran patrimonio exclusivo de los humanos. Ahora estos expertos piensan que las máquinas inteligentes podrían acceder a ellas.

El hecho de que el programa empezara de cero es importante porque mientras más general sea, mejor podrá adaptarse a cualquier otro problema que los científicos quieran resolver en el futuro. En efecto, Hassabis al fundar DeepMind no quería simplemente desarrollar juegos para mostrar las proezas de las máquinas, sino poder resolver, por ejemplo, por qué las proteínas se pliegan mal en enfermedades como el párkinson y el alzhéimer.

Conocer ese tipo de información abriría una puerta para crear medicamentos nuevos y menos costosos, pues actualmente los precios de estos tratamientos aumentan por la dificultad para modelar la química de las proteínas. Un programa de inteligencia artificial podría encontrar una respuesta que los humanos no han advertido –como sucedió con las jugadas de ajedrez– o que les tomaría mucho tiempo hallar. En el futuro, Hassabis cree que un computador de estos trabajará como un científico. Por lo tanto, un día de estos podría producir un descubrimiento mayor, digno de un Premio Nobel.

El desarrollo de la inteligencia artificial preocupa a muchos porque temen que un día el ser humano quede a merced de las máquinas. Pero Hassabis considera que esos miedos son detalles menores ante las grandes posibilidades que ofrece la ciencia para mejorar la vida en la Tierra. “Yo sería más pesimista del futuro si la inteligencia artificial no estuviera en el camino”, dice este experto. A los 14 años, Hassabis fue el segundo mejor ajedrecista profesional del mundo. Aunque abandonó esa afición para dedicarse a la ciencia de la informática, hoy gracias a AlphaZero se siente el mejor campeón.