Hacer que una inteligencia artificial (AI) gane al póker a seres humanos puede parecer a priori un juego. Que el póker lo es, pero no el objetivo que se persigue dado que el famoso juego de cartas tiene un gran "componente humano" que le añade un plus de dificultad a las máquinas. No obstante, de nuevo éstas han ganado la partida a las personas y nunca mejor dicho, dado que una AI ha batido a profesionales de póker rozando el 100% de victorias en más de 120.000 partidas.
Una vez más se trata de la variedad de póker 'heads-up no-limit hold’em', que viene siendo un reto desde hace tiempo para los investigadores que se han dedicado a lograr que las máquinas nos ganen a póker y también era la que los de la Universidad de Alberta (Canadá) y Charles (Rep. Checa) lograban vencer con la suya . Ahí ya vimos que quedaba el reto de que la AI del equipo del profesor Tuomas Sandholm de la Universidad Carnegie Mellon (CMU) batiese a los profesionales en el torneo del Rivers Casino de Pittsburg, y como leemos en Spectrum IEEE lograron cumplir el reto.
Veni, vidi, vici y de noche a repasar
Como leíamos en la revista del MIT al hablar del logro de los investigadores de Alberta y Praga, el profesor se planteó aspirar a ganar a los participantes de este torneo porque según él los jugadores eran unos rivales más duros que los que se habían probado en dicho experimento en el que la AI también había vencido a jugadores profesionales en la complicada variedad de póker. Así, Libratus (como se llama la AI desarrollada por el equipo de Sanholm en la CMU) logró ganar a Jason Les entre otros profesionales.
Los tests se realizaron durante los días que duró el torneo (del 11 hasta el 30 de enero) con un total de 120.000 partidas ganadas. Libratus no es la primera AI que gana a seres humanos al juego como hemos comentado, pero el porcentaje de victorias es significativo estadísticamente al haberlo logrado un 99,7% de las veces.
¿Su secreto? De nuevo es cuestión de algoritmos, pero según matiza Sandholm no han recurrido a algoritmos específicos para póker, sino que son más genéricos y lo que hacen es tomar como input las reglas del juego para elaborar y desarrollar su estrategia, la cual va mejorando a medida que juega más partidas, intentando detectar y aprovechar los errores de sus rivales humanos.
Así, los algoritmos de Libratus partían con una estrategia base previa al torneo. Durante cada mano la AI evaluaba el riesgo en la tercera y cuarta ronda (las rondas turn y river), maniobra a la que Sandholm atribuye el mayor peso de las victorias. De hecho los jugadores notaban que durante estas rondas Libratus tardaba algo más en responder y que efectivamente era especialmente dura en esta parte final de cada mano. Cada noche, además, Libratus estudiaba su estrategia e intentaba corregir errores (parece que no sólo los humanos repasamos el día cuando nos vamos a dormir).
Más allá del tapete
De nuevo aquí lo que es importante es el hecho de que una AI logre vencer a nivel de estrategia cuando se trata de algo sujeto a ese componente humano que decíamos al principio, lo que se conoce como juegos o actividades de información imperfecta o incompleta. Esto es lo que se plantea llevar al terreno práctico de modo que su desarrollo sea útil a la hora de diseñar fármacos para combatir virus resistentes, mejorar la ciberseguridad e incluso en negociaciones y finanzas.
En cuanto al uso en la práctica o mejor dicho a lo que Libratus puede conseguir, al parecer sus logros levantaron alguna alarma en la comunidad de Twitch que estuvo viendo las partidas que se retransmitieron vía la plataforma (como la de Les o la de Kim). Sandholm también opina sobre estas voces que apuntaban a que si estos logros de las AI iban a matar al póker.
La gente está preocupada de que nuestro trabajo haya matado al póker, pero espero que hayamos logrado justo lo contrario. Veo al póker y al 'no limit hold’em' como un esfuerzo intelectual y recreativo del mismo modo que componer una sinfonía, bailar ballet o jugar al ajedrez.
Libratus es el fruto de años trabajo de este equipo de investigadores liderados por Sandholm que aún no está finalizado, dado que según explica el estudiante de doctorado en ciencia computacional Noam Brown (componente del equipo) aún necesita modificaciones de hardware importantes para mejorar su juego y sus cálculos.
En Xataka | Las máquinas "intuitivas" y los faroles: un nuevo software viene para arrebatarnos las victorias en póker
Ver 14 comentarios