La Inteligencia Artificial que gana a los ases del póker

by iat20
inteligencia artificial poker

Los avances en inteligencia artificial han sido notables en los últimos años. Se ha pasado de programas con algoritmos básicos y capacidades limitadas de machine learning, a software capaces de aprender por sí mismos y de mostrar capacidades superiores al ser humano. Lo demostró Deep Blue tras derrotar a Gary Kasparon al ajedrez; lo volvió a demostrar AlphaGo el vencer al campeón del juego Go. Y ahora llega una nueva inteligencia artificial capaz de ganar a los mejores jugadores de póker.

Pluribus, la IA capaz de vencer a jugadores profesionales de póker

Pluribus es un sistema de inteligencia artificial desarrollada en la Universidad de Carnegie Melon (Estados Unidos), con ayuda del todopoderoso Facebook.  Este sistema ha logrado pasar a la historia al ser la primera I.A. capaz de ganar a cinco jugadores profesionales de póker en la disciplina Texas Hold’em, la más popular de este juego.

El objetivo de sus creadores era que esta inteligencia artificial fuera capaz de jugar partidas sin límite de hasta 6 jugadores. Con vistas a prepararla para este reto, sus creadores enfrentaron previamente a Pluribus contra 5 réplicas de sí mismo, con lo que la I.A. desarrolló un plan de acción que luego mejoró de forma autónoma el enfrentarse a contendientes reales.

¿Cuál fue el resultado? Pluribus logró ganar en la mayoría de ocasiones a jugadores profesionales a lo largo de 10.000 manos de cartas. En total fueron 15 jugadores profesionales, a los que Facebook pagó 50.000 euros, que se fueron turnando para disputar partidas a 6 contra la máquina durante 12 días.

Libratus, el antecedente que sentó las bases

Una de las inteligencias artificiales pioneras en esto de derrotar a jugadores profesionales de póker fue Libratus. Desarrollada por Tuomas Sandholm, este programa también fue capaz de derrotar a jugadores de póker, pero con una salvedad; se trata de partidas a dos, uno contra otro.

Sandholm estuvo más de 20 años dedicado a la creación de una herramienta capaz de ganar al póker a un ser humano. Tras el éxito de Libratus, obtuvo numerosos premios y en 2017 creó su propia empresa de inteligencia artificial, Strategic Robot. Ahora se dedica a la creación de aplicaciones y sistemas gubernamentales, estrategia militar, ciberseguridad o diplomacia.

Entonces, Libratus fue el pionero, pero Pluribus ha ido uno o varios pasos más allá.

La principal diferencia entre ambas inteligencias artificiales es que Libratus solo estaba diseñada para ganar enfrentamientos directos, partidas a dos, la máquina contra un humano.

Sin embargo, Pluribus es capaz de ganar partidas contra cinco oponentes a la vez, lo cual es todo un logro, teniendo en cuenta las características del póquer, un juego en el que entra en juego el azar, el faroleo y la psicología de los jugadores. Es decir, Libratus es capaz de elegir la mejor estrategia aún en casos en los que hay una patente falta de información.

Así gana Pluribus

Al contrario que otras inteligencias artificiales que han conseguido hitos similares (como Deep Blue), la estrategia de Pluribus no se basa en analizar el mayor número de jugadas posibles, sino de simplificar las opciones al máximo. Esto le permite centrarse mucho más en las jugadas potencialmente ganadoras.

Esta es una de las características fundamentales a la hora de manejar la ingente cantidad de información que existe en una partida tan compleja y con tantas variables, muchas de ellas ocultas. Para evitar que valore tal número de variantes, sus desarrolladores incorporaron de forma deliberada un algoritmo que impide a la I.A. centrarse en jugadas futuras, y le obliga a centrarse en la mano en juego. De hecho, Pluribus ha demostrado que, entre todas las variantes que manejan los jugadores en cada mano, a ella solo le hacen falta cinco para conseguir la victoria.

Otra de sus principales características es la capacidad de abstracción. Por ejemplo, a esta inteligencia artificial no le importa que la cantidad jugada sea 500, 501 o 502, ya que agrupa las cantidades para funcionar con bloques de información. De este modo, las probabilidades con las que trabaja son más limitadas y no cambian aunque varíe ligeramente la cantidad apostada.

Además, esta capacidad de abstracción es extensible a las jugadas y estrategias. Para evitar manejar la enorme información que supondría calcular todas las combinaciones posibles de cartas, Pluribus las agrupa. Es decir, para ella es lo mismo una escalera hasta el 8 que una hasta el 9 o el 10.

La combinación de estos y otros algoritmos permite que Pluribus actúe siempre de manera razonada y sin guiarse exclusivamente por las matemáticas.

Además, está la ventaja de que Pluribus no tiene presencia física, algo que en el Póker puede influir. En cualquier caso, la mayoría de jugadores profesionales afirman que actualmente ya se fijan más en los patrones de juego de los rivales y su comportamiento en la partida, que en la expresión facial y corporal. Y aquí es donde se descubre la verdadera genialidad de Pluribus. Los jugadores que se han enfrentado a ella afirman que es casi imposible encontrarle un patrón y que su variedad de jugadas la hace impredecible.

En este vídeo puedes ver la primera parte de las partidas entre la inteligencia artificial Pluribus y estos jugadores profesionales:

En definitiva, otro juego más en el que la Inteligencia artificial demuestra poder ganar al ser humano. ¿Qué será la siguiente? ¿Ver a un robot con gafas de sol y gorra jugando partidas en la sala de un casino?

Otros artículos sobre inteligencia artificial

Related Posts

Leave a Comment

Este sitio web utiliza cookies para mejorar su experiencia. Asumiremos que está de acuerdo con esto, pero puede optar por no participar si lo desea. Aceptar Leer más

Privacy & Cookies Policy