Informatique Une IA bluffe les pros du poker

ATS

11.7.2019 - 22:03

Avant de gagner contre des professionnels, l'intelligence artificielle s'est entraînée à jouer contre elle-même au poker Texas hold'em, apprenant au fil de décisions aléatoires les subtilités du jeu (photo prétexte).
Avant de gagner contre des professionnels, l'intelligence artificielle s'est entraînée à jouer contre elle-même au poker Texas hold'em, apprenant au fil de décisions aléatoires les subtilités du jeu (photo prétexte).
Source: KEYSTONE/AP/JOHN LOCHER

Après les dames, les échecs, le jeu de go et le poker à deux, une intelligence artificielle a battu des champions de poker dans des parties à six, ont annoncé jeudi des chercheurs. Elle a remporté la mise après 10'000 parties.

L'exploit de cette intelligence artificielle, appelée Pluribus, est décrit dans la prestigieuse revue américaine Science.

«Pluribus a accompli une performance surhumaine au poker multijoueurs, ce qui constitue une étape majeure pour l'intelligence artificielle et pour la théorie des jeux», relève Tuomas Sandholm, professeur de sciences informatiques à Carnegie Mellon, et co-développeur de Pluribus avec le doctorant Noah Brown, actuellement dans l'unité d'intelligence artificielle de Facebook.

«Jusqu'à présent, les grandes étapes d'intelligence artificielle surhumaine en termes de raisonnement stratégique se limitaient à des jeux à deux», poursuit-il dans un communiqué de l'université. Selon les deux concepteurs de Pluribus, la voie est ouverte pour que l'intelligence artificielle résolve davantage de problèmes du monde réel où, comme au poker, des informations sont cachées ou indisponibles et des joueurs bluffent.

Opposée à treize professionnels

Pluribus a d'abord battu deux grands champions de poker, Darren Elias et Chris Ferguson. Chacun a joué plus de 5000 parties contre Pluribus, qui a largement gagné. La machine s'est ensuite opposée à treize professionnels -cinq à la fois- pour un total de 10'000 parties. Là encore, Pluribus est ressortie victorieuse.

Elle s'était d'abord entraînée à jouer contre elle-même au poker Texas hold'em, apprenant au fil de décisions aléatoires les subtilités du jeu. Ses inventeurs l'ont laissée développer ses tactiques, avec des surprises à la clé.

«Sa principale force est sa capacité à recourir à différentes stratégies», a commenté le joueur Darren Elias. «Les humains essaient de faire pareil mais, pour les humains, l'exécution laisse à désirer. La plupart des gens n'arrivent pas vraiment à le faire de façon parfaitement aléatoire et avec constance».

Pluribus a ainsi recouru à des coups surprenants, par exemple une décision souvent considérée comme mauvaise par les pros et appelée en anglais «donk betting», quand un joueur mise de façon agressive quand cela ne présente pas d'avantage tactique. Noah Brown va jusqu'à penser que la victoire de Pluribus pourrait «changer la façon dont les pros jouent au poker».

Retour à la page d'accueil