L’IA peut aider à chercher des stratégies gagnantes, mais aussi à reconstituer des jeux disparus, voire inventer de nouveaux jeux.
Cameron Browne, mathématicien australien spécialiste des jeux de connexion, connu dès le début du XXIe siècle pour son expertise du jeu Hex, a effectué des travaux en IA sur la recherche arborescente Monte-Carlo (l’algorithme utilisé par AlphaZero) ce qui l’a mené à fonder un projet de ludo-archéologie. Une composante importante de ce projet est ludii qui comprend notamment
- une carte montrant la répartition géographique de jeux traditionnels,
- une base de données de jeux (traditionnels ou modernes) intéressants à soumettre à des IA,
- une collection d’IA allant du jeu totalement au hasard, jusqu’à l’élagage alpha-bêta qui est parfois capable de prouver rigoureusement l’existence d’une stratégie gagnante ou d’une solution (un problème mathématique est considéré comme un jeu à un joueur),
- Et surtout un logiciel programmé en Java, donc multiplateformes, contenant la base de données et les IA (ainsi qu’un éditeur permettant de créer ses propres jeux).
Dans cet article on montrera sur l’exemple du jeu alquerkonane ce que l’IA peut apporter à l’étude d’un jeu, mais aussi, sur un autre exemple, ce que l’étude des jeux peut apporter à la compréhension de l’IA, et ce que l’IA peut apporter à la création.
Cet article est mis à disposition selon les termes de la Licence Creative Commons Attribution - Partage dans les Mêmes Conditions 2.0 France.
De fait, le minimax ne parvient pas à trouver une stratégie gagnante pour ce jeu :
En effet,
- au début, l’IA Alpha-Beta du joueur 1 a seulement effectué une recherche à la profondeur 10 de l’arbre (completed search of depth 10)
- ensuite l’IA du joueur 2 a fait pareil, sans rien trouver (completed search of depth 11 ; on remarque que quand il y a moins de branches, on peut explorer l’arbre à une profondeur plus grande),
- puis l’IA du joueur 1 explore l’arbre actuel à la profondeur 11 aussi, sans rien trouver ;
- puis l’IA du joueur 2 explore l’arbre à la profondeur 12 (record battu !) mais sans rien trouver non plus ;
- et enfin l’IA du joueur 1 explore l’arbre à la profondeur 16 et là, découvre l’existence d’une stratégie gagnante pour le joueur 2.
Doit-on pour autant en déduire l’existence d’une stratégie gagnante pour celui qui joue en second, comme l’ont intuité plusieurs jeunes champions d’alquerkonane, à peine plus âgés que l’était la créatrice du jeu à l’époque ? Non, car rien ne garantit que pendant ses 2 premiers coups, l’IA du joueur 2 ait joué de façon optimale : faute d’avoir trouvé une stratégie gagnante, elle a joué au hasard.
Ci-dessus on voit que les poissons n’ont que 4 mouvements possibles :
- Le poisson en A6 ne peut aller qu’en B5.
- Le poisson en C6 lui aussi ne peut aller qu’en B5.
- Le poisson en D5 ne peut aller nulle part (il est bloqué par le poisson en C4).
- Le poisson en C4 a deux possibilités : aller en B3 ou en D3.
Mais l’IA UCT du joueur 1 a appris en jouant de nombreuses parties au hasard, que faire aller le poisson en B3 le fait souvent perdre. L’IA va jouer au hasard mais ne choisira le coup C4-B3 qu’avec une faible probabilité, ce qui est représenté par la flèche plus mince sur le plateau (la AI distribution est donc une distribution de probabilité sur les 4 branches de l’arbre du jeu).
L’IA alpha-bêta améliorée donne facilement (en jouant contre elle-même) l’illusion d’un jeu de haut niveau :