Comprendre l'apprentissage par renforcement à l'aide du jeu de NIM
5e › L'IA et nous › Jeu de NIM
● Intelligence artificielle · Apprentissage par renforcement
Comprendre l'apprentissage par renforcement avec le jeu de NIM
Problématique
Comment une IA peut-elle apprendre à gagner au jeu de NIM ?
Ma progression
1
Découvrir
2
Jouer
3
Algorithme
4
IA apprend
5
Quiz
Clique sur une étape pour marquer ta progression
Étape 1 — Découvrir le jeu de NIM
Objectif : Comprendre les règles du jeu avant d'affronter l'IA.
| ① Il y a 16 bâtons au départ. |
| ② À chaque tour, un joueur prend 1, 2 ou 3 bâtons. |
| ③ Celui qui prend le dernier bâton gagne ! |
| ④ Joue plusieurs parties contre ton binôme et essaie de trouver une stratégie. |
Étape 2 — Jouer contre l'IA
Règle : 16 bâtons. Prendre 1, 2 ou 3 par tour. Celui qui prend le dernier gagne !
16
bâtons restants
0
tes victoires
0
victoires IA
💡 Astuce : essaie de laisser 1, 5, 9 ou 13 bâtons à l'IA. Tu remarques quelque chose ?
Étape 3 — Algorithme à compléter
1. Clique sur un mot en bas pour le sélectionner. 2. Clique ensuite sur le ??? pour le placer.
# Algo gagnant — SI / SINON avec MODULO 4
SI (Nombre_Allumettes MODULO 4) est ???
ALORS
Prendre ??? allumettes
SINON
Prendre ??? allumette (désé quilibre)
FIN SI
différent de 0 Nombre_Allumettes MODULO 4 1 égal à 0 3
Étape 4 — L'IA apprend en jouant (Q-learning)
Au début l'IA joue au hasard. Au fil des parties elle mémorise les bons coups et son taux de victoire augmente progressivement !
0
parties jouées
0%
taux victoire IA
Novice
niveau IA
Évolution du taux de victoire
0
10
20
50
100
200
500
1000
Étape 5 — Quiz bilan
1. Quelle est la clé de la stratégie gagnante avec 16 bâtons ?
Toujours prendre 3 bâtons
Laisser un nombre de type 4k+1 à l'adversaire
Prendre au hasard
Toujours prendre 1 bâton
2. Qu'est-ce que l'apprentissage par renforcement ?
L'IA lit toutes les règles dans un livre
L'IA apprend en testant des actions et en recevant des récompenses
L'IA copie ce que fait un humain expert
L'IA utilise toujours la même stratégie
3. Au début de l'apprentissage, comment joue l'IA ?
Elle joue parfaitement dès la première partie
Elle applique l'algorithme optimal immédiatement
Elle joue au hasard et fait beaucoup d'erreurs
Elle demande à un humain quoi faire
4. Que calcule MOD 4 dans l'algorithme ?
Le nombre de bâtons à laisser pour piéger l'adversaire
Le nombre de parties déjà jouées
La vitesse de l'IA
Le score du joueur
Fiche de connaissance
Date de création : 05/01/2025 08:17
Catégorie : -
Page lue 336 fois
Catégorie : -
Page lue 336 fois