En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour vous proposer des contenus et services adaptés. Mentions légales.
 
 
 
 

Comprendre l'apprentissage par renforcement à l'aide du jeu de NIM

5e › L'IA et nous › Jeu de NIM
● Intelligence artificielle · Apprentissage par renforcement

Comprendre l'apprentissage par renforcement avec le jeu de NIM

1 heure
5e · Travail en binôme
Comment une IA peut-elle apprendre à gagner au jeu de NIM ?
1
Découvrir
2
Jouer
3
Algorithme
4
IA apprend
5
Quiz

Clique sur une étape pour marquer ta progression

Objectif : Comprendre les règles du jeu avant d'affronter l'IA.
①  Il y a 16 bâtons au départ.
②  À chaque tour, un joueur prend 1, 2 ou 3 bâtons.
③  Celui qui prend le dernier bâton gagne !
④  Joue plusieurs parties contre ton binôme et essaie de trouver une stratégie.
Règle : 16 bâtons. Prendre 1, 2 ou 3 par tour. Celui qui prend le dernier gagne !
16
bâtons restants
0
tes victoires
0
victoires IA
💡 Astuce : essaie de laisser 1, 5, 9 ou 13 bâtons à l'IA. Tu remarques quelque chose ?

1. Clique sur un mot en bas pour le sélectionner. 2. Clique ensuite sur le ??? pour le placer.

# Algo gagnant — SI / SINON avec MODULO 4
SI (Nombre_Allumettes MODULO 4) est ???
  ALORS
    Prendre ??? allumettes
SINON
    Prendre ??? allumette (désé quilibre)
FIN SI
différent de 0 Nombre_Allumettes MODULO 4 1 égal à 0 3

Au début l'IA joue au hasard. Au fil des parties elle mémorise les bons coups et son taux de victoire augmente progressivement !

0
parties jouées
0%
taux victoire IA
Novice
niveau IA
Évolution du taux de victoire
0
10
20
50
100
200
500
1000
1. Quelle est la clé de la stratégie gagnante avec 16 bâtons ?
Toujours prendre 3 bâtons
Laisser un nombre de type 4k+1 à l'adversaire
Prendre au hasard
Toujours prendre 1 bâton
2. Qu'est-ce que l'apprentissage par renforcement ?
L'IA lit toutes les règles dans un livre
L'IA apprend en testant des actions et en recevant des récompenses
L'IA copie ce que fait un humain expert
L'IA utilise toujours la même stratégie
3. Au début de l'apprentissage, comment joue l'IA ?
Elle joue parfaitement dès la première partie
Elle applique l'algorithme optimal immédiatement
Elle joue au hasard et fait beaucoup d'erreurs
Elle demande à un humain quoi faire
4. Que calcule MOD 4 dans l'algorithme ?
Le nombre de bâtons à laisser pour piéger l'adversaire
Le nombre de parties déjà jouées
La vitesse de l'IA
Le score du joueur
FC IA
Remerciements à Mme GAUDICHAU pour cette activité.

Date de création : 05/01/2025 08:17
Catégorie : -
Page lue 336 fois