Comprendre l'apprentissage par renforcement à l'aide du jeu de NIM

5e › L'IA et nous › Jeu de NIM

● Intelligence artificielle · Apprentissage par renforcement

Comprendre l'apprentissage par renforcement avec le jeu de NIM

1 heure

5e · Travail en binôme

Problématique

Comment une IA peut-elle apprendre à gagner au jeu de NIM ?

Ma progression

Découvrir

Jouer

Algorithme

IA apprend

Quiz

Clique sur une étape pour marquer ta progression

Étape 1 — Découvrir le jeu de NIM

Objectif : Comprendre les règles du jeu avant d'affronter l'IA.

① Il y a 16 bâtons au départ.

② À chaque tour, un joueur prend 1, 2 ou 3 bâtons.

③ Celui qui prend le dernier bâton gagne !

④ Joue plusieurs parties contre ton binôme et essaie de trouver une stratégie.

Étape 2 — Jouer contre l'IA

Règle : 16 bâtons. Prendre 1, 2 ou 3 par tour. Celui qui prend le dernier gagne !

bâtons restants

tes victoires

victoires IA

💡 Astuce : essaie de laisser 1, 5, 9 ou 13 bâtons à l'IA. Tu remarques quelque chose ?

Étape 3 — Algorithme à compléter

1. Clique sur un mot en bas pour le sélectionner. 2. Clique ensuite sur le ??? pour le placer.

# Algo gagnant — SI / SINON avec MODULO 4

SI (Nombre_Allumettes MODULO 4) est ???

ALORS

Prendre ??? allumettes

SINON

Prendre ??? allumette (désé quilibre)

FIN SI

différent de 0 Nombre_Allumettes MODULO 4 1 égal à 0 3

Étape 4 — L'IA apprend en jouant (Q-learning)

Au début l'IA joue au hasard. Au fil des parties elle mémorise les bons coups et son taux de victoire augmente progressivement !

parties jouées

taux victoire IA

Novice

niveau IA

Évolution du taux de victoire

100

200

500

1000

Étape 5 — Quiz bilan

1. Quelle est la clé de la stratégie gagnante avec 16 bâtons ?

Toujours prendre 3 bâtons

Laisser un nombre de type 4k+1 à l'adversaire

Prendre au hasard

Toujours prendre 1 bâton

2. Qu'est-ce que l'apprentissage par renforcement ?

L'IA lit toutes les règles dans un livre

L'IA apprend en testant des actions et en recevant des récompenses

L'IA copie ce que fait un humain expert

L'IA utilise toujours la même stratégie

3. Au début de l'apprentissage, comment joue l'IA ?

Elle joue parfaitement dès la première partie

Elle applique l'algorithme optimal immédiatement

Elle joue au hasard et fait beaucoup d'erreurs

Elle demande à un humain quoi faire

4. Que calcule MOD 4 dans l'algorithme ?

Le nombre de bâtons à laisser pour piéger l'adversaire

Le nombre de parties déjà jouées

La vitesse de l'IA

Le score du joueur

Ressources

📝

Fiche travail Word

Télécharger

📄

Fiche travail PDF

Télécharger

Class'Code IA — Pixees

Pour comprendre l'IA →

IA et apprentissage — Code.org

Tester l'apprentissage →

Fiche de connaissance

Intelligence artificielle — PDF

Remerciements à Mme GAUDICHAU pour cette activité.

Date de création : 05/01/2025 08:17

Catégorie : -

Page lue 432 fois

Prévisualiser... Imprimer...

	Nous contacter
	Recommander
	Version texte
	Mentions Légales