Comprendre les processus d'apprentissage bio-inspirés

TechnologieBiologieIntelligence artificielle et nouvelles technologies

Projet	Durée	Difficulté
SteamCity	Trois séances d'environ 45 minutes	Modéré

Matériel

Une grille imprimée 6x6
Un marqueur pour indiquer la position actuelle
Un ordinateur ou une tablette pour accéder à l'outil en ligne BioLearningGame
Des tableaux blancs pour des discussions collaboratives

Télécharger en PDF

Introduction

L'apprentissage est l'un des processus fondamentaux que partagent les humains et les machines, même si les mécanismes peuvent être très différents. Dans cette activité, les élèves se lanceront dans un voyage exploratoire pour découvrir comment une machine apprend et le comparer à leurs propres processus d'apprentissage. En participant à des exercices pratiques, ils comprendront à la fois les défis et les méthodes de l'apprentissage par essais et erreurs, et observeront comment les commentaires, positifs ou négatifs, peuvent favoriser l'amélioration.

L'objectif de cette activité est de fournir aux élèves une compréhension intuitive des modèles d'apprentissage bio-inspirés et de la façon dont les machines, à l'instar des organismes vivants, utilisent la méthode des essais et des erreurs pour s'adapter et trouver des solutions. En établissant des parallèles entre leurs propres stratégies d'apprentissage et celles des machines, les élèves comprendront comment l'intelligence artificielle tente d'imiter les processus d'apprentissage naturels.

L'activité se décompose en trois étapes distinctes, chacune offrant une expérience immersive et pratique d'apprentissage par l'expérimentation. Ces étapes démontreront la nature itérative de l'apprentissage et mettront l'accent sur la valeur de l'adaptabilité, une caractéristique clé nécessaire pour devenir un véritable agent autonome dans la ville. À la fin de l'activité, les élèves devraient avoir une meilleure compréhension des principes de l'apprentissage par renforcement, de la résolution de problèmes par essais-erreurs et des différences d'adaptabilité entre les humains et les machines.

Structure de l'activité

L'activité se déroulera en trois étapes principales, chacune conçue pour introduire progressivement les élèves au concept d'apprentissage bio-inspiré. Vous trouverez ci-dessous un aperçu de la structure de l'expérience :

Découvrir l'apprentissage humain à travers un jeu débranché : Les élèves participeront à un jeu utilisant une grille 6x6 et un point qu'ils doivent déplacer. Ils peuvent déplacer le point dans l'une des quatre directions (haut, bas, gauche, droite), et chaque déplacement entraîne soit une victoire, une défaite ou une continuation en fonction des commentaires de l'enseignant. L'objectif, qui n'est pas initialement révélé, est que les élèves trouvent le point gagnant. Ils le découvriront par des essais et des erreurs répétés, puis tenteront de trouver le chemin le plus court.
Découvrez comment l'apprentissage automatique fonctionne : les élèves utiliseront un outil en ligne appelé BioLearningGame (https://charly-sketch.github.io/DiscoverAI/PlayerLearningGame/PlayerBiolearning.html) pour observer comment une IA tente de résoudre le même problème. Comme les élèves, l'ordinateur n'a aucune connaissance préalable de l'objectif et doit utiliser la méthode des essais et des erreurs pour découvrir le bon chemin. Cette étape présente aux élèves le concept de modèles d'apprentissage automatique, d'apprentissage par renforcement et de rétroaction positive et négative.
Adaptabilité des humains par rapport aux machines : À cette étape, les élèves compareront leur adaptabilité à celle de l'IA. Ils se diviseront en deux groupes : l'un modifiera la carte de la ville et l'autre devra naviguer à travers les changements sans voir la carte. Pendant ce temps, le modèle informatique tentera d'apprendre l'environnement modifié. L'objectif est de comparer la rapidité et l'efficacité avec lesquelles les humains et les machines s'adaptent au nouvel environnement.

À la fin de l'activité, la discussion sera ouverte pour considérer avec les élèves les impacts positifs de l'IA dans leur vie quotidienne et leur avenir ainsi que pour identifier ses limites.

Glossaire

Adaptabilité : Capacité à s'adapter à de nouvelles conditions ou à des changements dans l'environnement. Dans le contexte de cette activité, cela fait référence à la manière dont les humains et l'IA peuvent ajuster leur comportement pour atteindre un objectif lorsque les circonstances changent.
IA (Intelligence Artificielle) : La capacité d'une machine à imiter le comportement humain intelligent, comme l'apprentissage par l'expérience, l'adaptation à de nouvelles données et l'exécution de tâches sans intervention humaine.
Apprentissage bio-inspiré : Modèles d'apprentissage inspirés des processus naturels observés dans les organismes biologiques. Il s'agit d'une adaptation par essais et erreurs, similaire à la façon dont les animaux et les humains apprennent.
Retour : Informations sur le comportement d'une personne ou d'une machine pouvant être utilisées pour l'améliorer. Les commentaires positifs encouragent la répétition du comportement, tandis que les commentaires négatifs découragent les actions indésirables.
Modèle d'apprentissage : Système ou algorithme utilisé pour apprendre à partir de données ou d'expériences. En IA, il désigne la méthode par laquelle la machine met à jour ses connaissances pour améliorer ses actions.
Renforcement négatif : Le processus d'apprentissage en recevant des conséquences négatives pour des actions incorrectes, réduisant ainsi la probabilité de répéter ces actions.
Renforcement positif : Le processus d'apprentissage consistant à recevoir des récompenses pour des actions correctes, augmentant ainsi la probabilité de répéter ces actions.
Q-Apprentissage : Un type d'algorithme d'apprentissage par renforcement qui permet à une IA d'apprendre à naviguer dans un environnement en équilibrant l'exploration et l'exploitation de ses connaissances actuelles.
Apprentissage par renforcement : Un type d'apprentissage automatique dans lequel un agent apprend à prendre des décisions en effectuant des actions et en recevant des récompenses ou des pénalités.
Essai et erreur : Une méthode d'apprentissage de base dans laquelle un individu ou une machine essaie différentes actions jusqu'à en trouver une qui mène à un résultat positif.
Itération : La répétition d'un processus afin d'atteindre un objectif souhaité. Dans le contexte de l'apprentissage automatique, cela fait référence à la répétition du cycle d'apprentissage pour améliorer les performances.

Étape 1 : Découvrir l'apprentissage humain grâce à un jeu débranché

Contexte de la séquence

Dans cette première étape, les élèves participeront à un jeu formel conçu pour les aider à comprendre le concept d'apprentissage par essais et erreurs sans connaissance préalable de l'objectif. Le jeu utilise une grille 6x6 dans laquelle les élèves doivent déplacer un point de repère dans l'une des quatre directions. Chaque mouvement entraînera une rétroaction (gagner, perdre ou continuer). Ce processus aide les élèves à comprendre la dynamique de l'apprentissage lorsque l'objectif n'est pas explicitement connu.

Objectifs d'apprentissage

Compétences de base : Comprendre l'apprentissage par essais et erreurs, développer des compétences en résolution de problèmes et améliorer l'adaptabilité pour atteindre un objectif caché.
Compétences auxiliaires : Développer la conscience spatiale, l'apprentissage collaboratif par le biais de discussions de groupe et l'optimisation de stratégie de base pour trouver le chemin le plus court.

Conceptualisation

Durant cette étape, les élèves joueront à un jeu pour découvrir et explorer le concept d'apprentissage par l'essai à travers une approche ludifiée. Afin de lancer le jeu, voici le déroulement typique d'une séquence. Les élèves disposent d'une grille 6x6 (soit dessinée au tableau de la classe, soit imprimée pour être utilisée en petits groupes ou individuellement) et d'un marqueur de points.

Grille 6x6 SteamCity Bioinspired — Grille 6×6 du jeu

Ils doivent déplacer le marqueur dans l'une des quatre directions possibles (haut, bas, gauche ou droite) et créer un itinéraire pour trouver leur objectif de point final, c'est-à-dire un endroit précis sur la grille.

L'enseignant jouera le rôle d'« environnement », en donnant un retour après chaque mouvement :

« Continuer » : Les élèves peuvent continuer à se déplacer pour tenter de trouver l'objectif.
« Perdre » : Les élèves ont heurté un obstacle ou emprunté un mauvais chemin et ils doivent recommencer depuis le début.
« Gagner » : Les élèves ont atteint l'objectif et le jeu se termine.

Le principal défi est que les élèves ne savent pas quel est l'objectif ni où il se situe. À force de tentatives répétées et d'expérience, ils commenceront à élaborer des stratégies, à apprendre de leurs erreurs précédentes et, finalement, à identifier le point cible. Une fois qu'ils auront découvert l'objectif, les élèves s'efforceront alors de trouver le chemin le plus court pour l'atteindre efficacement.

Conseils aux enseignants

Pour garantir un engagement efficace au cours de cette session, envisagez différentes approches en fonction du cadre de la classe et du temps disponible :

Démonstration en classe entière : vous pouvez utiliser le jeu comme une tâche de groupe, en dessinant une grande grille de 6 x 6 sur le tableau et en demandant à un élève de déplacer le point en fonction des instructions données par ses camarades. Cela rend l'activité interactive et favorise la collaboration.
Exercice individuel : Donnez à chaque élève sa propre grille et son propre marqueur pour qu'il puisse tenter l'activité de manière autonome. Cela peut être utilisé s'il y a suffisamment de temps et que vous souhaitez voir comment chaque élève aborde la résolution de problèmes sans l'influence du groupe.
Activité en petits groupes : divisez les élèves en groupes de 4 à 6 et fournissez à chaque groupe sa propre grille imprimée de 6 x 6 pouces et un marqueur de points. Chaque groupe peut travailler ensemble pour déterminer les déplacements, favorisant ainsi une collaboration à petite échelle.

Adaptez la méthode en fonction de la taille de la classe, des contraintes de temps et du niveau d'engagement des élèves. L'utilisation d'une combinaison d'approches peut aider à maintenir l'intérêt et à offrir des perspectives différentes sur le processus de résolution de problèmes.

Investigation par les élèves

Une fois que le contexte du jeu, les règles et le matériel (selon le cadre choisi) ont été dévoilés aux élèves, vous pouvez commencer à jouer jusqu'à ce que les élèves trouvent le bon itinéraire pour atteindre le point gagnant. Une fois le jeu terminé, l'enseignant lancera une discussion sur la façon dont les élèves ont abordé le problème :

Quelles stratégies ont-ils utilisées pour explorer la grille ?
Comment ont-ils géré les situations « perdantes » et quelles adaptations ont-ils faites ?
Comment ont-ils identifié l'objectif et trouvé le chemin le plus court ?

Les élèves seront encouragés à réfléchir à l'importance de l'apprentissage par essais et erreurs et par itérations. Ils comprendront que chaque échec fournit des informations précieuses qui les aident à affiner leurs tentatives futures.

L'enseignant doit également inciter les élèves à réfléchir au moment où ils ont commencé à comprendre l'objectif :

À quel moment ont-ils commencé à reconnaître des modèles dans les commentaires fournis ?
Quand ont-ils senti qu'ils se rapprochaient de l'identification de la cible ?
Comment leur compréhension a-t-elle évolué, passant de mouvements aléatoires initiaux à des décisions plus ciblées ?

L'objectif est de démontrer que l'apprentissage est un processus itératif dans lequel les erreurs constituent une part essentielle de l'acquisition de connaissances. En discutant de ces aspects, les élèves comprendront comment leurs stratégies ont changé au fil du temps, quels moments précis les ont aidés à comprendre l'objectif et comment ils pourraient optimiser leur approche une fois l'objectif identifié.

Restitution et réflexion

Dans cette étape, les élèves ont participé à un jeu qui leur demandait d'apprendre par essais et erreurs sans connaissance préalable de l'objectif. L'objectif était d'illustrer comment l'apprentissage peut être réalisé de manière progressive en utilisant le feedback pour s'adapter et s'améliorer. L'enseignant peut utiliser le site BioLearning (https://charly-sketch.github.io/DiscoverAI/PlayerLearningGame/PlayerBiolearning.html) pour montrer une solution aux élèves dont la grille n'a pas été révélée.

Connaissances mobilisées : À la fin de cette étape, les élèves auront développé une compréhension concrète de l'apprentissage par essais et erreurs. Ils apprendront à adapter leurs stratégies en réponse aux commentaires et se rendront compte que la recherche d'une solution nécessite souvent plusieurs tentatives.
Réflexion sur la mise en oeuvre en classe : Ce jeu favorise également le travail d'équipe et la communication. Les élèves collaboreront probablement, partageront leurs découvertes et suggéreront des stratégies les uns aux autres. Il est important de souligner que le partage des connaissances peut contribuer à accélérer le processus d'apprentissage.
Résultats d'apprentissage généraux : Les étudiants apprécieront mieux la valeur de l'apprentissage itératif et de l'adaptabilité, des compétences cruciales non seulement pour l'apprentissage humain mais aussi pour comprendre comment les machines, comme les modèles d'IA, apprennent par essais et erreurs.

Discutez de la façon dont le fait d'apprendre à naviguer dans la grille sans la voir leur a permis de construire une sorte de « modèle mental » de l'environnement. Cette notion de « modèle appris » sera essentielle à l'étape suivante, où ils observeront comment une machine construit son propre modèle pour résoudre le même problème.

Astuce

À la fin de cette étape, révélez aux élèves que la grille représentait une ville, le point symbolisait une ambulance et l'objectif était d'atteindre l'hôpital. Expliquez-leur qu'ils ont reçu un minimum d'informations pour les empêcher d'utiliser leurs connaissances préalables, simulant ainsi la manière dont une machine apprend sans biais préexistants. Discutez de la façon dont la navigation dans la grille invisible leur a permis de construire un « modèle mental » de l'environnement. Présentez le concept d'apprentissage par renforcement en expliquant comment les succès ont renforcé positivement leur modèle – en indiquant le bon chemin – tandis que les échecs l'ont renforcé négativement en mettant en évidence les zones à éviter. Soulignez que les retours positifs et négatifs étaient essentiels pour développer une stratégie efficace. Cette notion de « modèle appris » sera essentielle à l'étape suivante, où les élèves observeront comment une machine construit son propre modèle pour résoudre le même problème.

Pour conclure cette étape, les élèves participeront à une discussion centrée sur des questions ouvertes. Ces questions sont conçues pour encourager une réflexion plus approfondie sur l'exercice et ses implications plus larges. Voici dix exemples de questions qui pourraient être discutées :

Comment votre approche pour trouver l'objectif a-t-elle évolué à mesure que vous avez reçu davantage de commentaires ?
Quelles émotions avez-vous ressenties lorsque vous avez dû tout recommencer après avoir perdu, et comment ces sentiments ont-ils influencé votre stratégie ?
Dans quelle mesure était-il crucial de vous souvenir de vos mouvements précédents lorsque vous essayiez de trouver le but ?
De quelle manière la collaboration avec vos camarades de classe a-t-elle amélioré votre compréhension de l'objectif ?
Comment s'est déroulée votre navigation sans connaître l'objectif par rapport à votre expérience après avoir appris l'emplacement de l'hôpital ?
Quelles similitudes pensez-vous exister entre les défis auxquels vous avez été confrontés et ceux rencontrés par les machines lors de ce type d'apprentissage ?
Comment pensez-vous que le processus d'essais et d'erreurs améliore votre capacité à résoudre de nouveaux problèmes dans la vie réelle ?
Quels ont été les moments clés qui vous ont fait réaliser que vous vous rapprochiez du but ?
Comment pensez-vous que le concept de construction d'un « modèle mental » s'applique à d'autres matières ou tâches que vous apprenez ?
De quelle manière cette expérience pourrait-elle vous aider à comprendre les limites de l'apprentissage humain et automatique ?