Rechercher
Archives des billets
Retrouvez-moi sur...
Bouton Forum Rats

Bouton Facebook

Bouton Pavillon Rongeurs

W3C & Référencement

Apprentissage : « clicker training »

Cet article a été entièrement rédigé par lo eyff pour Forum Rats. Elle m’a autorisé à le reprendre pour PARatSite, j’y ai apporté des petites corrections de forme. Il n’est bien évidemment pas libre de droits, il n’appartient qu’à son auteur.

 

L’apprentissage du rat

Le rat apprend par associations et répétitions.
Dans la vie du rat, tout comportement lui apportant du plaisir augmentera en fréquence ; au contraire, tout comportement entraînant des effets négatifs sera évité.
Tout comportement neutre ne sera pas évité mais n’augmentera pas.

Prenons un exemple. Si à chaque fois que vous vous asseyez sur une chaise vous recevez 5 euros le comportement « s’asseoir sur une chaise » est renforcé et augmente en fréquence, c’est-à-dire que vous répètez ce comportement car il vous apporte quelque chose de positif, d’intéressant.

Au contraire, si à chaque fois que vous vous asseyez sur une chaise vous recevez une décharge électrique, vous allez chercher à éviter ce comportement.

Si ce même comportement ne vous apporte rien de spécial, vous ne le rechercherez pas mais ne l’éviterez pas pour autant.

 

L’histoire du clicker training

Le clicker est un petit boîtier en plastique muni d’une lamelle en métal qui produit un son « clac-clac » quand l’on actionne avec le pouce.

La méthode du clicker training, après avoir été étudiée en laboratoire, a été utilisée pour le dressage des cétacés car les entraîneurs cherchaient une méthode qui leur permettrait de ne pas employer la contrainte, tout simplement car il leur était impossible de l’employer (imaginez vous forcer un orque à passer à travers un cerceau !)
D’une part, cette méthode a porté ses fruits, et d’autre part, elle a permis d’avoir un autre regard sur l’animal, si bien qu’elle fut assez vite utilisée pour l’éducation des chiens (et autres animaux) et du rat (notamment les rats démineurs).
Exemple en images :
Rat démineur 1
Rat démineur 2

 

L’apprentissage à l’aide du clicker

La première étape

La première étape consiste à apprendre au rat«quand tu entends ce son (clac-clac), cela signifie que tu vas recevoir une friandise».
Cette étape, dite de l’amorçage, consiste à faire entendre le son à l’animal et à lui donner immédiatement une friandise. c’est l’effet Pavlov!
Pour commencer l’apprentissage d’un comportement, il existe plusieurs méthodes :
* Leurre
* Capture
* Shaping

Méthode du leurre

Le leurre est de loin la plus employée pour obtenir facilement un comportement simple.

Le Leurre est l’action d’amener le rat à adopter un comportement en l’aidant à l’aide de la friandise, car dans la méthode du clicker training, nous n’employons pas les contraintes pour forcer le rat physiquement à adopter une position.
C’est ainsi qu’en décrivant un cercle avec une friandise, le rat va la suivre et effectuera lui aussi un cercle.

Le leurre n’est là que pour montrer au rat ce que nous désirons de lui, il disparaît lors de la 2ème étape.
Il faut cliquer les bons comportement puis donner la friandise. Le clic est beaucoup plus précis que la récompense, qui peut entrainer des confusions chez le rat, qui ne sait pas quel comportement est récompensé (le tour sur lui-même ou l’immobilité par exemple).

Méthode de la capture

La capture consiste à cliquer un comportement que le rat adopte naturellement. Il va donc le reproduire spontanément pour provoquer à nouveau le clic (et la récompense qui s’ensuit). On voit bien l’utilité du clicker pour :
– sa précision
– le caractère spécifique de ce son, que le rat n’entend que dans des circonstances particulières (alors que chez moi, les « c’est bien, t’es belle, t’es une bonne ratoune » sont des « mots d’amour » pas utilisés particulièrement en éducation, et perdent ainsi leur « pouvoir »).

Méthode du shaping

Le shapping, c’est pour amener un rat vers un comportement plus complexe (jouer au basket par exemple) : on clique les comportement qui s’approchent du comportement voulu et on organise les récompenses pour récompenser plus quand, au terme d’une progression, le comportement final est proposé.

 

La deuxième étape

Comme nous l’avons vu tout a l’heure, tout comportement renforcé augmente en fréquence, cette 2ème étape est importante car elle consiste à faire comprendre au rat qu’il a le pouvoir de nous faire actionner le clicker en répétant les comportement qui ont déjà été cliqués.
Il va falloir laisser le rat réfléchir, c’est à dire qu’on ne le leurre plus et si on reprend l’exemple du «spin», où nous avons renforcé (=récompense) le «spin», il va devoir prendre l’initiative de nous le proposer spontanément pour nous faire cliquer.

Dans l’étape des propositions, nous ne disons jamais « non » même si le rat se « trompe » , il nous suffit seulement de ne pas cliquer, par ce biais nous ne freinons pas ses initiatives.
Pour garder le contrôle il suffit au maître de ne cliquer que ce qui l’intéresse.

Une fois que le rat propose le comportement facilement et à plusieurs reprise, il est temps de placer l’ordre vocal ou gestuel, et une fois l’ordre acquis sur commande d’abandonner progressivement le clicker.
Puis dans un 2ème temps de remplacer les friandises pas des récompenses vocales et des caresses.

 

Le clicker training et les punitions

Les punitions ne sont pas utilisées en clicker training car elles ne sont pas utiles et sont préjudiciables à un bon apprentissage et à une bonne relation. Il a été prouvé (même chez l’humain) que l’apprentissage par récompense est plus rapide et de meilleure qualité que l’apprentissage où l’on utilise des punitions.

Nous privilégions le renforcement positif, mais cela ne veux pas dire que nous ne punissons pas ! Car il est parfois utile d’indiquer au rat que son comportement n’est pas le bon.

Nous utilisons la « punition négative », elle consiste à retirer au rat ce qu’il désirait lorsqu’il n’obéit pas à un ordre ou à un comportement que nous jugeons dérangeant.

Le « non » n’est pas une punition mais est très utile pour stopper certains comportements gênants, le non doit toujours être suivi, quand le rat s’exécute, d’une félicitation.
Ex : Le rat mâchouille un chausson, le bipède dit non, le rat s’arrête, le maître félicite l’obéissance du rat (caresse, jouet…)
C’est ce qui est appelé le « non » positif ou « non » gratifiant.

 

Conclusion

Le clicker training, c’est aussi et surtout une façon de voir le rat différemment, d’accepter que celui-ci soit un animal intelligent et sensible, capable de ressentir des émotions.
Nous nous devons donc d’agir avec lui en faisant preuve de patience, de compréhension et d’empathie.
Il n’est pas nécessaire d’avoir un clicker sur soi 24h/24 pour être avec le rat en méthode positive à chaque fois qu’il est à nos cotés, c’est comme cela que l’on crée une relation amicale et un contrôle bienveillant.
Cette méthode conduit le rat à proposer des comportement, à être plus concentré et plus « actif » dans l’apprentissage.