4 j'aime
Daim granvilais: rentrée p303
Posté le 11/08/2023 à 08h30
Bon alors pavé :)
Je vais parler spécifiquement cheval car je ne m’y connais pas en chiens, mais je pense que beaucoup de ces principes se recoupent :) . La plupart des exercices tels que l’entend l’humain sont faits de plusieurs comportements pour le cheval. Par exemple dans ton cas, marcher, transition à l’arrêt, maintenir l’arrêt, transition au pas, maintenir le pas ça fait au moins 5 comportements qui composent l’exercice. Chacun de ces comportements doit être renforcé afin d’être préservé. Si on est 100% R+, le risque de ne récompenser qu’après le maintien du pas en fin d’exercice, c’est de perdre le maintien de l’arrêt car le cheval se précipitera pour reprendre le pas et avoir sa récompense. Si tu gardes un renforcement négatif (relâchement des aides et/ou maintien de la pression de l'aide tant qu'il n'y a pas réponse) après chaque comportement, tout ce que je vais raconter après a moins d’importance.
Ici on a donc une chaîne, qui contient des exercices statiques et des exercices de maintien. Si tu ne veux pas devoir récompenser ton arrêt, tout en préservant tout ton exercice, ça peut être intéressant de travailler ta chaîne à l’envers. D’abord tu récompenses beaucoup quand tu as un bon pas maintenu pendant X foulées (à toi de choisir selon ton but et où Daim en est pour le moment). Au début ça va probablement ressembler à faire des tours et des tours de piste en cliquant / récompensant toutes les 3-4 foulées. C’est cet exercice-là qui doit être le truc DINGUE TELLEMENT C’EST COOL, donc récompensé à fond, car c’est cet effet là qui te permettra de te passer du reste des récompenses.
Ensuite tu travailles tes transitions de l’arrêt vers le pas, et tu cliques uniquement la transition (quand elle est bonne évidemment). Quand ça commence à être bien, tu mets ta chaîne en place : transition au pas, marcher bien 3 foulées, clic, récompense. Et tu retravailles juste ce bout-là. Chaque maillon de la chaîne doit être bon avant d’être ajouté au reste, mais il ne faut pas passer trop de temps dessus, sinon il va y avoir ‘déception’ au moment où tu ne cliques pas ce maillon là, car tu passes au bout suivant. Je sais pas si c’est clair ?
Quand c’est solide, tu rajoutes un maillon à la chaîne : maintenir l’arrêt X secondes. Pareil, tu travailles juste ça jusqu’à ce que ça soit bien, puis tu enchaînes : maintenir l’arrêt X secondes, transition au pas, marcher 3 foulées, clic, récompense. Et tu continues comme ça jusqu’à avoir toute la chaîne qui compose ton exercice.
Ca peut paraître long à mettre en place, mais avec des comportements simples comme ceux-ci (et qu’il connaît déjà), ça devrait en vérité être très rapide. L’avantage de cette méthode, c’est que chaque maillon de la chaîne devient un renforçateur secondaire pour le maillon suivant, car plus tu progresses, plus tu te rapproches de la récompense (sur le même principe que le clic annonce la nourriture).
Tu vas sans doute dire : oui mais la chaîne, on peut pas la construire à l’envers, car il faut bien demander l’arrêt avant. Certes. Mais si tu ignores ce qui se passe avant ta chaîne et que tu la différencies bien du reste (par exemple marcher rênes longues, hypra détendue, aucune exigence sur la façon dont il marche avant de rentrer dans ta chaîne), et que tu te concentres sur la répétition dans ce sens-là, ça va quand même construire les associations. C’est assez important, je trouve, de faire ça dans la même séance, histoire que le lien soit bien clair. En R+, on cherche beaucoup à ce que les chevaux comprennent où on veut en venir et donc, anticipent un peu la suite. Si ton travail de stimulus control est bon, le comportement ne devrait pas arriver en avance car contrairement au R-, on n’a pas de comportement d’évitement où le cheval essaie de donner le comportement avant que les aides n’arrivent.
Pour faciliter le truc, tu peux aussi utiliser un marqueur secondaire après chaque comportement qui compose ta chaîne (un autre mot, un autre son, etc) . Si tu es bien consistante dans son emploi, ça a aussi un effet motivant pour le cheval qui sait alors qu’il s’approche de sa récompense.
La deuxième solution possible, c’est le “temporal tinkering” dont j’ai déjà parlé dans mon post (je vais refaire une explication plus longue dessus prochainement, j’ai traduit mes notes). L’idée est de cliquer, faire des trucs, puis seulement revenir nourrir. Ca, il faut le commencer à pied, comme si tu réintroduisais le clicker, afin de construire un historique de confiance quant au fait que la nourriture va arriver., même si ça traîne un peu. Par contre, il faut donner un truc à faire à ton cheval pendant cette période entre le clic et la nourriture et la plupart du temps on choisit l’immobilité… Donc à voir si tu peux entraîner ça sur un mode “ce que tu fais entre le clic et la nourriture, c’est maintenir ton comportement cliqué”, mais comme en selle tu vas quand même devoir l’arrêter pour nourrir … Je me demande si un marqueur secondaire pour marquer le maintien du comportement vs le final n’est pas potentiellement plus efficace dans ton cas.