Wanneer mag ik ophouden met belonen?

Ik kreeg een mail van Martine met een vraag die erg vaak wordt gesteld:
Nu gaat het aanleren van iets vrij snel, maar waar mijn vraag over gaat is het afbouwen van de beloning bij aangeleerd gedrag.
Op dit moment is het zo dat als ik bijv. haar been omhoog vraag (of voetje) dat ik dan iedere keer yes zeg als ze hem ontspannen blijft omhoog houden. Ze doet dit nog niet perfect, dus ik oefen hier nog mee. Toch vraag ik me af of dit niet al iets vanzelfsprekends is of wordt en of ik het nog wel iedere keer zo moet belonen.
Hetzelfde geldt voor het vastzetten. Toen ik haar net had heeft ze zich een aantal keren losgerukt (klip door) toen ze vast stond. Ze gaat dan hangen en zo veel druk zetten totdat er iets knapt. Ik wil dit niet en zet haar niet meer echt vast (touw alleen ergens over heen slaan). Nu kan ze heel goed blijven staan, maar eigenlijk wil ik dat ze vast kan staan. Het probleem is alleen dat ze op bepaalde momenten weer in haar oude gedrag van met hoofd hoog achteruitlopen vervalt. Ik vraag haar dan weer naar voren, beloon haar (yes, snoepje) maar dan doet ze weer hetzelfde (achteruit gaan). Ik denk soms dat ze achteruitloopt omdat ze dan als ze komt een snoepje krijgt. Zou ze zo slim kunnen zijn? Oftewel, moet ik dit nog wel blijven belonen met yes en voer, of moet dit vanzelfsprekend gedrag zijn wat ze gewoon moet doen?
Ik merk dus dat ik de neiging heb om reeds aangeleerd gedrag wat ik van haar vraag te blijven belonen. Dus bijv. hand aanraken beloon ik iedere keer. Dit zorgt ervoor dat ze nu ook altijd iets verwacht als ik iets vraag. Ze wordt niet echt opdringerig, maar ik merk wel dat ze dan heel graag een snoepje wil. En ik wil eigenlijk niet dat ze alleen iets doet als ze een snoepje krijgt.

In principe, als je puur met positieve bekrachtiging werkt, houdt de beloning nooit op. Je BLIJFT belonen, anders kom je in extinctie of uitdoving terecht: gedrag dat geen enkele consequentie heeft (niet goed, niet slecht, dus geen straf, noch beloning), dooft ook uit. Denk maar aan een lichtschakelaar: als het licht aangaat, word je beloond – krijg je een schok, dan word je gestraft en ben je niet erg geneigd om de volgende keer wéér aan die schakelaar te komen; maar als er NIETS gebeurt – geen licht, geen schok, dan probeer je een paar keer maar daar hou je ook mee op.
Toch kan je ook dit als een vorm van negatief straffen zien: gedrag dat er al was (en dus voorheen op één of andere manier beloond werd), wordt nu niet meer beloond; de beloning wordt onthouden, en dus ontmoedigd – het gedrag gaat achteruit en houdt uiteindelijk op. Dat is de reden waarom paarden dan geirriteerd gedrag gaan vertonen – het gaat voorbij, maar het duurt even.
Een gedragsverandering vragen kan dus niet zonder beloning – zelfs als je iets wil afleren zal je ander gedrag moeten belonen, tenzij je wil dat je paard helemaal niets meer durft doen.

De theoretische kant vertelt je dus dat belonen nooit ophoudt :-).

Maar waarvoor beloon je?
In de praktijk hangt het niet zozeer samen met het feit dát je elke keer beloont, maar veel meer met dat je de dingen al lang “goed genoeg” vindt. Je krijgt, hoe kan het ook anders, wat je beloont – en beloon je maar half, slordig, rammelend, onzeker, kort gedrag dan krijg je dat dus ook.
Wees dus gewoon preciezer! Beloon alléén maar als JIJ het vraagt, en niet als ze het aanbiedt – dwz gaat ze achteruit op jouw vraag, prima: bridge en beloon. Gaat ze zelf weer achteruit, NEGEER dan. Je hebt niks gevraagd, dus hoeft ze ook niks te krijgen; bevries je houding, voor een seconde of 3. Pas even later vraag je zélf weer het achteruit gaan, met een duidelijke cue. Ze zal al gauw begrijpen dat ze moet wachten op jouw vraag.
Schaaf gedrag dat je vraagt voortdurend bij: achterwaarts gaan is niet meteen weer naar voor komen, maar daar blijven staan, tot je iets anders vraagt – dat wil zeggen, het zou kunnen dat de oefening meteen gedaan is en dat je dus bridget en naar voor mag komen, maar het zou ook kunnen dat ze gewoon moet blijven staan – kort, of lang, dat bepaal JIJ (lang ergens blijven staan moet je waarschijnlijk als een aparte oefening aanbrengen).
Ze mag dus inderdaad verwachten dat ze telkens iets krijgt als jij iets vraagt, maar het is aan jou om steeds méér van haar te verwachten voor ze die bridge hoort.

En ook: waarmee beloon je?
Een tweede ‘hulpstuk’ is dat je een “secundaire bekrachtiger” traint, naast je primaire voedselbeloning. dat je een krabbel geeft op haar lievelingsplek bijvoorbeeld. Dat doe je door eerst die krabbel sàmen met je voer te geven, dan de krabbel eerst te geven kort voor het voer, en daarna “vergeet” je het voer af en toe (maar NIET de krabbel), en vraag je meteen iets anders zodat ze er amper bij stilstaat dat het voer niet gekomen is.
Dat snel iets anders vragen is belangrijk! Geef haar niet de kans om geirriteerd gedrag (omdat ze niks kreeg) te gaan “oefenen” – maar zorg dat ze meteen weer kan “scoren” door iets anders goed te doen waarvoor je dan wél beloond met voer. Voorkóm “fout” gedrag door in de plaats daarvan, vóór dat gebeurt, goed gedrag te vragen.

Verschillende bekrachtigers hebben geeft je de mogelijkheid om bijvoorbeeld het hand aanraken te perfectioneren: als ze komt krijgt ze altijd een beloning, maar alleen voor die waarbij ze snél komt (en later misschien in draf, of zelfs in galop) krijgt ze een wortel – de “gewone” uitvoeringen krijgen een krabbel, of zelfs “maar” je blije goedkeuring.
Die “blije goedkeuring” is héél belangrijk overigens – want dat is de klassieke conditionering die je met je operante conditionering gaat bepalen. Het blije gevoel dat een hele trainingssessie geeft zorgt dat je paard de volgende keer meteen weer vrolijk aan de volgende sessie begint, en is méé beloning voor het geheel. Het is prettig om bij jou te zijn, en dat gevoel kan zo sterk worden dat dat meteen je totaal aan voerbeloningen vermindert, zodat het dan misschien wel LIJKT alsof je weinig beloont, maar in feite wordt je paard aan een stuk door beloond.

Dat is het begin. Als je je in staat voelt om naar wat meer gevorderde, precieze training over te schakelen, lees dan eens bij over beloningsratio’s, lussen, Premack en gedragskettingen.
Een idee dat goedkoper is dan een privéles en je toch bij de les houdt? Denkwerk, bijvoorbeeld.

Het is natuurlijk wél de bedoeling dat je van je getrainde bekrachtigers vanaf komt – anders ga je je hele omgang met het paard lopen trainen, terwijl het toch de bedoeling is gewoon bij je paard te zijn (bewust samen). De échte beloning is het samen dingen doen, genieten van elkaar en met elkaar. Worteltjes, krabbels… ze zijn een tussenstap, een manier om dingen uit te leggen, een middel tot het doel, niet het doel op zich. Je moet dus even veel aandacht besteden aan het afbouwen van clickertraining, als aan het opbouwen!