Waarom R+ gebruiken bij het trainen beter werkt

Naar aanleiding van een discussie op Bokt, hierbij mijn lange antwoord, voor als je de behoefte hebt om je hersens te horen kraken.

Ja, ik denk dat je een paard in principe volledig kan trainen met alleen R+. Of we dat ook moeten doen, daar ben ik niet uit. Zelf combineer ik.

Wat volgt is een LANG antwoord, dat je traag moet lezen, als je dat al zou willen.
Ik heb geprobeerd een hele trainingsfilosofie samen te duwen in een paar alineas, en ik weet dat sommige dingen waarschijnlijk niet voldoende duidelijk zijn, omdat ik er anders 300 blz over doe (maar daarom ben ik dus dat tweede boek aan het schrijven ;-) ).

Ik denk dat je soms tegen een paard moet zeggen: “nee, dit kan je wél” (soms is een paard onzeker en heeft hij nét een beetje meer aandrang nodig om de trailer op te gaan, bijvoorbeeld) en soms “dit MOET/dit mag NIET.” (voorwaarts MOET, je mag NIET over me heen lopen). Maar dat is dus eerder uitzonderlijk (“twee keer per jaar” ;-).
Maar moeten kan voor mij dus nooit de essentie van trainen zijn.

De vraag is eigenlijk: wat doe je als het paard het NIET doet? Want DAT bepaalt volgens mij hoe ethisch en efficient een trainer is.

Wat randalinpony schrijft, dat een paard na 5 keer kan besluiten het niet meer te doen, gebeurt natuurlijk ook met R-. Dat ligt dus niet aan hoe we belonen. Ook als je met druk-en-loslaten (R-) werkt is het het PAARD dat beslist of de beloning wel voldoende is om het gevraagde te blijven herhalen. Het gebeurt uiteraard maar al te vaak dat een paard zegt “Die hoek ga ik NIET in. Die trailer ga ik NIET op. Ik ga NIET in galop.”
Maar niemand vraagt zich ooit af of dat de “schuld” is van R-. Niemand denkt erover na of in zo’n geval de motivatie van het weglaten van druk misschien onvoldoende is. Het wordt simpelweg meestal opgelost door het verhogen van de druk, niet door het verhogen van de beloning. Meer beenhulp, zwaaien met het touw, meer druk op het leidtouw, meer druk op de teugels, dieper zitten… Kortom, het nóg onaangenamer maken zodat het wegvallen van het onaangename wél belangrijk genoeg wordt voor het paard om een verandering in z’n gedrag te tonen. Dat doet iedereen dus op elk moment, zonder er nog bij na te denken, al duizenden jaren.
Wat is de grootste beloning voor je paard als hij het goed heeft gedaan? Dat je afstapt en hij terug naar de wei mag. Dat JIJ weg bent, kortom.
Maar niemand vraagt zich ooit af of we niet kunnen ophouden met loslaten, wél altijd wanneer we kunnen ophouden met een wortelschijfje te geven.

Vergis je niet: ook bij R+ heb je de mogelijkheid tot (zachte) dwang. Bij R+ val je terug op R- (iets afnemen dat het paard wél graag heeft): “nee, je krijgt dat worteltje niet”, of je neemt je aandacht weg (3 seconden totaal geen reactie), of erger nog: “nee, ik ga weg en je kán niets meer verdienen als ik weg ben”. Mensen die efficiënt clickertrainen wéten dat het allerergste wat een paard kan overkomen is dat je weg gaat, en erger nog: dat je met een ander paard gaat werken. Wees maar zeker dat hij je achterna komt en alles uit de kast haalt om te laten zien hoe goed hij het wel kan.
Maar dat werkt dus alleen maar als wat je ervoor deed heel leuk was, anders heeft het afnemen ervan niet voldoende ‘strafwaarde’ voor een paard.
Dat is dus wat grondwerk en véél belonen met R+ doen voor jou en je paard: het maakt dat de hele trainingssessie met jou fijn is, en je paard (dat zo sterk is in het hardwiren van emoties) draagt dat met zich mee in de moeilijke momenten. Ik noem het een “bankrekening vol goodwill” waar je op de moeilijke momenten afhaalt. Met R+ staat je bankrekening gewoon veel sneller en makkelijker vol – je paard is gewoon veel blijer. Met alleen R- en P+ geraak je sneller in het rood.

Een ander probleem bij het gebruik van R+ is niet dat wortelschijfjes op zich hun magie zouden verliezen of zo: het is dat mensen niet strikt genoeg zijn voor zichzelf, en het paard. Dat het paard zegt “bén je daar weer met je vervelende altijd-hetzelfde oefening?” Een oefening die leuk was in het begin maar die je eindeloos herhaalt, daar verliest elke motivator z’n waarde bij.
Maar juist dát is het bewijs dat een paard het uiteindelijk niet voor het voer doet, maar voor de ‘thrill of it’. Het is aan de méns om zodra het paard iets 8 of 9/10 keer goed doet, méér te vragen: sneller, beter, hoger, krachtiger. Maar dat gebeurt niet: mensen komen vaak bij clickertraining omdat ze vriendelijk willen trainen, en vergeten dat het een van de moeilijkste en strakste en meest geconcentreerde trainingsvormen is die er bestaan.

En dat brengt ons bij rijden. Waarom zie je zo weinig mensen clickeren in het zadel, ook mensen die ongelooflijke dingen doen op de grond? Omdat de principes van clickertraining niet voldoende vertaald worden naar de principes van rijden. De échte magie van clickertraining ligt niet in het voer. Het ligt niet alleen in het beter beseffen wat een paard doet voor de juiste beloning (en beseffen dat die motivator verandert), maar vooral in de bridge. In hele kleine stukjes opdelen, aan één criterium tegelijk werken, en de bridge gebruiken zoals hij bedoeld is: dat heb je goed gedaan, einde oefening, hier is je beloning WAT OOK DIE BELONING IS.
In het begin (bij het aanrijden of her-aanrijden) is dat gewoon nog steeds voer (gecombineerd met stilstaan, anders kan je het niet geven), maar dat wordt al snel het mogen stilstaan op zich. Véél stilstaan dus, in het begin.
Maar als je goed traint verandert de motivatie van het paard. De goodwill-bankrekening, weet je wel? Waar je die in het begin vult met wortelschijfjes, leer je die vullen met nieuwe oefeningen, volgens een principe dat ‘chaining’ heet (google ‘Premack‘ maar eens, als je nog geen hoofdpijn hebt).
Er zit nogal wat trainingsinzicht om te gaan van “inspanning is aversief” (de reden dat een paard wil werken is omdat hij daarna mag stilstaan) naar “ijver is aangeleerd” (een paard dat voldoende beloond wordt voor werken gaat gráág werken). Door te zeggen “ja, je MAG” in plaats van “nee, je MOET”.

Overigens vind ik het argument dat een paard ook in de natuur R- en P+ tegenkomt en dat we dat daarom ook in de training mogen gebruiken, volkomen naast de kwestie. Om te beginnen zijn we geen paarden, en de keuze van je methode hoort af te hangen van wat simpelweg de meest efficiënte methode is voor jou en jouw paard.
Zelf denk ik dus dat de meest efficiënte methode die van het combineren is: R- met R+, waarbij de waarde van de R+ zo groot moet zijn dat er nauwelijks druk nodig is bij de R-.
Omdat we boven op een paard zitten, vormen we één biomechanisch geheel. Je ontkomt er niet aan dat je dingen in jezelf voelt die van het paard komen en omgekeerd – er is heel veel directe informatie-uitwisseling. Het gebruiken van druk is niet per definitie “fout”: je loopt graag met je lief hand in hand, en je danst graag met hem. Da’s ook fysieke druk.
En je moet ook jezelf opzetten voor succes; rijden met twee handen en twee benen en het verleggen van gewicht voelt erg natuurlijk (hoewel niet altijd verfijnd).
Alleen: als clickertrainer heb je niet alleen die bankrekening vol goodwill, je hebt ook en vooral de bridge. De bridge maakt dat een ‘clickersavvy’ paard leert dat hij mág experimenteren. Hij probeert vanalles uit (zonder dat je de druk moet verhogen – ‘uitproberen’ is NIET hetzelfde als in het wilde weg gedrag rondstrooien), en zodra je bridget wéét hij het gewoon. Het gaat véél sneller dan eender welke andere methode. En daarna is het een kwestie van bijschaven.
En ja, de bridge krijgt pas haar waarde omdat ze heel vaak geassocieerd is geweest met die supermotivator die voer is.

Maar je moet dus nog altijd gewoon netjes rijden. Er valt hoegenaamd NIETS weg van alle waarheden rond biomechanica, dragen, nageven enzovoort enzovoort. Er bestaan geen shortcuts voor het langzame opbouwen van de fysiek van een gezonde atleet.