De relatie eerst

Ik heb een rotsvast geloof in het opbouwen van een relatie met véél positieve bekrachtiging vóór dat je nog maar mág met druk gaan werken. En dat is niet alleen omdat je dan niet kan terugvallen op wat je instinctief wil doen (even duwen, even trekken, even tikken, even slaan) waardoor je wel moét gaan nadenken over hoe leren in elkaar zit. Leren werken met positieve bekrachtiging leert je wat het wérkelijk betekent, “je krijgt wat je beloont” – waardoor je daarna veel ethischer én efficiënter met druk kan werken.

“It is highly likely that there are emotional components to operant conditioning, and that affective states themselves can act as reinforcers or punishers.” is een zinnetje dat komt uit het erg uitgebreide onderzoek (met honden en paarden) ‘Conceptualising the Impact of Arousal and Affective State on Training Outcomes of Operant Conditioning‘ (pdf). Ik vind het altijd intrigerend hoe voorzichtig dergelijke dingen worden omschreven overigens – “it is highly likely” dat paarden emoties hebben bij de training, en dat dat de training beïnvloedt? Duh!

Enfin, in het onderzoek worden paarden getest op twee taken: naar een target op afstand gaan, en onder het zadel voorwaarts gaan. Targetten gaat overduidelijk het makkelijkst met positieve bekrachtiging. Vertrekken van een beenhulp werkt best met negatieve bekrachtiging (beenhulpen) en pas op de tweede plaats met positieve bekrachtiging.
De onmiddellijke reflex die ik dan als clickertrainer heb is dat die laatste uitkomst vooral toont hoe onhandig het is om in het zadel met positieve bekrachtiging te werken als je geen bridge hebt, en als je paard niet al lang daarvoor heeft geleerd om actief met je mee te beginnen denken over wat het zou kunnen zijn dat je wil, tot hij die bridge hoort. It’s the bridge, stupid! (*).

Maar dat is eigenlijk niet waar het onderzoek over gaat. Het onderzoek toont eigenlijk in de eerste plaats hoe de efficiëntie van een uit het leerquadrant gekozen methode verandert met de daarbij horende opwinding en de gevraagde oefening. En benen geven past in de vluchtreflex van een paard, de opwinding is dus groter, en dus ook de efficiëntie. Omgekeerd, als een paard té opgewonden wordt van positieve bekrachtiging gaat het leren misschien óók achteruit, afhankelijk van de gevraagde taak. Ja, dat hebben we allemaal inderdaad al gezien, vooral bij het beginnen clickertrainen met een paard.

Maar, voegt de onderzoeker er wat verder aan toe: “there are good reasons to preferentially use positive reinforcement”, want “all operant training approaches will be negatively affected by a negative affective state.” En daar bedoelt ze mee dat paarden optimisten of pessimisten worden, met alle bijhorende langetermijn-hormonen en daar tussenin een enorme ruimte voor de twijfel van vergiftigde cues (lees ook in Denkwerk pag. 75-77 en 351-359).

“Arguments that certain operant conditioning approaches are more effective than others may be true in some circumstances yet may fail to take into account the merits of first manipulating arousal levels and affective state to create conditions in an animal that best complement training methods associated with ease of application and promotion of positive affective state and appropriate levels of arousal.”
Of, vertaald naar gewone mensentaal: het belangrijkste is dat je paard jou leert kennen als een fijn iemand, voor je samen op dansles gaat (tango of rock&roll of walsen) en met z’n tweeën gaat fronsen over wie zet welke pas waar en als jij nu naar daar gaat, waar ga ik dan naartoe. Want het is de relatie die het onvermijdelijke knoeien en trekken en duwen en achter de beweging blijven bij het leren dansen niet erg maakt, die ruimte geeft voor lachend fouten maken.