Win-stay/Loose-shift

Als een paard leert door proberen, zonder te weten wat de uitkomst zal zijn, is hij eigenlijk aan het gokken, zoals roulette. Ook mensen hebben vaak niet echt een strategie, ze doen maar wat, en soms is dat bvb: ze zetten in op rood, als ze winnen dan zetten ze terug in op rood; verliezen ze dan gaan ze naar zwart. Dat heet volgens game theory win-stay/loose-shift: als het goed gaat doe je het nog eens, als het niet goed gaat probeer je iets anders. Maar dat betekent niet automatisch dat je de juiste oplossing vindt.

Als een paard in win-stay/loose-shift vastzit, zit je dus eigenlijk in een situatie dat leren tot stilstand komt. Ze doen het wel vaak goed, maar je hebt niet het gevoel dat ze weten wat ze doen. Ze léren niet, ze blijven in het moment beslissen.
Het komt het vaakst voor bij het leren van abstracte dingen zoals object discriminatie, omdat er minder ruimte is voor experimenteren en proberen – bij bewegingsoefeningen weet een paard altijd wel iets te verzinnen, wat je dan kan oppikken en shapen naar het einddoel. Bij zo’n abstracte discriminatie is het gewoon juist, of niet juist. Er is geen “een beetje juist” en dat maakt het dan net bij zo’n cognitief uitdagende dingen dubbel zo moeilijk.
Eén bal zien en twee abstracte stemcues horen is overigens ook een bijzonder moeilijke discriminatie voor een paard dat nog niet heeft geleerd te leren en nog helemaal niet zo “clickersavvy” is. Nog véél te moeilijk als niet nog even bvb een ander object mee in de discriminatie mag, om het verschil duidelijker te maken.

Enter your keyword