Bekrachtigingsschema’s

De belangrijkste bekrachtigingsschema’s:
* Voortdurende bekrachtiging (CRF = continuous reinforcement)
Het gedrag wordt altijd beloond.

* vaste ratio (FR = fixed ratio):
Na een vast aantal reacties wordt er beloond.
Bijvoorbeeld FR5 = bekrachtiging na 5 reacties.
Een rondje springen in een springparcours is altijd 5 hindernissen, dan mag het paard even stappen.”
-> effect: het paard begint de eerste hindernis traag te springen maar haast zich dan steeds meer omdat na de 5de sprong gegarandeerd de beloning volgt.
Een 1:1 vaste ratio is dus eigenlijk voortdurende bekrachtiging.

  • variabele ratio (VR): ”

Na een steeds verschillend aantal reacties wordt er beloond.
Bijvoorbeeld VR5 = bekrachtiging na een wisselend aantal reacties, met een gemiddelde van 5.
Een ruiter springt in een parcours nu eens 3, dan eens 7, maar gemiddeld 5 hindernissen voor hij afstapt.
-> effect: hoge en stabiele respons: het paard weet niet precies wanneer de beloning volgt en zal dus elke hindernis z’n best doen in de hoop dat hij daarna kan stappen. Goede resistentie tegen extinctie.

* vast interval (FI – fixed interval):
Het gedrag wordt na een vooraf vastgestelde duur beloond.
Bijvoorbeeld: FI5″ = bekrachtiging na een vast interval van 5 seconden.
Een enduranceruiter in training draaft steeds exact 20 minuten voor hij afstapt.
-> Het paard zal zo weinig mogelijk inspanning leveren omdat de beloning toch volgt, met eventueel een verhoogde activiteit naarmate de 20-minuten drempel nadert. Kan makkelijk extinctie veroorzaken.

* variabel interval (VI):
Na een steeds verschillende duurtijd wordt er beloond.
Bijvoorbeeld VI5″ = bekrachtiging na wisselende intervals, met een gemiddelde van 5 seconden.
Een enduranceruiter in training draaft nu eens 10, dan eens 30 minuten, maar gemiddeld 20 minuten voor hij afstapt.
-> Redelijk stabiele reacties, goede resistentie tegen extinctie.

Andere schema’s:

Differential reinforcement of incompatible behavior (DRI):
Een bepaald vaak voorkomend gedrag wordt ontmoedigd door een tegenovergesteld gedrag te bekrachtigen.
Een paard dat steigert (aanstalten maakt om te steigeren) wordt niet gestraft, maar gevraagd om z’n neus naar de grond te doen; en daarvoor beloond.

  • Differential reinforcement of other behavior (DRO):

Een vorm van DRI, maar meer algemeen: eender welk ander gedrag dan steigeren wordt beloond.

  • Differential reinforcement of low response rate (DRL):

Alleen de bvb. tragere of mindere reacties worden beloond.
Een paard dat z’n hoeven niet geeft, maar uitslaat, màg uitslaan maar alleen de minder heftige of tragere bewegingen worden beloond (tot het paard de hoeven beheerst kan geven).

  • Differential reinforcement of high rate (DRH):

Alleen de bvb. snellere of meerdere reacties worden beloond (sneller bewegen, méér doen… binnen een bepaald interval).
Een paard moet 5 hindernissen in een korterer tijd springen.

  • Fixed time (FT):

Ongeacht of er een respons/reactie is geweest, volgt een beloning.
Dit is een “non-contingent schedule”.
Een paard krijgt altijd eten om 17u, ongeacht wat hij de rest van de dag heeft gedaan.

  • Variable time (VT):

Een paard krijgt altijd eten tussen 16 en 18u, ongeacht wat hij de rest van de dag heeft gedaan.