3.1 Een historische schets
Thorndike en Pavlov stonden samen aan de basis van de moderne leerpsychologie, de
leertheoretische benadering.
Thorndike onderzocht het probleemoplossend vermogen van katten door ze op te sluiten in
een kist waaruit ze konden ontsnappen door via een specifiek mechanisme de deur te openen (aan
touwtje trekken). Daarna werden ze beloond met eten. De katten kregen de deur steeds sneller
open (= acquisitie: verwerven van nieuw gedrag).
Wet van het effect: gedrag dat tot een aangename uitkomst leidt, zal in frequentie toenemen, terwijl gedrag dat tot een onaangename uitkomst leidt in frequentie zal afnemen.
Pavlov ontdekte dat honden eerst alleen speeksel afscheiden als zij voedsel kregen, maar al
snel ook bij andere prikkels waarbij voedsel gepresenteerd werd; Pavlov gebruikte een zoemer. De
honden bleken al snel ook speeksel af te scheiden als zij alleen de zoemer hoorden.
Wetmatigheid: wanneer een prikkel (vlees), die een natuurlijke reactie uitlokt (speeksel),
herhaaldelijk gepresenteerd wordt met een neutrale prikkel (zoemer), zal de neutrale prikkel
(zoemer) op den duur dezelfde reactie (speeksel) uitlokken → klassieke conditionering.
Verschillen tussen Thorndike en Pavlov
Pavlov: Het dier is passief
Thorndike: Het leereffect is afhankelijk van de activiteit van het dier.Pavlov: Het dier leert een associatie tussen twee prikkels, maar geen nieuw gedrag. Het leert alleen om met hetzelfde gedrag op een nieuwe prikkel te reageren.
Thorndike: Het dier leert wel nieuw gedrag, namelijk de relatie tussen een handeling en een prikkel. Het leert zich zo te gedragen dat het een gewenste prikkel ontvangt.
Skinner werkte de instrumentele conditionering verder uit, deze werd synoniem met
operante conditionering. Skinner had bezwaar tegen de kunstmatige proefopstelling en ontwierp
de Skinner-box waarmee het natuurlijke gedragsverloop van het proefdier geobserveerd wordt.
Termen instrumentele conditionering:
Discriminatieve prikkel of situatie (S)
Handeling of respons (R)
Uitkomst of outcome (O)
De kat trekt in de kooi (S) aan het touw (R) en krijgt voedsel (O).
Termen klassieke conditionering:
Onvoorwaardelijke prikkel (OP)
Onvoorwaardelijke reactie/repons (OR)
Voorwaardelijke prikkel (VP)
Voorwaardelijke reactie/respons (VR)
3.2 De leertheoretische benadering nader beschouwd
Definitie leren: gedragsveranderingen van een organisme die het resultaat zijn van
regelmatigheden in de omgeving.
Regelmatigheden: alles wat meer inhoudt dan de aanwezigheid van één stimulus op een uniek
moment in de tijd.
3.2.1 Associatieve theorie van leren
De traditionele verklaring voor conditionering is dat leren plaatsvindt door associatievorming in het geheugen. Een associatie is een hypothetisch construct waarlangs activatie van de ene mentale representatie naar de andere kan stromen. Klassieke conditionering werd een tijdlang beschouwd als stimulus-respons (S-R leren): leggen van een directe verbinding tussen de VP (oma) en de VR (blij worden van koekjes van oma). De controle over een respons verschuift van de OP (gewone koekjes) naar de VP (oma).
Een meer recente versie van deze associatieve theorie ziet conditionering meer als een vorm van stimulus-stimulus leren (S-S-leren). De reactie op de VP (oma) wordt aangedreven door het verwachten van OP (koekjes). De ene stimulus prikkelt de verwachting van een andere stimulus. De speekselafscheiding bij Pavlov’s hond als reactie op de zoemer (OR bij VP) ontstaat omdat de hond voedsel verwacht (OP). Of je wordt blij als je oma ziet omdat je koekjes verwacht.
Hoe kunnen we nu weten welke visie de juiste is, S-R of S-S leren? Om deze vraag te beantwoorden werd de uitkomstdevaluatieprodecure ontwikkeld. Na de conditionering fase wordt de OP opnieuw aangeboden maar nu in gewijzigde vorm bijv aan het voedsel werd een stof toegevoegd die de honden ziek maakt. Wanneer de VP daarna opnieuw werd aangeboden, werd vastgesteld dat de honden helemaal niet meer kwijlden. Dit resultaat werd geïnterpreteerd als in lijn met de S-S leren.
3.2.1. Propositionele theorie van leren
Volgens de propositionele theorie is bij klassiek conditionering zoals in het experiment van Pavlov geen sprake van een blinde associatie tussen zoemer en voedsel, maar van propositie. Leren (conditionering) vindt plaats door het opslaan van een hypothese (= propositie) in het geheugen én de mate van vertrouwen in de hypothese. Een associatie verbindt alleen gebeurtenissen met elkaar; een propositie doet ook een uitspraak over de aard van het verband. Proposities vormen ook de bouwstenen van redeneren.
Met een verwijzing van Darwin’s theorie over fylogenetische adaptatie (aanpassing van de soort aan de omgeving) kunnen we ook stellen dat leren in staat stelt tot ontogenetische adaptatie (aanpassing aan de omgeving tijdens levensloop).
3.3. De leertheoretische benadering in relatie tot psychopathologie
3.3.1 Appetitieve conditionering
Bij appetitieve conditionering is er sprake van aangename prikkels. Het principe van appetitieve conditionering helpt om verslaving of obesitas te begrijpen. Verslaving en verstoord eetgedrag worden gekenmerkt door craving (= hunkering) en preoccupatie met het product. De theorie verklaart dat VP’s (zien van chocola) geassocieerd raken met de inname van het product, OP (inname chocola). De VP’s (zien van chocola) kunnen craving (VR) gaan uitlokken → klassieke conditionering.
Twee system van gedrag
Instrumentele conditionering: appetitieve conditionering treedt op als gedrag bekrachtigd
wordt met een aangename prikkel. Vooral bij zaken die we van nature al lekker vinden
zoals voedsel, alcohol of andere prikkels die ons een bevredigend gevoel geven. Toch lijkt Thorndike’s wet van effect hier niet het hele verhaal te vertellen: de welbekende negatiece gevolgen van verslaaf gedrag of overeten die met de tijd alsmaar groter en directer kunnen worden zouden het productgebruik moeten stoppen, maar dit is in de praktijk veelal niet het geval. Om dergelijk gedrag te begrijpen hebben theoretici voorgesteld dat instrumenteel gedrag twee vormen kan aannemen:
Doelgerichte gedrag (Respons-Uitkomst leren, R-O): dit gedrag is gebaseerd op associaties tussen responsen en uitkomsten
Gewoontegedrag (Stimulus-Respons leren, S-R): dit gedrag is gebaseerd op associaties tussen stimuli en responsen, maar wordt niet gemedieerd door de uitkomst die het gedrag genereert.
Voorbeeld kat van Thorndike: Het succesvolle gedrag van de kat kan op twee manieren verklaard worden. Ze kan het trekken aan het touw associëren met het krijgen van voedsel (R-O) of het touw in de kooi associëren met trekken (S-R). Volgens theoretici, tijdens het initiële leren zouden de instrumentele gedragingen doelgericht zijn. Naarmate het leren vordert, wordt het vertonen van de respons meer en meer een gewoonte.
Een manier om R-O en S-R leren te onderscheiden is de uitkomstdevaluatieprocedure die we al bespraken in de context van klassieke conditionering. Aanleren de proefdieren een respons uit te voeren om een beloning (eten) te krijgen. Vervolgens devalueert men deze uitkomst, bijv door de proefdieren veel eten te geven, tot verzadigd. Als deze devaluatie tot een vermindering van het gedrag leidt, kunnen we stellen dat het om doelgericht gedrag ging. Indien de devaluatie niet tot een vermindering van het gedrag leidt, kunnen we stellen dat het om gewoontegedrag ging.
Kritiek op S-R leren
De kritiek richt zich op devaluatieprocedure. De observatie dat het manipuleren van de uitkomst die het gedrag initieel bekrachtigde niet langer een effect heeft op het gedrag bewijst strikt genomen nog niet dat het gedrag niet meer doelgericht is. Het zou immers ook kunnen dat het gedrag gemotiveerd wordt door een andere uitkomst. Zo kunnen personen die in rouw zijn de plek waar ze vroeger afspraken met de geliefde blijven opzoeken als eerbetoon aan die geliefde. In zo’n geval lijkt het gedrag op het eerste gezicht gewoontegedrag dat niet langer doelgericht is. Het gedrag is evenwel nog steeds doelgericht: de persoon bezoekt de plek nu om een eerbetoon aan de overleden geliefde te brengen.
De interactie tussen klassiek en instrumentele conditionering is belangrijk voor een goed begrip van verslaving en verstoord eetgedrag. Dieronderzoek heeft een interessant effect aan het licht gebracht dat Pavloviaanse-instrumentele transfer (PIT) genoemd wordt. Er ontstaat een interactie tussen klassieke en instrumentele conditionering.
Voorbeeld mevrouw X met drankproblemen: Mevrouw X heeft eerder reeds geleerd dat het kopen van een fles drank de aangename consequentie van alcoholinname oplevert (instrumentele conditionering). Ze heeft bovendien geleerd om bepaalde stimuli te associëren met alcoholinname (klassiek conditionering), bijvoorbeeld het vermoeid thuiskomen na een lange dag. Wat PIT ons vertelt, is dat het vermoeid thuiskomen na een lange dag de kans vergroot dat mevrouw X een fles drank zal gaan kopen.
3.3.2 Aversieve conditionering
Watson, grondlegger behaviorisme: bestudeerde uitsluitend objectief waarneembare prikkels. Met het experiment met little Albert (konijn, angst opwekken door op staaf te slaan) toonde hij aan dat angst kan ontstaan via klassieke conditionering: neutrale gebeurtenissen die gepaard gaan met een akelige of gevaarlijke gebeurtenis zullen angst uitlokken.
Ontwikkelingen in de conditioneringsverklaringen van angststoornissen
Kritiek op aversieve conditionering:
Niet iedereen met een angststoornis heeft een relevante geschiedenis van aversieve conditionering (zelf meegemaakt of gezien).
Niet iedereen die een trauma meemaakt, ontwikkelt een angststoornis.
Latente inhibitie: de conditionering verloopt trager als de VP (oma) vooraf enkele keren zonder OP (koekjes maken blij) wordt aangeboden. Vb. Kinderen die een paar keer naar de tandarts zijn geweest zonder dat dit akelig was, ontwikkelen minder snel angst voor de tandarts als zij ook iets vervelends bij de tandarts meemaken.
Aangeleerde hulpeloosheid: aversieve prikkel waartegen je niks kunt doen, wanneer je wel iets
kunt doen aan de prikkel, dan is dit gedrag moeilijk aan te leren. Dit mechanisme kan een rol
spelen bij het ontstaan van depressie en langdurige angstklachten.
Inflatie-effect: ervaringen die mensen hebben na een aversieve conditioneringsgebeurtenis kunnen effect hebben op de mate van angst. Bijvoorbeeld iemand die een lichte paniekaanval tijdens het rijden krijgt, kan een sterke rijangst ontwikkelen door heviger paniekaanvallen die pas na het rijden optraden. Herhaald denken (= rumineren) over de aversieve gebeurtenis kan ook invloed hebben op het angstniveau.
Generalisatie: aangeleerde angst in een bepaalde situatie verspreidt zich ook naar andere, gerelateerde situaties. V.b. Stel iemand wordt gebeten door een hond, de uitbreiding van de angst naar andere – ook ongevaarlijke – honden is generalisatie.
Interactie tussen klassieke en instrumentele conditionering bij angststoornis
Het hoofdsymptoom van angststoornissen is vermijding. De klassieke verklaring voor dergelijk vermijdingsgedrag is de tweefactorentheorie van Mower.
Factor I: Klassieke conditionering is verantwoordelijk voor het opwekken van de angst.
Factor II: Instrumentele conditionering gaat een rol spelen wanneer het vermijdingsgedrag getoond wordt.
Het cruciale inzicht van Mowrer is dat het vermijdingsgedrag bekrachtigd wordt door de daling van de angst die erop volgt.
3.3.3 De verrassingshypothese
Een hypothese is dat conditionering afhankelijk is van een voorspellingsfout: conditionering zou alleen optreden wanneer het optreden van de OP niet voorspeld en dus verrassend is.
Blokkeringseffect: leren (conditioneren) gebeurt alleen als een prikkel voorafgaat aan een
verrassende gebeurtenis. Dit is afhankelijk van een voorspellingsfout.
Vb. Iemand die steeds erg moet plassen van thee en daarna thee en bier drinkt, is niet verrast dat
hij moet plassen (dat komt immers van de thee), maar blokkeert dat dit ook wel eens zou kunnen
komen van het bier. Hier treedt dus geen leereffect op.
3.4 Implicaties voor behandeling
3.4.1 Extinctie als motor van gedragsverandering
Extinctieleren is in zekere zin het tegenovergestelde van acquisitie leren; het gaat om het leren van de afwezigheid van een belangrijke gebeurtenis. Bij extinctie treedt een belangrijke OP helemaal niet meer op. Deze verrassing zet aan om het gedrag aan te passen aan de veranderde omgeving. Meestal zal de gedragsverandering inhouden dat het eerder aangeleerde gedrag verdwijnt (uitdoving).
Sommige theoretici menen een gelijkenis te zien tussen extinctieleren en exposure (blootstellingstherapie). Daarbij draait het immers om het herhaaldelijk confronteren van patiënten met de VP zonder dat de OP optreedt.
Extinctie bij instrumentele conditionering vindt plaats wanneer het gedrag niet langer gevolgd wordt door de bekrachtiger.
3.4.2 Mogelijke mechanismen van extinctie
Een vaak gehoorde veronderstelling is dat bij extinctie de opgebouwde mentale associatie weer afneemt. De VP gaat niet langer hand in hand met de OP en naarmate de associatie afneemt, zou de VP de representatie van de OP minder sterk uitlokken en daarom zou ook de VR afnemen. Op het einde van een dergelijke extinctie fase zou de VP dan teruggekeerd zijn tot een neutrale prikkel zonder enige signaalwaarde, alsof er nooit conditionering heeft plaatsgevonden.
Een andere theoretische mogelijkheid is dat men leert dat de VP na de extinctie geen voorspeller is van de OP, zonder te vergeten dat de VP de OP eerder wel voorspelde (dus soms wel soms niet). Onderzoek heeft aangetoond dat dat laatste het geval is met terugval.
3.4.3 Terugval en wat eraan te doen
Spontaan herstel (van een reactie): de voorwaardelijke reactie treedt weer op nadat zij eerst volledig uitgedoofd was. (Angst voor hond treedt weer op nadat deze weg was). Ontdekt door Pavlov, bewijst dat uitdoving een voorbijgaand fenomeen is. De VP-OP-associatie is nog in het geheugen aanwezig.
Contextafhankelijkheid: Wanneer de zoemer ervaren wordt in de omgeving waarin extinctie heeft plaatsgevonden, dan is er geen sprake van speekselproductie. Maar het ervaren van de zoemer in een andere context, bijv. een andere kamer, lokt wel een terugkeer van de speekselproductie op.
De huidige consensus is dat extinctie niet het ongedaan maken van de originele conditionering betekent, maar dat het nieuw leren inhoudt. Uitdoving kan effectief zijn, maar vooral zelfs alleen in de context waarin de extinctie plaatsvond.
Uit onderzoek is gebleken dat het effectief kan zijn om extinctie te laten plaatsvinden in verschillende contexten. Daarnaast kan een geheugensteuntje helpen: een soort souvenir van extinctiefase (bijv armband)
Contraconditionering vermindert onaangename gevoelens en gedachten
Bij contraconditionering wordt een VP net als bij extinctie zonder de bijbehorende OP aangeboden, maar nu bovendien ook gekoppeld aan een nieuwe OP met een tegenovergestelde waarde in termen van positiviteit of negativiteit (tegenovergestelde valentie). Vb positieve ervaringen met een hond kunnen ervoor zorgen dat een persoon met een hondenfobie honden niet alleen minder beangstigend vindt, maar ook minder onaangenaam of zelfs aangenaam gaat vinden.
Contraconditionering kan ook plaatsvinden in het kader van instrumenteel leren. Zo zal gedrag dat initieel beloond werd, afnemen wanneer er vervolgens een onaangename prikkel op volgt.
3.4.4 Motivationeel model van exposure
Waar extinctie-onder inspireer om exposure in verschillende contexten uit te voeren en om geheugensteuntjes te gebruiken, daar kan het motivationeel perspectief onder meer inspireren om de doelen die tijdens de exposuresessie behaald zouden moeten worden te koppelen aan hogere-orde doelen. Die de cliënt uiterst waardevol vindt, teneinde de cliënt te motiveren.