Hvordan forsterkningsplaner fungerer

Operant condition er en læringsprosess der ny atferd tilegnes og modifiseres gjennom deres tilknytning til konsekvenser. Forsterkning av en atferd øker sannsynligheten for at den vil skje igjen i fremtiden, mens det å straffe en atferd reduserer sannsynligheten for at den blir gjentatt.

I operant kondisjonering er forsterkningsplaner en viktig komponent i læringsprosessen. Når og hvor ofte vi forsterker en atferd, kan det ha en dramatisk innvirkning på styrken og hastigheten på responsen.

Tidsplan for forsterkning

En forsterkningsplan er i utgangspunktet en regel som sier hvilke tilfeller av atferd som vil bli forsterket. I noen tilfeller kan en oppførsel forsterkes hver gang den oppstår. Noen ganger kan en oppførsel kanskje ikke forsterkes i det hele tatt.

Enten positiv forsterkning eller negativ forsterkning kan brukes som en del av operasjonskondisjonering. I begge tilfeller er målet med forsterkning å styrke en atferd slik at den sannsynligvis vil oppstå igjen.

Forsterkningsplaner finner sted i både naturlig forekommende læringssituasjoner og mer strukturerte treningssituasjoner. I virkelige omgivelser vil atferd sannsynligvis ikke bli forsterket hver gang de oppstår. I situasjoner der du forsettlig prøver å forsterke en bestemt handling (for eksempel i skole, sport eller i dyreopplæring), vil du følge en spesifikk forsterkningsplan.

Noen tidsplaner passer bedre til visse typer treningssituasjoner. I noen tilfeller kan trening kreve en tidsplan og deretter bytte til en annen når ønsket oppførsel er blitt lært.

Typer av forsterkningsplaner

De to grunnleggende former for armeringsplaner blir referert til som kontinuerlig armering og delvis armering.

Kontinuerlig forsterkning

I kontinuerlig forsterkning forsterkes ønsket oppførsel hver eneste gang den oppstår. Denne tidsplanen brukes best i de innledende stadiene av læringen for å skape en sterk sammenheng mellom atferd og respons.

Tenk deg for eksempel at du prøver å lære en hund å håndhilse. I løpet av de første stadiene av læringen vil du holde deg til en kontinuerlig forsterkningsplan for å lære og etablere atferden. Dette kan innebære å ta tak i hundens labb, riste den, si "rist" og deretter tilby en belønning hver gang du utfører disse trinnene. Etter hvert vil hunden begynne å utføre handlingen alene.

Kontinuerlige forsterkningsplaner er mest effektive når du prøver å lære en ny oppførsel. Det betegner et mønster som hvert snevert definert svar blir fulgt av en snevert definert konsekvens.

Delvis forsterkning

Når svaret er fast etablert, blir en kontinuerlig forsterkningsplan vanligvis byttet til en delvis forsterkningsplan. I delvis (eller intermitterende) forsterkning forsterkes responsen bare en del av tiden. Lærd atferd tilegnes saktere med delvis forsterkning, men responsen er mer motstandsdyktig mot utryddelse.

Tenk på det tidligere eksemplet der du trente en hund til å riste og. Mens du opprinnelig brukte kontinuerlig forsterkning, er det bare urealistisk å styrke oppførselen hver gang. Med tiden vil du bytte til en delvis tidsplan for å gi ytterligere forsterkning når oppførselen er etablert eller etter lang tid har gått.

Det er fire tidsplaner for delvis forsterkning:

Tidsplaner med fast forhold

Tidsplaner med fast forhold er de svarene forsterkes bare etter et spesifisert antall svar. Denne tidsplanen gir en høy, jevn reaksjonsfrekvens med bare en kort pause etter leveringen av forsterkeren. Et eksempel på en tidsplan med fast forhold ville være å levere en matpellet til en rotte etter at den har trykket en stang fem ganger.

Tidsplaner for variabelt forhold

Planer for variabelt forhold oppstå når et svar forsterkes etter et uforutsigbart antall svar. Denne tidsplanen skaper en jevn responsfrekvens. Gambling og lotterispill er gode eksempler på en belønning basert på en tidsplan for variabelt forhold. I laboratorieinnstillinger kan dette innebære å levere matpiller til en rotte etter en barpress, igjen etter fire barpresser, og deretter igjen etter to barpresser.

Tidsplaner for faste intervaller

Tidsplaner med faste intervaller er de hvor det første svaret først blir belønnet etter at en spesifisert tid har gått. Denne tidsplanen medfører store mengder respons nær slutten av intervallet, men reagerer tregere umiddelbart etter levering av forsterkeren. Et eksempel på dette i laboratorieinnstillinger ville være å forsterke en rotte med en labpellet for den første stangpressen etter at det har gått et intervall på 30 sekunder.

Tidsplaner for variabelt intervall

Planer for variabelt intervall oppstår når et svar blir belønnet etter at uforutsigbar tid har gått. Denne tidsplanen gir en langsom, jevn responsrate.

Et eksempel på dette ville være å levere en matpiller til en rotte etter den første stangpressen etter et minutts intervall; en annen pellet for det første svaret etter et intervall på fem minutter; og en tredje pellet for første respons etter et intervall på tre minutter.

Bruke riktig tidsplan

Å bestemme når man skal forsterke en atferd kan avhenge av en rekke faktorer. I tilfeller der du spesifikt prøver å lære ut en ny oppførsel, er en kontinuerlig tidsplan ofte et godt valg. Når oppførselen er blitt lært, er det ofte å foretrekke å bytte til en delvis tidsplan.

I dagliglivet forekommer partielle forsterkningsplaner mye oftere enn kontinuerlige. Tenk deg for eksempel om du mottok en belønning hver gang du møtte opp for å jobbe i tide. Over tid, i stedet for at belønningen var en positiv forsterkning, kunne benektelsen av belønningen betraktes som negativ forsterkning.

I stedet blir belønninger som disse vanligvis utdelt på en mye mindre forutsigbar delvis forsterkningsplan. Ikke bare er disse mye mer realistiske, men de har også en tendens til å gi høyere svarprosent mens de er mindre utsatt for utryddelse.

Delvis tidsplan reduserer risikoen for metning når en oppførsel er etablert. Hvis en belønning blir gitt uten slutt, kan motivet slutte å utføre oppførselen hvis belønningen ikke lenger er ønsket eller nødvendig.

Tenk deg for eksempel at du prøver å lære en hund å sitte. Hvis du bruker mat som belønning hver gang, kan hunden slutte å utføre når den er full. I slike tilfeller kan noe som ros eller oppmerksomhet være mer effektivt for å styrke en allerede etablert atferd.

Et ord fra veldig bra

Operant condition kan være et kraftig læringsverktøy. Tidsplanen for forsterkning som brukes under trening og vedlikeholdsprosess kan ha stor innflytelse på hvor raskt en oppførsel tilegnes, styrken på responsen og hvor ofte oppførselen vises.

For å finne ut hvilken tidsplan som er å foretrekke, må du vurdere forskjellige aspekter av situasjonen, inkludert hvilken type oppførsel som blir undervist og hvilken type respons som er ønsket.