RAPPORTENS TITEL I HELVETICA 20 FET VERSALER

Operant betingning vid hästträning
Operant conditioning at horse training
Magdalena Wärn
_________________________________________________________
Sveriges Lantbruksuniversitet
Institutionen för husdjurens miljö och hälsa
Etologi- och Djurskyddsprogrammet
Swedish University of Agricultural Sciences
Department of Animal Environment and Health
Ethology- and Animal Welfare programme
Skara 2008
Foto: Magdalena Wärn___ _
Studentarbete 310
Student report 310
ISSN 1652-280X
Operant betingning vid hästträning
Operant conditioning at horse training
Magdalena Wärn
Examensarbete, 15 hp, Etologi- och Djurskyddsprogrammet
Handledare: Birgitta Larsson
2
Sammanfattning .............................................................................................................................................. 4
Abstract ............................................................................................................................................................ 4
Inledning .......................................................................................................................................................... 5
Syfte .................................................................................................................................................................. 5
Operant betingning ..................................................................................................................................... 6
Förstärkare .................................................................................................................................................. 6
Positiv förstärkning..................................................................................................................................... 6
Negativ förstärkning ................................................................................................................................... 7
Primär förstärkare ...................................................................................................................................... 8
Sekundär förstärkare.................................................................................................................................. 8
Klickerträning ........................................................................................................................................... 10
Timing av förstärkare ............................................................................................................................... 10
Förstärkarens storlek – jackpott.............................................................................................................. 10
Förstärkningsschema - Oregelbundet förstärkningsschema................................................................. 11
Shejping...................................................................................................................................................... 11
Targeting .................................................................................................................................................... 12
Bestraffning................................................................................................................................................ 12
Inlärda obehagliga signaler ...................................................................................................................... 12
Utsläckning ................................................................................................................................................ 12
Skrockfullt beteende.................................................................................................................................. 13
Diskussion ...................................................................................................................................................... 13
Tack ................................................................................................................................................................ 14
Referenser ...................................................................................................................................................... 15
3
Sammanfattning
En litteraturstudie inom området för operant betingning vid hästträning har genomförts.
Vid operant betingning lär man djuret att svara på signaler genom att använda sig av
förstärkningar eller bestraffningar. Den operanta betingningen används ofta inom
hästträningen då antingen negativ eller positiv förstärkning tillämpas. Framförallt är det
den negativa förstärkningen som används, mycket av kommunikationen vid uppsutten
träning bygger på denna metod. Grunden för förstärkningsträning är att det beteende som
leder till en förstärkning ökar i frekvens. Vid den negativa förstärkningen är det önskan att
undvika tryck eller obehag som är förstärkande. Genom att hästen förändrar sitt beteende
kan den få obehaget att försvinna, det gör att chansen för att beteendet skall återkomma i
framtiden ökar. När positiv förstärkning används får djuret en belöning när rätt beteende
utförs. Belöningen måste vara någonting djuret uppskattar och även med denna metod ökar
sannolikheten att djuret utför detta beteende igen.
Det finns studier som visar att användandet av positiv förstärkning ökar motivationen hos
hästen. Även andra beteenden kan förbättras trots att de inte ingår i själva träningen,
exempelvis ökar utforskande beteenden och motivationen till att träna. Det kan vara
nödvändigt att etablera en sekundär förstärkare när man använder sig av positiv
försträkning vid hästträning, annars kan det vara svårt att lyckas förstärka rätt beteende.
Det är viktigt att den sekundära förstärkaren är ett distinkt stimuli som är likadant varje
gång, exempelvis en klicker. Den sekundära förstärkaren måste associeras med en primär
förstärkare, exempelvis mat, lek eller frihet. Användandet av sekundära och primära
förstärkare är vad klickerträningen bygger på. Det finns resultat som tyder på att
användandet av en sekundär förstärkare kan accelerera inlärningen och att beteenden blir
svårare att släcka ut.
Abstract
A literature review of operant conditioning in horse training has been conducted. In the use
of operant conditioning the trainer teach the animal to respond to signals by using
reinforcement or punishment. The operant conditioning is often used in horse training;
either negative or positive reinforcement is then employed. The negative reinforcement is
mainly used; most of the communication in mounted horse training is based on negative
reinforcement. The foundation of reinforcement training is that a behaviour which results
in a reinforcement is increased in frequency. When using negative reinforcement the desire
is to avoid pressure and discomfort reinforcing. By changing the behaviour the horse can
make the discomfort disappear, this enhances the behaviour to occur in the future. When
using positive reinforcement the animal receive a reward if the correct behaviour is
performed. The reward has to be something the animal appreciates, this reinforcement also
increase the likelihood for the behaviour to be conducted in the future.
There are studies displaying that the use of positive reinforcement increases the horse’s
motivation. There are other behaviours that could improve in spite that they are not part of
the training, for example the motivation for training and exploring behaviour increase. It
can be necessary to establish a secondary reinforcement when using positive
reinforcement, the reason is that it otherwise can be difficult to reinforce the right
behaviour. The risk of a delayed reinforcement otherwise is substantial. It is important that
the secondary reinforcement is associated with a primary reinforcement, for example food,
freedom or play. Clicker training is based on the utilization of secondary and primary
reinforcements. Results indicate that learning can be accelerated if a secondary
reinforcement is used and that it increases the behaviours resistance to extinction.
4
Inledning
Operant betingning inom hästträningen är ett område som är viktigt och som jag tror fler
som tränar och umgås med hästar behöver uppmärksammas på. Speciellt anser jag att den
positiva förstärkningen behöver förklaras och att folk får upp ögonen för att det finns
fördelar med att använda denna metod. Men även att användningen av aversiva stimulin,
som används vid negativ förstärkning och positiv bestraffning, har vissa nackdelar. Det
finns en del problemområden inom detta ämne. Dels verkar gemene man inte veta vad
operant betingning är och inte heller att de flesta använder det dagligen i träningen av
hästar. Ett annat problem som jag anser är ganska stort är att forskningsresultaten har svårt
att nå ut till den ”vanliga” hästägaren.
Inlärning kan beskrivas som en förändring i djurets beteende som ett resultat av vissa
upplevelser eller erfarenheter (Wolff & Hausberger, 1995) och den kan vara en passiv eller
aktiv händelse (Murphy & Arkins, 2006). Vid inlärningen förvärvar djuret kunskap som
den senare kan använda för att anpassa sitt beteende vid förändringar i omgivningen
(McGreevy, 2006).
Troligen är det så att ju mer hästens hjärna stimuleras genom att använda minnet, desto
fortare kan den lära av nya erfarenheter. Det är dessutom sannolikt att det optimala sättet
att hålla hästens hjärna aktiverad och mottaglig för inlärning är att erbjuda variation i
hästens miljö och olika aktiviteter (Hanggi, 1999). Resultat från en studie gjord av Rivera
et al. (2002) visar att hästar som hölls ute på bete tillsammans med andra hästar i små
grupper hade lättare att klara av vissa uppgifter än hästar som hölls enskilt i stall.
Dessutom krävde de hästar som stod på stall längre tid för tillvänjning när de skulle få
täcke på sig för första gången än de hästar som gick på bete. Enligt Nicol (2002) beror
inlärningsförmågan delvis på hästens sinnestillstånd. Lugna hästar som lär sig fortare gör
det troligtvis eftersom det är mindre som stör dem i deras inlärningsprocess. Därför är rätt
och lugn hantering av största vikt vid träning av hästar för att ge dem så bra förutsättningar
som möjligt att kunna förstå och lära sig vad tränaren menar. Hästar som har störst
förmåga att lära och förstå våra uttryck är troligtvis de som är bäst lämpade att användas av
människan (Nicol, 2002). Resultat av en studie gjord av Rubin et al. (1980) indikerar att
koncentrerad träning i allt för långa träningssessioner kan leda till försämrad inlärning.
Syfte
Syftet med denna rapport är att sammanställa vad tidigare forskning har kommit fram till
gällande träning av hästar med operant betingning. Syftet med texten är att väcka intresse
för positiv förstärkning och minska användningen av negativ förstärkning och bestraffning
inom hästträning. Min önskan är att denna text enkelt ska kunna skrivas om så att den
passar att sprida till ridskoleelever och intresserade hästägare.
Material och metod
En litteraturstudie och en sammanställning av 26 vetenskapliga artiklar och facklitteratur
har gjorts inom området operant betingning och träning av hästar med positiv förstärkning.
Huvuddelen av referenserna är hämtade från vetenskapligt granskad litteratur, medan
resterande information är hämtad från facklitteratur. För att hitta relevant information har
databaserna Agricola och Web of Knowledge används.
5
Operant betingning
Operant betingning är en gren inom psykologin och bygger till stor del på
Harvardprofessorn B.F. Skinners upptäckter och har många olika namn såsom
beteendemodifiering, förstärkningsteori, behaviorism, behavioristisk psykologi,
beteendeanalys (Pryor, 2003) eller instrumentell betingning (McGreevy, 2006). När man
använder operant betingning inom träning lär man djuret att svara på signaler genom att
använda sig av förstärkningar eller bestraffningar (McLean, 2003; Skinner, 1938).
Aktiviteten som utförs av djuret vid användandet av den operanta betingningen leder
antingen till att den får en belöning (positiv förstärkning) eller att något obehagligt
försvinner (negativ förstärkning) (McGreevy, 2004; Ninomiya et al., 2007). Eller också
används positiv bestraffning, där något obehagligt händer när djuret visar ett visst beteende
eller negativ bestraffning där något djuret vill ha försvinner vid visat beteende (McGreevy,
2004).
Vid träning av hästar används ofta positiv eller negativ förstärkning för att få djuret att
utföra rätt beteende (Ninomiya, et al., 2007).
Förstärkare
Enligt McGreevy (2004) är en förstärkare något som gör att beteendet återkommer i
framtiden. För att förstärkaren ska vara effektiv får den inte komma för sent, en försening
med någon sekund förstör mycket av effekten (Skinner, 1951). Tilltar inte beteendet
presenteras antingen förstärkaren för tidigt eller för sent, alternativt är den valda
belöningen inte förstärkande för den individen (Pryor, 2003).
Genom att använda sig av en förstärkare får man en möjlighet att kontrollera djurets
beteende och kan på så sätt förändra beteendet till en önskad respons (Skinner, 1951). Vid
användning av förstärkningsträning krävs det att djuret visar beteendet för att man ska
kunna förstärka det (Pryor, 2003).
Både positiv och negativ förstärkning stärker sambandet mellan stimuli och en önskad
respons, vilket gör att utsikten att denna respons ska visas nästa gång förbättras (Tarpy,
1975).
Positiv förstärkning
En positiv förstärkare är något som individen uppskattar (Tarpy, 1975) och som
presenteras när djuret har utfört ett önskat beteende (Skinner, 1953). Genom att använda
positiv förstärkning kan spontana beteenden förstärkas även om de endast förekommer
sporadiskt (Pryor, 2003).
Enligt en studie gjord av Innes & McBride (2007) var hästar som tränades med positiv
förstärkning mer motiverade att delta i träning. I studien kom man fram till att de hästarna
var mer utforskande och genomförde fler ”trial and error” - försök i främmande situationer
och miljöer. De hade även högre hjärtfrekvens än de som tränades med negativ
förstärkning. Det framkom att hästar som fick den positiva behandlingen var extremt
motiverade att få tillgång till träningsmiljön vid de senare stadierna av träningen, vilket
tyder på en positiv istället för en negativ stress.
I samma studie gjord av Innes & McBride (2007) tyder resultaten på att den negativa
förstärkningen inte är en metod som kompromissar med hästens välfärd, men den positiva
6
förstärkningen skänker djuret fördelar. Byte från träning baserad på aversivt stimuli till
positiv förstärkning har tydliga och direkta fördelar för hästen. Det är även möjligt att
förändringen påverkar den sociala kontakten genom minskat bråk med andra individer
(Ferguson & Rosales-Ruiz, 2001).
I Australien genomförde Warren-Smith & McGreevy (2008) en studie där man undersökte
om hästtränare hade en korrekt förståelse av skillnaden mellan positiv och negativ
förstärkning. Av 206 svar var det 79,5 % av tränarna som ansåg att positiv förstärkning var
”väldigt användbart”, men trots detta så var det endast 2,8 % som korrekt förklarade hur
det skall tillämpas.
Haverbeke et al. (2008) genomförde en studie där belgiska hundtränare inom militären och
deras hundar observerades. Man jämförde förekomsten och konsekvensen av framförallt
positiv bestraffning respektive positiv förstärkning. De mest frekvent använda positiva
bestraffningarna var att tränaren ryckte i kopplet eller lyfte upp hunden i halsbandet.
Samtidigt som strykningar och klappar användes som positiv förstärkning i stor
utsträckning. Hundar som utsattes för positiv bestraffning under testet hade en lägre
hållning och blev mer distraherade vilket resulterade i sämre prestation. Vid låg prestation
föreslås av författarna att bland annat mer positiv förstärkning användas vilket förbättrar
relationen mellan tränare och hund.
Ferguson & Rosales-Ruiz (2001) genomförde en studie där de lastade hästar med hjälp av
positiv förstärkning. Dessa hästar hade tidigare erfarenhet av aversivt stimuli vid lastning,
såsom spön och rep. Hos dessa hästar förekom det förändringar i beteendet som inte mättes
men som observerades av ägarna. Två av hästarna som tidigare varit svåra att fånga i
hagen och sätta grimman på, kom efter att lastträningen påbörjats fram till grinden och
undvek inte längre grimman trots att detta inte fokuserades på vid lastträningen. Det blev
en sekundär effekt av träningen med positiv förstärkning.
Negativ förstärkning
Vid användning av negativ förstärkning tas något aversivt (exempelvis tryck) bort när
önskad respons visas av djuret (Skinner, 1953). Djuret arbetar för att undvika detta obehag
och det får det att på så sätt öka frekvensen av beteendet (McGreevy, 2004). Både lätta och
mycket extrema obehag kan vara negativa förstärkare, de kan avbrytas eller undvikas
genom att djuret ändrar sitt beteende, obehagen upphör direkt när det nya beteendet
påbörjas vilket gör att responsen stärks (Pryor, 2003).
Resultat från en studie gjord av Innes & McBride (2007) tyder på att hästarna som tränades
med negativ förstärkning förblev mer reaktiva än de som tränades med positiv
förstärkning. Trots frånvaron av signifikanta resultat verkade dessa hästar tillbringa mer tid
att skrapa med framhovarna under försöksperioden än de som tränades med positiv
förstärkning. Vilket kan tyda på att de var mer frustrerade. Det kan tolkas som att den
negativa förstärkningsträningen påverkade hästarnas upplevelser av miljön.
Mycket av den traditionella hästträningen bygger på negativ förstärkning, hästen lär sig att
svänga vänster när tygeln på den sidan stramas åt därför att obehaget släpper direkt när den
går åt det hållet (McGreevy, 2006). Det är oftast nödvändigt att använda sig av negativ
förstärkning vid ridning, detta för att kommunicera med hästen, tryck med skänkeln eller
kramande om tygeln talar om för hästen vad den skall utföra för beteende (Kurland, 1999).
Det kan vara effektivt att använda negativ förstärkare när man tränar ett djur och det kan
7
vara en trevlig upplevelse för djuret även om aversivt stimuli (ett obehagligt stimuli som
djuret vill undvika) är inblandat (Pryor, 2003).
Duktiga tränare som använder sig av negativ förstärkning är noga med att inte använda för
intensivt stimuli så att hästen blir ohanterlig. Om hästen får panik och den negativa
förstärkningen måste avbrytas innan rätt respons har uppnåtts, kan detta göra att hästen
snabbt lär sig hur den ska undvika den negativ förstärkning (McCall, 1990).
Trots att negativ förstärkning används i stor utsträckning inom hästträningen så bygger
många inlärnings-tester på användning av primär positiv förstärkning. Detta gör att
forskningen ibland är svår att tillämpa vid traditionell träning av hästar (McCall, 1990).
Primär förstärkare
En primär förstärkare är en resurs som djuret är angeläget om att få och som det är villigt
att arbeta för såsom mat, vatten, sex, lek, frihet eller sällskap (McGreevy, 2004). Denna
förstärkare reducerar fysiologiska behov (exempelvis hunger, törst eller undkommande av
aversivt stimuli) och det är en generell resurs som djuret har ett nedärvt behov av och är
inget den behöver lära sig att uppskatta (McCall & Burgin, 2002).
Använder man mat som primär förstärkare bör man inte välja något som ingår i den
dagliga utfodringen. Det är heller inte bra att använda något okänt som belöning då vissa
hästar lider av neofobi, vilket betyder att de har en inbyggd rädsla för sådant som är nytt
och främmande (McGreevy, 2004).
I en studie gjord av Ninomiya et al. (2007) undersöktes effekten av två olika typer av foder
(hö och pellets) vid operant betingning av tolv hästar. Resultaten från studien tyder på att
tiden det tog att träna hästen inte påverkades av smakligheten på belöningen. Dock
påverkade smakligheten hästarnas motivation för att utföra en operant respons.
Motivationen ökade vid användning av det smakligare kraftfodret jämfört med det hö som
var mindre uppskattat. Om byte från ett smakligt foder till ett mindre smakligt gjordes blev
hästarna frustrerade, antalet operanta responser minskade och utsläckning (vilket betyder
att hästarna slutar att utföra ett beteende) inträffade hos vissa individer. Resultaten från
studien tyder på att det är viktigt att tänka på smakligheten på belöningen i början av den
operanta betingningen för hästar, då en senare ändring av belöning kan påverka
responsgraden.
Sekundär förstärkare
Om man arbetar med positiv förstärkning kan det vara nödvändigt att befästa en sekundär
förstärkare, detta för att det ibland är svårt att leverera belöningen tillräckligt fort när djuret
visar ett önskat beteende (Pryor, 2003). En sekundär förstärkare kallas ofta för betingad
eller inlärd och den reducerar inte fysiologiska behov (McCall & Burgin, 2002). Till en
början är den inte förstärkande för djuret utan måste associeras med en primär förstärkare
(McGreevy, 2004). Som sekundär förstärkare behövs en omedelbar och klar signal, det kan
vara ett ljud eller en ljussignal (Skinner, 1951). Signalen presenteras före eller i samband
med den primära förstärkaren (Pryor, 2003).
En fördel med att använda en sekundär förstärkare är att man kan förmedla exakt vad det
är man vill att djuret ska lära sig (Pryor, 2003). I en studie gjord av McCall & Burgin
(2002) verkade den sekundära förstärkaren i form av en ringklocka accelerera inlärningen
jämfört med de hästar som inte erhöll någon sekundär förstärkare, dock var det inte någon
8
signifikant skillnad. I en studie gjord av Langbein et al. (2007) undersöktes användandet
av en sekundär förstärkare vid inlärning hos dvärg-getter (Capra hircus). Resultat från
studien tyder på att getterna uppnådde inlärningskriteriet tidigare och att det krävdes färre
försök vid användandet av en sekundär förstärkare jämfört med kontrollgruppen som
endast fick den primära förstärkningen.
Effektiviteten hos den sekundära förstärkaren påverkas av hur attraktiv den associerade
primära förstärkaren är för djuret (McCall & Burgin, 2002). För att förbättra effektiviteten
kan man förknippa den sekundära förstärkaren med flera olika belöningar (Pryor, 2003).
McCall & Burgin (2002) skriver i sin artikel att den sekundära förstärkaren är effektiv vid
träning, men att hästarna i deras studie raskt förlorade intresset för uppgiften om de inte
fick någon primär förstärkare. Resultatet av studien tyder på att sekundär förstärkare är
användbar vid träning av hästar, men då krävs att den kopplas ihop med en primär
förstärkare för att fungera. Det är viktigt att djuret alltid får en primär förstärkare efter att
den sekundära förstärkaren har använts, annars avtar effekten (Skinner, 1951).
Ibland används verbala fraser och klappar på halsen vid uppsutten träning av hästar, men
de är ofta ovarsamt kopplade till en primär förstärkare (McCall & Burgin, 2002). Det är
viktigt att en association uppstår mellan sekundär och primär förstärkare om det ska bli en
förstärkande effekt (Williams et al., 2004). McCall & Burgin (2002) skriver att vid träning
av hästar där sekundär förstärkare används ges den ofta direkt innan den primära
förstärkaren, vilket gör att det är oklart om hästen svarar på en kort kedjeprocess eller
erhållandet av den primära förstärkaren.
I en studie gjord av Williams et al. (2004) verkade alla hästarna etablera en koppling
mellan den sekundära och den primära förstärkaren. Direkt efter att de hört den sekundära
förstärkaren iakttog de eller placerade mulen i den skål där de lärt sig att den primära
förstärkaren erbjöds. Många av hästarna blev frustrerade när de hörde klicket men inte
erhöll någon primär förstärkare under utsläckningsfasen av behandlingen (Williams et al.,
2004). För att den sekundära förstärkaren skall fungera måste man vara noggrann med att
inte utan innebörd använda den i tid och otid (Pryor, 2003).
Genom att presentera den sekundära förstärkaren när djuret är bortvänt kan man ta reda på
om den sekundära förstärkaren är befäst, vilket man kan se om djuret vänder sig mot ljudet
och tittar efter den primära förstärkaren när signalen presenteras (Skinner, 1951).
9
Klickerträning
På 1960-talet började Keller Breland, som var forskarstudent hos B.F. Skinner, att använda
en visselpipa som en inlärd förstärkare vid träning av marina däggdjur. Breland kallade
pipan för ”överbryggande stimulus” eftersom den skapade en brygga mellan det beteende
som var rätt utfört och tiden innan djuret fick sin belöning (Pryor, 2003).
Allmänheten började använda operant inlärning, shejping, positiv förstärkning och inlärda
förstärkare på 1990-talet, med hundägare i spetsen. Då introducerades en plastdosa med en
metallfjäder (klicker), denna användes som en sekundär förstärkare och träningsmetoden
kallades för klickerträning (Pryor, 2003).
På det sätt klickertränare använder klicket har den förutom som inlärd förstärkare och
överbryggande stimuli, flera outforskade funktioner. Den kanske största funktionen är vad
som ibland kallas händelsemarkör, då den visar djuret exakt vilket beteende som förstärks.
En annan viktig funktion är att klickerträning överlämnar kontrollen till djuret. Den tredje
funktionen, så som klickertränaren använder den inlärda förstärkaren, är att den blir en
slutsignal och meddelar djuret att jobbet är klart (Pryor, 2003).
Det kan vara bra att lära in en signal som talar om för djuret att fortsätta med det den gör
och att den är på rätt väg. Denna signal behöver inte kopplas till en primär förstärkare utan
det räcker att man ger den någonstans innan det avslutande klicket. Detta gör att djuret
snabbt lär sig att denna signal leder till en kommande förstärkning. En visselpipa, ett ord
eller handtecken kan användas som signal. Det är viktigt att signalen inte bara är en
uppmuntran eller hejarop utan en väl befäst och noggrant använd inlärd förstärkare (Pryor,
2003).
Enligt en studie gjord på domesticerade hundar tar det längre tid innan ett beteende släcks
ut om klickerträning används. Jämfört med situationer där endast primär förstärkare
används som belöning (Shawn et al,. 2008).
Timing av förstärkare
Det är väldigt viktigt att förstärkaren inte kommer för sent eller för tidigt, timingen är
viktig för att träningen skall bli effektiv (Pryor, 2003). Vidare skriver Pryor (2003) att för
nybörjare som använder förstärkare är fördröjning det största problemet. Uppstår det
problem i träningssituationen bör en av de första saker man ser över vara att förstärkaren
inte kommer för sent (Pryor, 2003).
Även vid träning med negativ förstärkning är timingen viktig. Om man lär hästen att
svänga när den ena tygeln stramas åt är det viktigt att eftergiften kommer direkt när hästen
svänger. Förstärkning sker när obehaget upphör (Pryor, 2003).
Förstärkarens storlek – jackpott
I regel bör en förstärkare motsvara en munsbit, detta gör att intresset hålls uppe. Använder
man något som djuret uppskattar särskilt mycket kan man ge lite mindre bitar. Hur svår
uppgiften som djuret skall utföra påverkar hur stor förstärkaren bör vara, ju svårare uppgift
desto större belöning (Pryor, 2003).
Om man använder en liten förstärkare som inte tar så lång tid för djuret att äta upp så
minskas väntetiden och gör även att djuret inte blir mätt så fort (Pryor, 2003).
10
En användbar teknik kan vara att använda en jackpott, det är en belöning som är mycket
större än den normala förstärkaren och som kommer som en överraskning. Vid ett plötsligt
genombrott kan det vara bra att utdela en jackpott (Pryor, 2003). Pryor (2003) nämner en
hästtränare som snabbt sitter av, tar av sadel och träns och släpper lös hästen första gången
den lyckats med ett svårt moment. Detta gör ofta att det nya beteendet lättare blir befäst,
eftersom belöningen, absolut frihet, uppskattas av hästen.
Förstärkningsschema - Oregelbundet förstärkningsschema
Många tror att man för alltid måste ha klicker och godis till hands när man använder sig av
klickerträning för att beteendet inte skall försvinna. Men om man belönar varje gång ett
djur utför ett befäst beteende skulle det efter ett tag bli så nonchalant som det bara är
möjligt, men ändå resultera i en belöning (Pryor, 2003). Slutar man sedan att belöna djuret
skulle det upphöra att utföra beteendet. Tillämpas istället oregelbundet
förstärkningsschema och belöning med olika intervall blir beteendet mycket starkare
befäst. Djuret arbetar hårdare för att få tillgång till förstärkningen (Tarpy, 1975) och man
kan på så sätt välja att bara belöna de bäst utförda beteendena (Pryor, 2003).
Ju längre det oregelbundna schemat varar desto effektivare blir beteendet befäst. Är målet
att släcka ut ett beteende så kan ett oregelbundet schema istället ha motsatt effekt. Får
djuret ingen förstärkning för ett beteende så släcks det ut av sig självt, men om det
förstärks om än endast sporadiskt kan det faktiskt göra att beteendet blir mer frekvent
(Pryor, 2003).
Går ett beteende ut på att lösa ett slags problem eller att djuret skall välja mellan två saker
bör inte oregelbunden förstärkning tillämpas. I dessa situationer är det viktigt att tala om
för djuret när det gör rätt så att det blir säker på vilket beteende som skall utföras nästa
gång (Pryor, 2003).
Shejping
Ett annat ord för shejping är successiv approximation. Shejping innebär att man i mycket
små steg förändrar ett beteende mot ett uppsatt mål genom att man fångar upp små
tendenser i rätt riktning (Pryor, 2003). Det som gör att shejping är möjligt är att alla
levande individers beteende går att förändra. Genom att sätta upp delmål kan man få djuret
att utföra ett beteende oavsett hur förfinat och svårt det är (Pryor, 2003).
Framgång eller misslyckande med shejping påverkas inte av hur duktig tränaren är på att
shejpa utan beror på uthållighet (Pryor, 2003).
I den tidigare beskrivna studien av Ferguson & Rosales-Ruiz (2001) där shejping användes
för att lasta hästarna visade resultaten att fyra av fem hästar följde ett liknande
shejpingprogram. Deras framsteg följdes åt och det tog ungefär lika lång tid att fullborda
lastträningen, detta oberoende av vilket beteende de visade i den inledande träningen.
Vilket kan visa att trots att det är fem olika individer, med olika bakgrund av lastning, så
går de flesta individer att träna.
11
Targeting
Vid targeting shejpar man djuret att nudda en target med exempelvis nosen, en target kan
vara vad som helst, exempelvis en käpp eller tränarens slutna hand. Genom att sedan flytta
runt denna target kan man få djuret att utföra en mängd olika beteenden, som att klättra i
trappor, hoppa, stegra sig eller följa efter tränaren (Pryor, 2003). Alla hästar som ingick i
studien gjord av Ferguson & Rosales-Ruiz (2001) lärde sig att nudda en target vid första
sessionen.
Targeting är mångsidig och kan användas i många situationer för att få en häst att utföra ett
beteende utan att man behöver röra eller göra hästen avståndstagande. En target används
heller inte som medel för att straffa ett djur vilket gör att den inte associeras med något
obehagligt (Ferguson & Rosales-Ruiz, 2001).
Vid lastträningen av de fem hästar som ingick i studien av Ferguson & Rosales-Ruiz
(2001) var targeting och shejping effektivt som träningsmetod, utan användning av
bestraffning eller negativ förstärkning. Dessa hästar generaliserade även lastningen till
andra transporter och tränare, inkluderat ägaren.
Bestraffning
Bestraffning och negativ förstärkare är inte samma sak, en bestraffning avbryter ett
beteende och till skillnad från förstärkning minskar sannolikheten att beteendet skall
återkomma i framtiden (Pryor, 2003). Dock används aversivt stimuli både vid bestraffning
och vid negativ förstärkning. Vid bestraffning presenteras det aversiva stimulit efter att
hästen utfört ett oönskat beteende, till skillnad från negativ förstärkning där det aversiva
stimulit presenteras innan hästen utför en begärd respons och tas bort direkt när hästen
svarar (McCall, 1990). Egtvedt & Køste (2005) skriver att stor användning av aversiv
träning kan medföra att djuret blir passivt och kan göra att den blir rädd för att göra fel.
Det finns två typer av bestraffning, det som skiljer är vad som händer när djuret utför ett
oönskat beteende. Vid den positiva bestraffningen tillförs ett obehagligt stimuli,
exempelvis ett spöslag, och vid den negativa tas något önskvärt bort (Kurland, 1999). Båda
fallen resulterar i att ett pågående beteende bryts men det går inte att förutsäga vad det
istället leder till för beteende (Pryor, 2003).
Använder man positiv förstärkning i träningen av ett djur kan man för att få ett oönskat
beteende att upphöra, använda sig av negativ bestraffning. Detta gör man genom att helt
enkelt lämna djuret när det visar ett opassande beteende, man tar då bort något den vill ha
tillgång till, chansen till belöning. Detta är mer effektivt än att korrigera ett beteende med
positiv bestraffning (Kurland, 1999).
Inlärda obehagliga signaler
Används positiv förstärkning för att träna djur betyder inte det att man inte kan tillrättavisa
djuret. Genom att befästa ett ord som en inlärd negativ förstärkare kan man göra
tillrättavisningarna effektiva. Inlärda obehagliga stimuli är effektivare än hotelser (Pryor,
2003).
Utsläckning
Beteenden som ignoreras minskar i frekvens och kommer till slut att släckas ut (Tarpy,
1975). Utsläckning (djuret slutar att utföra ett beteende) sker även om ett tidigare inlärt
beteende inte längre resulterar i en belöning (McGreevy, 2004).
12
Vid inlärning av ett nytt moment gör hästen ofta många felaktiga försök innan rätt
beteende utförs. Ifall dessa inkorrekta försök ignoreras av tränaren och endast rätt beteende
blir förstärkt, kommer de oönskade beteendena att minska och de önskvärda istället att öka
i frekvens (McCall, 1990).
I en studie gjord av McCall & Burgin (2002) blev hästarna frustrerade under
utsläckningsfasen. I studien skulle hästarna trycka på en spak för att få belöning och vid
utebliven förstärkning tog hästarna tag i spaken med tänderna och drog den åt sidan eller
lutade sig mot den med stor kraft. Agerandet visar att hästarna associerade händelsen att
trycka på spaken med erhållandet av den primära förstärkaren. Efter utsläckningen var det
enkelt att åter träna hästarna att trycka på spaken om belöning återigen gavs. Detta visar att
spontan återhämtning av en inlärd respons sker och att utsläckning inte eliminerar det
inlärda beteendet, utan undertrycker det och gör att ett annat beteende utförs istället
(McCall & Burgin, 2002).
Skrockfullt beteende
Skrockfullt beteende innebär att djuret utför ett beteende som inte har något med resultatet
att göra, men individen fortsätter att upprepa det som om det var nödvändigt för att få
förstärkning, detta fenomen inträffar ofta vid träning av djur (Pryor, 2003). Djuret kan bli
beroende av betingelser som har förstärkts många gånger utan att tränaren varit medveten
om detta. När man sedan ber djuret att utföra beteendet under andra förhållanden, kan
beteendet helt oväntat bryta samman. För att undvika att detta inträffar är det viktigt att
variera miljön så snart djuret har lärt sig det nya beteendet. Det är även viktigt att inte
tillfälliga mönster för timing utvecklas, både djur och människor har en väl utvecklad
känsla för tidsintervall (Pryor, 2003).
Diskussion
Troligen är det inte många som tränar hästar som vet vad operant betingning är eller att de
flesta använder sig av det dagligen i umgänget med hästar. Den negativa förstärkningen är
den del av den operanta betingningen som är vanligast förekommande. Den används
exempelvis inom ridningen där hästen lär sig att svara på ryttarens hjälper och belönas med
eftergift när den utför rätt beteende. Inte många använder sig av den positiva
förstärkningen, trots att det finns fördelar med denna träningsmetod. Det finns resultat från
studier som tyder på att hästens motivation till träning ökar vid användandet av positiv
förstärkning. Till skillnad från resultat där negativ förstärkning användes där hästarna
förblev mer reaktiva, verkade mer obekväma av träningen och verkade frustrerade. Många
gånger kanske det är traditionen som styr vilken metod som används inom träningen av
hästar, man har inte så stor erfarenhet av att använda sig av positiv förstärkning.
Förhoppningsvis är detta något som kommer att förändras med tiden, då för stor
användning av aversiva stimuli kan göra hästen passiv och rädd för att göra fel. Det är
svårt att se hur kommunikationen vid ridning skulle utformas för att helt utesluta den
negativa förstärkningen, men denna form av träning kan vara en trevlig process för djuret
om den tillämpas på ett bra sätt. Exempelvis kan man använda positiv förstärkning under
inlärningen av de kommandon hästen behöver kunna vid uppsutten träning, då blir
träningen mer effektiv. Vilken metod man än väljer är det väldigt viktigt att timingen för
förstärkaren är exakt. En fördröjning på endast en sekund gör att effektiviteten minskar.
13
Positiv bestraffning vid träning av hästar verkar inte ha några fördelar utan resulterar i att
djuret blir rädd för att göra fel. Det kan göra att hästen blir passiv och hälsan påverkas
negativt på grund av den emotionella stressen den utsätts för. Genom att använda
bestraffning kan man heller inte förutse vad reaktionen kommer att bli och hur beteendet
kommer att förändras. Däremot kan negativ bestraffning användas om man tränar med
positiv förstärkning detta genom att man tar en timeout om djuret uppför sig illa. Hästen
kommer att uppfatta detta bestraffande på grund av att den som regel uppskattar träningen
med positiv förstärkning. På detta sätt kan man korrigera en häst som exempelvis biter och
blir för närgången vid belöning med godis. Om man är konsekvent och endast ger godiset
när hästen är lugn och inte tigger så kommer detta beteende med tiden att försvinna, genom
att hästen märker att den inte får belöning om den tigger. Som alltid är konsekvens viktigt
vid träningen av djur.
Ordet positiv i sammanhanget positiv förstärkning och positiv bestraffning säger ingenting
om hur djuret upplever det, utan endast att det tillförs något när ett beteende visas. Till
skillnad från negativ förstärkning och negativ bestraffning där något tas bort vid ett visst
beteende. Detta är viktigt att komma ihåg.
Ibland används verbala fraser och klappar på halsen vid uppsutten träning av hästar, men
de är ofta ovarsamt kopplade till en primär förstärkare. Det är antagligen vanligt
förekommande, många tror säkert att hästen uppfattar en klapp på halsen som förstärkande
och förstår att den har gjort något bra. Definitionen på en primär förstärkare är att den
reducerar ett fysiologiskt behov som hästen har, vilket behov skulle denna klapp reducera?
Hästen uppskattar troligen hellre att man kliar den eller ger den frihet. Belöningen kan vara
frihet från tryck eller en stunds avkoppling och ledighet. Berömmande ord kan vara
förstärkande, men troligen är det mer röstläget än själva orden som är förstärkande. För att
hästen ska uppfatta enstaka ord som förstärkande krävs att de associeras med en primär
förstärkare.
Min slutsats är att användning av positiv förstärkning vid inlärning av ett nytt beteende hos
hästen har flera fördelar. Hästen verkar uppfatta träningen som mer positiv och blir mer
motiverad till träningen.
Tack
Jag vill tacka min handledare Birgitta Larsson för hennes synpunkter på text och innehåll,
vilket har gjort att arbetet flutit på bra och blivit till en bra sammanställning. Hon har hjälpt
mig att se framtidsmöjligheterna med mitt arbete och hon har uppmuntrat mig i mina
funderingar att använda kunskapen till att någon gång i framtiden skriva en bok som kan
inspirera andra människor.
Ett jätte stort tack förtjänar min sambo Johan för att han har stått ut tiden jag suttit med
examensarbetet. Tack även för stöttningen under min utbildningstid, utan honom hade det
inte gått!
Jag vill även tacka Karolina Westlund för den föreläsning om klickerträning hon höll under
Etologikursen våren 2008 som var väldigt inspirerande. Tack även för svaren på mina mail
där jag fick bra tips om litteratur inom området.
Tack till Josefina Zidar som varit ett jättebra bollplank och för hennes uppmuntran när det
känts som tiden inte räckt till och berget av jobb kändes oöverstigligt.
Även min mamma Karin Hulthén och min gudmor Marianne Iwarson förtjänare ett tack för
bra synpunkter på texten.
14
Men störst tack får ändå mina djur som har ställt upp på att klickertränas vilket har varit
väldigt bra för att kunna förstå principerna för positiv förstärkningsträning. Det är roligt att
se de framsteg som de gör och att se hela deras inställning till träning förändras. Det är
enormt inspirerande och genom dem lär jag mig något nytt varje dag. De har även gjort att
jag har fått en önskan om att förändra livet för andra djur genom att öppna ögonen för
positiv förstärkning.
Referenser
Egtvedt, M. & Køste, C. 2005. Klickerträning för din hund. Storlien, Nordiska
hundförlaget AB.
Ferguson, D.L. & Rosales-Ruiz, J. 2001. Loading the problem loader: the effects of target
training and shaping on trailer-loading behavior of horses. Journal of Applied
Behavior Analysis. 34, 409-424.
Hanggi, E.B. 1999. Categorization learning in horses (Equus caballus). Journal of
Comparative Psychology. 113, 243-252.
Haverbeke, A. Laporte, B. Depiereux, E. Giffroy, J.-M. & Diederich, C. 2008. Training
methods of military dog handlers and their effects on the team’s performances.
Applied Animal Behaviour Science. 113, 110-122.
Innes, L. & McBride, S. 2008. Negative versus positive reinforcement: An evaluation of
training strategies for rehabilitated horses. Applied Animal Behaviour Science. 112,
357-368.
Kurland, A. 1999. Clicker traning instruction kit for horses. Vintrosa, Hundens förlag.
Langbein, J. Siebert, K. Nuernberg, G. & Manteuffel, G. 2007. The impact of acoustical
secondary reinforcement during shape discrimination learning of dwarf goats (Capra
Hircus). Applied Animal Behaviour Science. 103, 35-44.
McCall, C.A. 1990. A rewiew of learning behavior in horses and its application in horse
training. Journal of Animal Science. 68, 75-81.
McCall, C.A. & Burgin, S.E. 2002. Equine utilization of secondary reinforcement during
response extinction and acquisition. Applied Animal Behaviour Science. 78, 253-262.
McGreevy, P. 2006. The advent of equitation science. The Veterinary Journal. 174, 492500.
McGreevy, P. 2004. Equine Behavior – a guide for veterinarians and equine scientists.
Saunders, Elsevier Limited.
McLean, A. 2003. The truth about horses. Penguin Books, Australia.
Murphy, J. & Arkins, S. 2006. Equine learning behaviour. Behavioural Processes. 76, 113.
15
Nicol, C.J. 2002. Equine learning: progress and suggestions for future research. Applied
Animal Behaviour Science. 78, 193-208.
Ninomiya, S. Mitsumasu, T. Aoyama, M & Kusunose, R. 2007. A note on the effect of a
palatable food reward on operant conditioning in horses. Applied Animal Behaviour
Science. 108, 342-347.
Pryor, K. 2003. Skjut inte hunden – en bok om operant inlärning i vardagen. Vintrosa,
Hundens förlag.
Rivera, E. Benjamin, S. Nielsen, B. Zanella, A.J. & Shelle, J. 2002. Behavioral and
physiological responses of horses to initial training: the comparison between pastures
versus stalled horses. Applied Animal Behaviour Science. 78, 235-252.
Rubin, L. Oppegard, C. & Hintz, H.F. 1980. The effect of varying the temporal distribution
of conditioning trials on equine learning behavior. Journal of Animal Science. 50,
1184.
Shawn, M. Smith, E. & Davis, S. 2008. Clicker increases resistance to extinction but does
not decrease training time of a simple operant task in domestic dogs (Canis familiaris).
Applied Animal Behaviour Science. 110, 318-329.
Skinner, B.F. 1938. The behavior of organisms. Appleton-Century, New York, USA.
Skinner, B.F. 1951. How to teach animals. Scientific American. 185, 26-29.
Skinner, B.F. 1953. Science and human behavior. Macmillan, New York, USA.
Tarpy, R.M. 1975. Basic principles of learning. Scott, Foresman & Co., Glenview, IL.
Warren-Smith, A. & McGreevy, P. 2008. Equestrian coaches' understanding and
application of learning theory in horse training. Anthrozoos. 2, 153-162.
Williams, J.L. Friend, T.H. Nevill, C.H. & Archer, G. 2004. The efficacy of a secondary
reinforcer (clicker) during acquisition and extinction of an operant task in horses.
Applied Animal Behaviour Science. 88, 331-341.
Wolff, A. & Hausberger, M. 1996. Learning and memorisation of two different tasks in
horses: the effects of age, sex and sire. Applied Animal Behaviour Science. 46, 137143.
16