Operant betingning vid hästträning Operant conditioning at horse training Magdalena Wärn _________________________________________________________ Sveriges Lantbruksuniversitet Institutionen för husdjurens miljö och hälsa Etologi- och Djurskyddsprogrammet Swedish University of Agricultural Sciences Department of Animal Environment and Health Ethology- and Animal Welfare programme Skara 2008 Foto: Magdalena Wärn___ _ Studentarbete 310 Student report 310 ISSN 1652-280X Operant betingning vid hästträning Operant conditioning at horse training Magdalena Wärn Examensarbete, 15 hp, Etologi- och Djurskyddsprogrammet Handledare: Birgitta Larsson 2 Sammanfattning .............................................................................................................................................. 4 Abstract ............................................................................................................................................................ 4 Inledning .......................................................................................................................................................... 5 Syfte .................................................................................................................................................................. 5 Operant betingning ..................................................................................................................................... 6 Förstärkare .................................................................................................................................................. 6 Positiv förstärkning..................................................................................................................................... 6 Negativ förstärkning ................................................................................................................................... 7 Primär förstärkare ...................................................................................................................................... 8 Sekundär förstärkare.................................................................................................................................. 8 Klickerträning ........................................................................................................................................... 10 Timing av förstärkare ............................................................................................................................... 10 Förstärkarens storlek – jackpott.............................................................................................................. 10 Förstärkningsschema - Oregelbundet förstärkningsschema................................................................. 11 Shejping...................................................................................................................................................... 11 Targeting .................................................................................................................................................... 12 Bestraffning................................................................................................................................................ 12 Inlärda obehagliga signaler ...................................................................................................................... 12 Utsläckning ................................................................................................................................................ 12 Skrockfullt beteende.................................................................................................................................. 13 Diskussion ...................................................................................................................................................... 13 Tack ................................................................................................................................................................ 14 Referenser ...................................................................................................................................................... 15 3 Sammanfattning En litteraturstudie inom området för operant betingning vid hästträning har genomförts. Vid operant betingning lär man djuret att svara på signaler genom att använda sig av förstärkningar eller bestraffningar. Den operanta betingningen används ofta inom hästträningen då antingen negativ eller positiv förstärkning tillämpas. Framförallt är det den negativa förstärkningen som används, mycket av kommunikationen vid uppsutten träning bygger på denna metod. Grunden för förstärkningsträning är att det beteende som leder till en förstärkning ökar i frekvens. Vid den negativa förstärkningen är det önskan att undvika tryck eller obehag som är förstärkande. Genom att hästen förändrar sitt beteende kan den få obehaget att försvinna, det gör att chansen för att beteendet skall återkomma i framtiden ökar. När positiv förstärkning används får djuret en belöning när rätt beteende utförs. Belöningen måste vara någonting djuret uppskattar och även med denna metod ökar sannolikheten att djuret utför detta beteende igen. Det finns studier som visar att användandet av positiv förstärkning ökar motivationen hos hästen. Även andra beteenden kan förbättras trots att de inte ingår i själva träningen, exempelvis ökar utforskande beteenden och motivationen till att träna. Det kan vara nödvändigt att etablera en sekundär förstärkare när man använder sig av positiv försträkning vid hästträning, annars kan det vara svårt att lyckas förstärka rätt beteende. Det är viktigt att den sekundära förstärkaren är ett distinkt stimuli som är likadant varje gång, exempelvis en klicker. Den sekundära förstärkaren måste associeras med en primär förstärkare, exempelvis mat, lek eller frihet. Användandet av sekundära och primära förstärkare är vad klickerträningen bygger på. Det finns resultat som tyder på att användandet av en sekundär förstärkare kan accelerera inlärningen och att beteenden blir svårare att släcka ut. Abstract A literature review of operant conditioning in horse training has been conducted. In the use of operant conditioning the trainer teach the animal to respond to signals by using reinforcement or punishment. The operant conditioning is often used in horse training; either negative or positive reinforcement is then employed. The negative reinforcement is mainly used; most of the communication in mounted horse training is based on negative reinforcement. The foundation of reinforcement training is that a behaviour which results in a reinforcement is increased in frequency. When using negative reinforcement the desire is to avoid pressure and discomfort reinforcing. By changing the behaviour the horse can make the discomfort disappear, this enhances the behaviour to occur in the future. When using positive reinforcement the animal receive a reward if the correct behaviour is performed. The reward has to be something the animal appreciates, this reinforcement also increase the likelihood for the behaviour to be conducted in the future. There are studies displaying that the use of positive reinforcement increases the horse’s motivation. There are other behaviours that could improve in spite that they are not part of the training, for example the motivation for training and exploring behaviour increase. It can be necessary to establish a secondary reinforcement when using positive reinforcement, the reason is that it otherwise can be difficult to reinforce the right behaviour. The risk of a delayed reinforcement otherwise is substantial. It is important that the secondary reinforcement is associated with a primary reinforcement, for example food, freedom or play. Clicker training is based on the utilization of secondary and primary reinforcements. Results indicate that learning can be accelerated if a secondary reinforcement is used and that it increases the behaviours resistance to extinction. 4 Inledning Operant betingning inom hästträningen är ett område som är viktigt och som jag tror fler som tränar och umgås med hästar behöver uppmärksammas på. Speciellt anser jag att den positiva förstärkningen behöver förklaras och att folk får upp ögonen för att det finns fördelar med att använda denna metod. Men även att användningen av aversiva stimulin, som används vid negativ förstärkning och positiv bestraffning, har vissa nackdelar. Det finns en del problemområden inom detta ämne. Dels verkar gemene man inte veta vad operant betingning är och inte heller att de flesta använder det dagligen i träningen av hästar. Ett annat problem som jag anser är ganska stort är att forskningsresultaten har svårt att nå ut till den ”vanliga” hästägaren. Inlärning kan beskrivas som en förändring i djurets beteende som ett resultat av vissa upplevelser eller erfarenheter (Wolff & Hausberger, 1995) och den kan vara en passiv eller aktiv händelse (Murphy & Arkins, 2006). Vid inlärningen förvärvar djuret kunskap som den senare kan använda för att anpassa sitt beteende vid förändringar i omgivningen (McGreevy, 2006). Troligen är det så att ju mer hästens hjärna stimuleras genom att använda minnet, desto fortare kan den lära av nya erfarenheter. Det är dessutom sannolikt att det optimala sättet att hålla hästens hjärna aktiverad och mottaglig för inlärning är att erbjuda variation i hästens miljö och olika aktiviteter (Hanggi, 1999). Resultat från en studie gjord av Rivera et al. (2002) visar att hästar som hölls ute på bete tillsammans med andra hästar i små grupper hade lättare att klara av vissa uppgifter än hästar som hölls enskilt i stall. Dessutom krävde de hästar som stod på stall längre tid för tillvänjning när de skulle få täcke på sig för första gången än de hästar som gick på bete. Enligt Nicol (2002) beror inlärningsförmågan delvis på hästens sinnestillstånd. Lugna hästar som lär sig fortare gör det troligtvis eftersom det är mindre som stör dem i deras inlärningsprocess. Därför är rätt och lugn hantering av största vikt vid träning av hästar för att ge dem så bra förutsättningar som möjligt att kunna förstå och lära sig vad tränaren menar. Hästar som har störst förmåga att lära och förstå våra uttryck är troligtvis de som är bäst lämpade att användas av människan (Nicol, 2002). Resultat av en studie gjord av Rubin et al. (1980) indikerar att koncentrerad träning i allt för långa träningssessioner kan leda till försämrad inlärning. Syfte Syftet med denna rapport är att sammanställa vad tidigare forskning har kommit fram till gällande träning av hästar med operant betingning. Syftet med texten är att väcka intresse för positiv förstärkning och minska användningen av negativ förstärkning och bestraffning inom hästträning. Min önskan är att denna text enkelt ska kunna skrivas om så att den passar att sprida till ridskoleelever och intresserade hästägare. Material och metod En litteraturstudie och en sammanställning av 26 vetenskapliga artiklar och facklitteratur har gjorts inom området operant betingning och träning av hästar med positiv förstärkning. Huvuddelen av referenserna är hämtade från vetenskapligt granskad litteratur, medan resterande information är hämtad från facklitteratur. För att hitta relevant information har databaserna Agricola och Web of Knowledge används. 5 Operant betingning Operant betingning är en gren inom psykologin och bygger till stor del på Harvardprofessorn B.F. Skinners upptäckter och har många olika namn såsom beteendemodifiering, förstärkningsteori, behaviorism, behavioristisk psykologi, beteendeanalys (Pryor, 2003) eller instrumentell betingning (McGreevy, 2006). När man använder operant betingning inom träning lär man djuret att svara på signaler genom att använda sig av förstärkningar eller bestraffningar (McLean, 2003; Skinner, 1938). Aktiviteten som utförs av djuret vid användandet av den operanta betingningen leder antingen till att den får en belöning (positiv förstärkning) eller att något obehagligt försvinner (negativ förstärkning) (McGreevy, 2004; Ninomiya et al., 2007). Eller också används positiv bestraffning, där något obehagligt händer när djuret visar ett visst beteende eller negativ bestraffning där något djuret vill ha försvinner vid visat beteende (McGreevy, 2004). Vid träning av hästar används ofta positiv eller negativ förstärkning för att få djuret att utföra rätt beteende (Ninomiya, et al., 2007). Förstärkare Enligt McGreevy (2004) är en förstärkare något som gör att beteendet återkommer i framtiden. För att förstärkaren ska vara effektiv får den inte komma för sent, en försening med någon sekund förstör mycket av effekten (Skinner, 1951). Tilltar inte beteendet presenteras antingen förstärkaren för tidigt eller för sent, alternativt är den valda belöningen inte förstärkande för den individen (Pryor, 2003). Genom att använda sig av en förstärkare får man en möjlighet att kontrollera djurets beteende och kan på så sätt förändra beteendet till en önskad respons (Skinner, 1951). Vid användning av förstärkningsträning krävs det att djuret visar beteendet för att man ska kunna förstärka det (Pryor, 2003). Både positiv och negativ förstärkning stärker sambandet mellan stimuli och en önskad respons, vilket gör att utsikten att denna respons ska visas nästa gång förbättras (Tarpy, 1975). Positiv förstärkning En positiv förstärkare är något som individen uppskattar (Tarpy, 1975) och som presenteras när djuret har utfört ett önskat beteende (Skinner, 1953). Genom att använda positiv förstärkning kan spontana beteenden förstärkas även om de endast förekommer sporadiskt (Pryor, 2003). Enligt en studie gjord av Innes & McBride (2007) var hästar som tränades med positiv förstärkning mer motiverade att delta i träning. I studien kom man fram till att de hästarna var mer utforskande och genomförde fler ”trial and error” - försök i främmande situationer och miljöer. De hade även högre hjärtfrekvens än de som tränades med negativ förstärkning. Det framkom att hästar som fick den positiva behandlingen var extremt motiverade att få tillgång till träningsmiljön vid de senare stadierna av träningen, vilket tyder på en positiv istället för en negativ stress. I samma studie gjord av Innes & McBride (2007) tyder resultaten på att den negativa förstärkningen inte är en metod som kompromissar med hästens välfärd, men den positiva 6 förstärkningen skänker djuret fördelar. Byte från träning baserad på aversivt stimuli till positiv förstärkning har tydliga och direkta fördelar för hästen. Det är även möjligt att förändringen påverkar den sociala kontakten genom minskat bråk med andra individer (Ferguson & Rosales-Ruiz, 2001). I Australien genomförde Warren-Smith & McGreevy (2008) en studie där man undersökte om hästtränare hade en korrekt förståelse av skillnaden mellan positiv och negativ förstärkning. Av 206 svar var det 79,5 % av tränarna som ansåg att positiv förstärkning var ”väldigt användbart”, men trots detta så var det endast 2,8 % som korrekt förklarade hur det skall tillämpas. Haverbeke et al. (2008) genomförde en studie där belgiska hundtränare inom militären och deras hundar observerades. Man jämförde förekomsten och konsekvensen av framförallt positiv bestraffning respektive positiv förstärkning. De mest frekvent använda positiva bestraffningarna var att tränaren ryckte i kopplet eller lyfte upp hunden i halsbandet. Samtidigt som strykningar och klappar användes som positiv förstärkning i stor utsträckning. Hundar som utsattes för positiv bestraffning under testet hade en lägre hållning och blev mer distraherade vilket resulterade i sämre prestation. Vid låg prestation föreslås av författarna att bland annat mer positiv förstärkning användas vilket förbättrar relationen mellan tränare och hund. Ferguson & Rosales-Ruiz (2001) genomförde en studie där de lastade hästar med hjälp av positiv förstärkning. Dessa hästar hade tidigare erfarenhet av aversivt stimuli vid lastning, såsom spön och rep. Hos dessa hästar förekom det förändringar i beteendet som inte mättes men som observerades av ägarna. Två av hästarna som tidigare varit svåra att fånga i hagen och sätta grimman på, kom efter att lastträningen påbörjats fram till grinden och undvek inte längre grimman trots att detta inte fokuserades på vid lastträningen. Det blev en sekundär effekt av träningen med positiv förstärkning. Negativ förstärkning Vid användning av negativ förstärkning tas något aversivt (exempelvis tryck) bort när önskad respons visas av djuret (Skinner, 1953). Djuret arbetar för att undvika detta obehag och det får det att på så sätt öka frekvensen av beteendet (McGreevy, 2004). Både lätta och mycket extrema obehag kan vara negativa förstärkare, de kan avbrytas eller undvikas genom att djuret ändrar sitt beteende, obehagen upphör direkt när det nya beteendet påbörjas vilket gör att responsen stärks (Pryor, 2003). Resultat från en studie gjord av Innes & McBride (2007) tyder på att hästarna som tränades med negativ förstärkning förblev mer reaktiva än de som tränades med positiv förstärkning. Trots frånvaron av signifikanta resultat verkade dessa hästar tillbringa mer tid att skrapa med framhovarna under försöksperioden än de som tränades med positiv förstärkning. Vilket kan tyda på att de var mer frustrerade. Det kan tolkas som att den negativa förstärkningsträningen påverkade hästarnas upplevelser av miljön. Mycket av den traditionella hästträningen bygger på negativ förstärkning, hästen lär sig att svänga vänster när tygeln på den sidan stramas åt därför att obehaget släpper direkt när den går åt det hållet (McGreevy, 2006). Det är oftast nödvändigt att använda sig av negativ förstärkning vid ridning, detta för att kommunicera med hästen, tryck med skänkeln eller kramande om tygeln talar om för hästen vad den skall utföra för beteende (Kurland, 1999). Det kan vara effektivt att använda negativ förstärkare när man tränar ett djur och det kan 7 vara en trevlig upplevelse för djuret även om aversivt stimuli (ett obehagligt stimuli som djuret vill undvika) är inblandat (Pryor, 2003). Duktiga tränare som använder sig av negativ förstärkning är noga med att inte använda för intensivt stimuli så att hästen blir ohanterlig. Om hästen får panik och den negativa förstärkningen måste avbrytas innan rätt respons har uppnåtts, kan detta göra att hästen snabbt lär sig hur den ska undvika den negativ förstärkning (McCall, 1990). Trots att negativ förstärkning används i stor utsträckning inom hästträningen så bygger många inlärnings-tester på användning av primär positiv förstärkning. Detta gör att forskningen ibland är svår att tillämpa vid traditionell träning av hästar (McCall, 1990). Primär förstärkare En primär förstärkare är en resurs som djuret är angeläget om att få och som det är villigt att arbeta för såsom mat, vatten, sex, lek, frihet eller sällskap (McGreevy, 2004). Denna förstärkare reducerar fysiologiska behov (exempelvis hunger, törst eller undkommande av aversivt stimuli) och det är en generell resurs som djuret har ett nedärvt behov av och är inget den behöver lära sig att uppskatta (McCall & Burgin, 2002). Använder man mat som primär förstärkare bör man inte välja något som ingår i den dagliga utfodringen. Det är heller inte bra att använda något okänt som belöning då vissa hästar lider av neofobi, vilket betyder att de har en inbyggd rädsla för sådant som är nytt och främmande (McGreevy, 2004). I en studie gjord av Ninomiya et al. (2007) undersöktes effekten av två olika typer av foder (hö och pellets) vid operant betingning av tolv hästar. Resultaten från studien tyder på att tiden det tog att träna hästen inte påverkades av smakligheten på belöningen. Dock påverkade smakligheten hästarnas motivation för att utföra en operant respons. Motivationen ökade vid användning av det smakligare kraftfodret jämfört med det hö som var mindre uppskattat. Om byte från ett smakligt foder till ett mindre smakligt gjordes blev hästarna frustrerade, antalet operanta responser minskade och utsläckning (vilket betyder att hästarna slutar att utföra ett beteende) inträffade hos vissa individer. Resultaten från studien tyder på att det är viktigt att tänka på smakligheten på belöningen i början av den operanta betingningen för hästar, då en senare ändring av belöning kan påverka responsgraden. Sekundär förstärkare Om man arbetar med positiv förstärkning kan det vara nödvändigt att befästa en sekundär förstärkare, detta för att det ibland är svårt att leverera belöningen tillräckligt fort när djuret visar ett önskat beteende (Pryor, 2003). En sekundär förstärkare kallas ofta för betingad eller inlärd och den reducerar inte fysiologiska behov (McCall & Burgin, 2002). Till en början är den inte förstärkande för djuret utan måste associeras med en primär förstärkare (McGreevy, 2004). Som sekundär förstärkare behövs en omedelbar och klar signal, det kan vara ett ljud eller en ljussignal (Skinner, 1951). Signalen presenteras före eller i samband med den primära förstärkaren (Pryor, 2003). En fördel med att använda en sekundär förstärkare är att man kan förmedla exakt vad det är man vill att djuret ska lära sig (Pryor, 2003). I en studie gjord av McCall & Burgin (2002) verkade den sekundära förstärkaren i form av en ringklocka accelerera inlärningen jämfört med de hästar som inte erhöll någon sekundär förstärkare, dock var det inte någon 8 signifikant skillnad. I en studie gjord av Langbein et al. (2007) undersöktes användandet av en sekundär förstärkare vid inlärning hos dvärg-getter (Capra hircus). Resultat från studien tyder på att getterna uppnådde inlärningskriteriet tidigare och att det krävdes färre försök vid användandet av en sekundär förstärkare jämfört med kontrollgruppen som endast fick den primära förstärkningen. Effektiviteten hos den sekundära förstärkaren påverkas av hur attraktiv den associerade primära förstärkaren är för djuret (McCall & Burgin, 2002). För att förbättra effektiviteten kan man förknippa den sekundära förstärkaren med flera olika belöningar (Pryor, 2003). McCall & Burgin (2002) skriver i sin artikel att den sekundära förstärkaren är effektiv vid träning, men att hästarna i deras studie raskt förlorade intresset för uppgiften om de inte fick någon primär förstärkare. Resultatet av studien tyder på att sekundär förstärkare är användbar vid träning av hästar, men då krävs att den kopplas ihop med en primär förstärkare för att fungera. Det är viktigt att djuret alltid får en primär förstärkare efter att den sekundära förstärkaren har använts, annars avtar effekten (Skinner, 1951). Ibland används verbala fraser och klappar på halsen vid uppsutten träning av hästar, men de är ofta ovarsamt kopplade till en primär förstärkare (McCall & Burgin, 2002). Det är viktigt att en association uppstår mellan sekundär och primär förstärkare om det ska bli en förstärkande effekt (Williams et al., 2004). McCall & Burgin (2002) skriver att vid träning av hästar där sekundär förstärkare används ges den ofta direkt innan den primära förstärkaren, vilket gör att det är oklart om hästen svarar på en kort kedjeprocess eller erhållandet av den primära förstärkaren. I en studie gjord av Williams et al. (2004) verkade alla hästarna etablera en koppling mellan den sekundära och den primära förstärkaren. Direkt efter att de hört den sekundära förstärkaren iakttog de eller placerade mulen i den skål där de lärt sig att den primära förstärkaren erbjöds. Många av hästarna blev frustrerade när de hörde klicket men inte erhöll någon primär förstärkare under utsläckningsfasen av behandlingen (Williams et al., 2004). För att den sekundära förstärkaren skall fungera måste man vara noggrann med att inte utan innebörd använda den i tid och otid (Pryor, 2003). Genom att presentera den sekundära förstärkaren när djuret är bortvänt kan man ta reda på om den sekundära förstärkaren är befäst, vilket man kan se om djuret vänder sig mot ljudet och tittar efter den primära förstärkaren när signalen presenteras (Skinner, 1951). 9 Klickerträning På 1960-talet började Keller Breland, som var forskarstudent hos B.F. Skinner, att använda en visselpipa som en inlärd förstärkare vid träning av marina däggdjur. Breland kallade pipan för ”överbryggande stimulus” eftersom den skapade en brygga mellan det beteende som var rätt utfört och tiden innan djuret fick sin belöning (Pryor, 2003). Allmänheten började använda operant inlärning, shejping, positiv förstärkning och inlärda förstärkare på 1990-talet, med hundägare i spetsen. Då introducerades en plastdosa med en metallfjäder (klicker), denna användes som en sekundär förstärkare och träningsmetoden kallades för klickerträning (Pryor, 2003). På det sätt klickertränare använder klicket har den förutom som inlärd förstärkare och överbryggande stimuli, flera outforskade funktioner. Den kanske största funktionen är vad som ibland kallas händelsemarkör, då den visar djuret exakt vilket beteende som förstärks. En annan viktig funktion är att klickerträning överlämnar kontrollen till djuret. Den tredje funktionen, så som klickertränaren använder den inlärda förstärkaren, är att den blir en slutsignal och meddelar djuret att jobbet är klart (Pryor, 2003). Det kan vara bra att lära in en signal som talar om för djuret att fortsätta med det den gör och att den är på rätt väg. Denna signal behöver inte kopplas till en primär förstärkare utan det räcker att man ger den någonstans innan det avslutande klicket. Detta gör att djuret snabbt lär sig att denna signal leder till en kommande förstärkning. En visselpipa, ett ord eller handtecken kan användas som signal. Det är viktigt att signalen inte bara är en uppmuntran eller hejarop utan en väl befäst och noggrant använd inlärd förstärkare (Pryor, 2003). Enligt en studie gjord på domesticerade hundar tar det längre tid innan ett beteende släcks ut om klickerträning används. Jämfört med situationer där endast primär förstärkare används som belöning (Shawn et al,. 2008). Timing av förstärkare Det är väldigt viktigt att förstärkaren inte kommer för sent eller för tidigt, timingen är viktig för att träningen skall bli effektiv (Pryor, 2003). Vidare skriver Pryor (2003) att för nybörjare som använder förstärkare är fördröjning det största problemet. Uppstår det problem i träningssituationen bör en av de första saker man ser över vara att förstärkaren inte kommer för sent (Pryor, 2003). Även vid träning med negativ förstärkning är timingen viktig. Om man lär hästen att svänga när den ena tygeln stramas åt är det viktigt att eftergiften kommer direkt när hästen svänger. Förstärkning sker när obehaget upphör (Pryor, 2003). Förstärkarens storlek – jackpott I regel bör en förstärkare motsvara en munsbit, detta gör att intresset hålls uppe. Använder man något som djuret uppskattar särskilt mycket kan man ge lite mindre bitar. Hur svår uppgiften som djuret skall utföra påverkar hur stor förstärkaren bör vara, ju svårare uppgift desto större belöning (Pryor, 2003). Om man använder en liten förstärkare som inte tar så lång tid för djuret att äta upp så minskas väntetiden och gör även att djuret inte blir mätt så fort (Pryor, 2003). 10 En användbar teknik kan vara att använda en jackpott, det är en belöning som är mycket större än den normala förstärkaren och som kommer som en överraskning. Vid ett plötsligt genombrott kan det vara bra att utdela en jackpott (Pryor, 2003). Pryor (2003) nämner en hästtränare som snabbt sitter av, tar av sadel och träns och släpper lös hästen första gången den lyckats med ett svårt moment. Detta gör ofta att det nya beteendet lättare blir befäst, eftersom belöningen, absolut frihet, uppskattas av hästen. Förstärkningsschema - Oregelbundet förstärkningsschema Många tror att man för alltid måste ha klicker och godis till hands när man använder sig av klickerträning för att beteendet inte skall försvinna. Men om man belönar varje gång ett djur utför ett befäst beteende skulle det efter ett tag bli så nonchalant som det bara är möjligt, men ändå resultera i en belöning (Pryor, 2003). Slutar man sedan att belöna djuret skulle det upphöra att utföra beteendet. Tillämpas istället oregelbundet förstärkningsschema och belöning med olika intervall blir beteendet mycket starkare befäst. Djuret arbetar hårdare för att få tillgång till förstärkningen (Tarpy, 1975) och man kan på så sätt välja att bara belöna de bäst utförda beteendena (Pryor, 2003). Ju längre det oregelbundna schemat varar desto effektivare blir beteendet befäst. Är målet att släcka ut ett beteende så kan ett oregelbundet schema istället ha motsatt effekt. Får djuret ingen förstärkning för ett beteende så släcks det ut av sig självt, men om det förstärks om än endast sporadiskt kan det faktiskt göra att beteendet blir mer frekvent (Pryor, 2003). Går ett beteende ut på att lösa ett slags problem eller att djuret skall välja mellan två saker bör inte oregelbunden förstärkning tillämpas. I dessa situationer är det viktigt att tala om för djuret när det gör rätt så att det blir säker på vilket beteende som skall utföras nästa gång (Pryor, 2003). Shejping Ett annat ord för shejping är successiv approximation. Shejping innebär att man i mycket små steg förändrar ett beteende mot ett uppsatt mål genom att man fångar upp små tendenser i rätt riktning (Pryor, 2003). Det som gör att shejping är möjligt är att alla levande individers beteende går att förändra. Genom att sätta upp delmål kan man få djuret att utföra ett beteende oavsett hur förfinat och svårt det är (Pryor, 2003). Framgång eller misslyckande med shejping påverkas inte av hur duktig tränaren är på att shejpa utan beror på uthållighet (Pryor, 2003). I den tidigare beskrivna studien av Ferguson & Rosales-Ruiz (2001) där shejping användes för att lasta hästarna visade resultaten att fyra av fem hästar följde ett liknande shejpingprogram. Deras framsteg följdes åt och det tog ungefär lika lång tid att fullborda lastträningen, detta oberoende av vilket beteende de visade i den inledande träningen. Vilket kan visa att trots att det är fem olika individer, med olika bakgrund av lastning, så går de flesta individer att träna. 11 Targeting Vid targeting shejpar man djuret att nudda en target med exempelvis nosen, en target kan vara vad som helst, exempelvis en käpp eller tränarens slutna hand. Genom att sedan flytta runt denna target kan man få djuret att utföra en mängd olika beteenden, som att klättra i trappor, hoppa, stegra sig eller följa efter tränaren (Pryor, 2003). Alla hästar som ingick i studien gjord av Ferguson & Rosales-Ruiz (2001) lärde sig att nudda en target vid första sessionen. Targeting är mångsidig och kan användas i många situationer för att få en häst att utföra ett beteende utan att man behöver röra eller göra hästen avståndstagande. En target används heller inte som medel för att straffa ett djur vilket gör att den inte associeras med något obehagligt (Ferguson & Rosales-Ruiz, 2001). Vid lastträningen av de fem hästar som ingick i studien av Ferguson & Rosales-Ruiz (2001) var targeting och shejping effektivt som träningsmetod, utan användning av bestraffning eller negativ förstärkning. Dessa hästar generaliserade även lastningen till andra transporter och tränare, inkluderat ägaren. Bestraffning Bestraffning och negativ förstärkare är inte samma sak, en bestraffning avbryter ett beteende och till skillnad från förstärkning minskar sannolikheten att beteendet skall återkomma i framtiden (Pryor, 2003). Dock används aversivt stimuli både vid bestraffning och vid negativ förstärkning. Vid bestraffning presenteras det aversiva stimulit efter att hästen utfört ett oönskat beteende, till skillnad från negativ förstärkning där det aversiva stimulit presenteras innan hästen utför en begärd respons och tas bort direkt när hästen svarar (McCall, 1990). Egtvedt & Køste (2005) skriver att stor användning av aversiv träning kan medföra att djuret blir passivt och kan göra att den blir rädd för att göra fel. Det finns två typer av bestraffning, det som skiljer är vad som händer när djuret utför ett oönskat beteende. Vid den positiva bestraffningen tillförs ett obehagligt stimuli, exempelvis ett spöslag, och vid den negativa tas något önskvärt bort (Kurland, 1999). Båda fallen resulterar i att ett pågående beteende bryts men det går inte att förutsäga vad det istället leder till för beteende (Pryor, 2003). Använder man positiv förstärkning i träningen av ett djur kan man för att få ett oönskat beteende att upphöra, använda sig av negativ bestraffning. Detta gör man genom att helt enkelt lämna djuret när det visar ett opassande beteende, man tar då bort något den vill ha tillgång till, chansen till belöning. Detta är mer effektivt än att korrigera ett beteende med positiv bestraffning (Kurland, 1999). Inlärda obehagliga signaler Används positiv förstärkning för att träna djur betyder inte det att man inte kan tillrättavisa djuret. Genom att befästa ett ord som en inlärd negativ förstärkare kan man göra tillrättavisningarna effektiva. Inlärda obehagliga stimuli är effektivare än hotelser (Pryor, 2003). Utsläckning Beteenden som ignoreras minskar i frekvens och kommer till slut att släckas ut (Tarpy, 1975). Utsläckning (djuret slutar att utföra ett beteende) sker även om ett tidigare inlärt beteende inte längre resulterar i en belöning (McGreevy, 2004). 12 Vid inlärning av ett nytt moment gör hästen ofta många felaktiga försök innan rätt beteende utförs. Ifall dessa inkorrekta försök ignoreras av tränaren och endast rätt beteende blir förstärkt, kommer de oönskade beteendena att minska och de önskvärda istället att öka i frekvens (McCall, 1990). I en studie gjord av McCall & Burgin (2002) blev hästarna frustrerade under utsläckningsfasen. I studien skulle hästarna trycka på en spak för att få belöning och vid utebliven förstärkning tog hästarna tag i spaken med tänderna och drog den åt sidan eller lutade sig mot den med stor kraft. Agerandet visar att hästarna associerade händelsen att trycka på spaken med erhållandet av den primära förstärkaren. Efter utsläckningen var det enkelt att åter träna hästarna att trycka på spaken om belöning återigen gavs. Detta visar att spontan återhämtning av en inlärd respons sker och att utsläckning inte eliminerar det inlärda beteendet, utan undertrycker det och gör att ett annat beteende utförs istället (McCall & Burgin, 2002). Skrockfullt beteende Skrockfullt beteende innebär att djuret utför ett beteende som inte har något med resultatet att göra, men individen fortsätter att upprepa det som om det var nödvändigt för att få förstärkning, detta fenomen inträffar ofta vid träning av djur (Pryor, 2003). Djuret kan bli beroende av betingelser som har förstärkts många gånger utan att tränaren varit medveten om detta. När man sedan ber djuret att utföra beteendet under andra förhållanden, kan beteendet helt oväntat bryta samman. För att undvika att detta inträffar är det viktigt att variera miljön så snart djuret har lärt sig det nya beteendet. Det är även viktigt att inte tillfälliga mönster för timing utvecklas, både djur och människor har en väl utvecklad känsla för tidsintervall (Pryor, 2003). Diskussion Troligen är det inte många som tränar hästar som vet vad operant betingning är eller att de flesta använder sig av det dagligen i umgänget med hästar. Den negativa förstärkningen är den del av den operanta betingningen som är vanligast förekommande. Den används exempelvis inom ridningen där hästen lär sig att svara på ryttarens hjälper och belönas med eftergift när den utför rätt beteende. Inte många använder sig av den positiva förstärkningen, trots att det finns fördelar med denna träningsmetod. Det finns resultat från studier som tyder på att hästens motivation till träning ökar vid användandet av positiv förstärkning. Till skillnad från resultat där negativ förstärkning användes där hästarna förblev mer reaktiva, verkade mer obekväma av träningen och verkade frustrerade. Många gånger kanske det är traditionen som styr vilken metod som används inom träningen av hästar, man har inte så stor erfarenhet av att använda sig av positiv förstärkning. Förhoppningsvis är detta något som kommer att förändras med tiden, då för stor användning av aversiva stimuli kan göra hästen passiv och rädd för att göra fel. Det är svårt att se hur kommunikationen vid ridning skulle utformas för att helt utesluta den negativa förstärkningen, men denna form av träning kan vara en trevlig process för djuret om den tillämpas på ett bra sätt. Exempelvis kan man använda positiv förstärkning under inlärningen av de kommandon hästen behöver kunna vid uppsutten träning, då blir träningen mer effektiv. Vilken metod man än väljer är det väldigt viktigt att timingen för förstärkaren är exakt. En fördröjning på endast en sekund gör att effektiviteten minskar. 13 Positiv bestraffning vid träning av hästar verkar inte ha några fördelar utan resulterar i att djuret blir rädd för att göra fel. Det kan göra att hästen blir passiv och hälsan påverkas negativt på grund av den emotionella stressen den utsätts för. Genom att använda bestraffning kan man heller inte förutse vad reaktionen kommer att bli och hur beteendet kommer att förändras. Däremot kan negativ bestraffning användas om man tränar med positiv förstärkning detta genom att man tar en timeout om djuret uppför sig illa. Hästen kommer att uppfatta detta bestraffande på grund av att den som regel uppskattar träningen med positiv förstärkning. På detta sätt kan man korrigera en häst som exempelvis biter och blir för närgången vid belöning med godis. Om man är konsekvent och endast ger godiset när hästen är lugn och inte tigger så kommer detta beteende med tiden att försvinna, genom att hästen märker att den inte får belöning om den tigger. Som alltid är konsekvens viktigt vid träningen av djur. Ordet positiv i sammanhanget positiv förstärkning och positiv bestraffning säger ingenting om hur djuret upplever det, utan endast att det tillförs något när ett beteende visas. Till skillnad från negativ förstärkning och negativ bestraffning där något tas bort vid ett visst beteende. Detta är viktigt att komma ihåg. Ibland används verbala fraser och klappar på halsen vid uppsutten träning av hästar, men de är ofta ovarsamt kopplade till en primär förstärkare. Det är antagligen vanligt förekommande, många tror säkert att hästen uppfattar en klapp på halsen som förstärkande och förstår att den har gjort något bra. Definitionen på en primär förstärkare är att den reducerar ett fysiologiskt behov som hästen har, vilket behov skulle denna klapp reducera? Hästen uppskattar troligen hellre att man kliar den eller ger den frihet. Belöningen kan vara frihet från tryck eller en stunds avkoppling och ledighet. Berömmande ord kan vara förstärkande, men troligen är det mer röstläget än själva orden som är förstärkande. För att hästen ska uppfatta enstaka ord som förstärkande krävs att de associeras med en primär förstärkare. Min slutsats är att användning av positiv förstärkning vid inlärning av ett nytt beteende hos hästen har flera fördelar. Hästen verkar uppfatta träningen som mer positiv och blir mer motiverad till träningen. Tack Jag vill tacka min handledare Birgitta Larsson för hennes synpunkter på text och innehåll, vilket har gjort att arbetet flutit på bra och blivit till en bra sammanställning. Hon har hjälpt mig att se framtidsmöjligheterna med mitt arbete och hon har uppmuntrat mig i mina funderingar att använda kunskapen till att någon gång i framtiden skriva en bok som kan inspirera andra människor. Ett jätte stort tack förtjänar min sambo Johan för att han har stått ut tiden jag suttit med examensarbetet. Tack även för stöttningen under min utbildningstid, utan honom hade det inte gått! Jag vill även tacka Karolina Westlund för den föreläsning om klickerträning hon höll under Etologikursen våren 2008 som var väldigt inspirerande. Tack även för svaren på mina mail där jag fick bra tips om litteratur inom området. Tack till Josefina Zidar som varit ett jättebra bollplank och för hennes uppmuntran när det känts som tiden inte räckt till och berget av jobb kändes oöverstigligt. Även min mamma Karin Hulthén och min gudmor Marianne Iwarson förtjänare ett tack för bra synpunkter på texten. 14 Men störst tack får ändå mina djur som har ställt upp på att klickertränas vilket har varit väldigt bra för att kunna förstå principerna för positiv förstärkningsträning. Det är roligt att se de framsteg som de gör och att se hela deras inställning till träning förändras. Det är enormt inspirerande och genom dem lär jag mig något nytt varje dag. De har även gjort att jag har fått en önskan om att förändra livet för andra djur genom att öppna ögonen för positiv förstärkning. Referenser Egtvedt, M. & Køste, C. 2005. Klickerträning för din hund. Storlien, Nordiska hundförlaget AB. Ferguson, D.L. & Rosales-Ruiz, J. 2001. Loading the problem loader: the effects of target training and shaping on trailer-loading behavior of horses. Journal of Applied Behavior Analysis. 34, 409-424. Hanggi, E.B. 1999. Categorization learning in horses (Equus caballus). Journal of Comparative Psychology. 113, 243-252. Haverbeke, A. Laporte, B. Depiereux, E. Giffroy, J.-M. & Diederich, C. 2008. Training methods of military dog handlers and their effects on the team’s performances. Applied Animal Behaviour Science. 113, 110-122. Innes, L. & McBride, S. 2008. Negative versus positive reinforcement: An evaluation of training strategies for rehabilitated horses. Applied Animal Behaviour Science. 112, 357-368. Kurland, A. 1999. Clicker traning instruction kit for horses. Vintrosa, Hundens förlag. Langbein, J. Siebert, K. Nuernberg, G. & Manteuffel, G. 2007. The impact of acoustical secondary reinforcement during shape discrimination learning of dwarf goats (Capra Hircus). Applied Animal Behaviour Science. 103, 35-44. McCall, C.A. 1990. A rewiew of learning behavior in horses and its application in horse training. Journal of Animal Science. 68, 75-81. McCall, C.A. & Burgin, S.E. 2002. Equine utilization of secondary reinforcement during response extinction and acquisition. Applied Animal Behaviour Science. 78, 253-262. McGreevy, P. 2006. The advent of equitation science. The Veterinary Journal. 174, 492500. McGreevy, P. 2004. Equine Behavior – a guide for veterinarians and equine scientists. Saunders, Elsevier Limited. McLean, A. 2003. The truth about horses. Penguin Books, Australia. Murphy, J. & Arkins, S. 2006. Equine learning behaviour. Behavioural Processes. 76, 113. 15 Nicol, C.J. 2002. Equine learning: progress and suggestions for future research. Applied Animal Behaviour Science. 78, 193-208. Ninomiya, S. Mitsumasu, T. Aoyama, M & Kusunose, R. 2007. A note on the effect of a palatable food reward on operant conditioning in horses. Applied Animal Behaviour Science. 108, 342-347. Pryor, K. 2003. Skjut inte hunden – en bok om operant inlärning i vardagen. Vintrosa, Hundens förlag. Rivera, E. Benjamin, S. Nielsen, B. Zanella, A.J. & Shelle, J. 2002. Behavioral and physiological responses of horses to initial training: the comparison between pastures versus stalled horses. Applied Animal Behaviour Science. 78, 235-252. Rubin, L. Oppegard, C. & Hintz, H.F. 1980. The effect of varying the temporal distribution of conditioning trials on equine learning behavior. Journal of Animal Science. 50, 1184. Shawn, M. Smith, E. & Davis, S. 2008. Clicker increases resistance to extinction but does not decrease training time of a simple operant task in domestic dogs (Canis familiaris). Applied Animal Behaviour Science. 110, 318-329. Skinner, B.F. 1938. The behavior of organisms. Appleton-Century, New York, USA. Skinner, B.F. 1951. How to teach animals. Scientific American. 185, 26-29. Skinner, B.F. 1953. Science and human behavior. Macmillan, New York, USA. Tarpy, R.M. 1975. Basic principles of learning. Scott, Foresman & Co., Glenview, IL. Warren-Smith, A. & McGreevy, P. 2008. Equestrian coaches' understanding and application of learning theory in horse training. Anthrozoos. 2, 153-162. Williams, J.L. Friend, T.H. Nevill, C.H. & Archer, G. 2004. The efficacy of a secondary reinforcer (clicker) during acquisition and extinction of an operant task in horses. Applied Animal Behaviour Science. 88, 331-341. Wolff, A. & Hausberger, M. 1996. Learning and memorisation of two different tasks in horses: the effects of age, sex and sire. Applied Animal Behaviour Science. 46, 137143. 16