Inlärning och belöning Positiv och negativ förstärkning De allra flesta har fått lära sig att hundar utför våra kommandon för att: - vi säger det - vi har ett bra ledarskap - hundarna älskar oss - osv. DETTA ÄR HELT FEL!! Hundar jobbar för att: 1. få något den vill ha (godis, boll, kel) 2. undvika något obehagligt (ryck i kopplet, smäll på nosen, tagen i nackskinnet) Våra kommandon talar bara om för hunden att om den utför ett visst beteende just nu så har den chans att: 1. få en belöning 2. undvika obehag Båda alternativen innebär att hunden vinner något på att utföra rätt beteende. Det är bara inlärningsmetoden, vägen till rätt beteende, som skiljer sig. Beteende Lisa trycker ner dörrhandtaget Hunden drar i kopplet Kalle går runt en vattenpöl Pelle låter bli att äta nötter Konsekvens (resultat) Dörren öppnas Hunden kommer fortare fram Kalle slipper bli blöt om fötterna Pelle slipper att få svårt att andas I varje exempel här ovanför ser vi att beteendet har ett resultat, eller konsekvens som det också heter. Antingen uppnår vi något vi vill ha eller så slipper vi något obehagligt. I alla situationerna bli beteende förstärkt. Det vill säga, att sannolikheten ökar för att beteendet ska upprepas nästa gång vi handlar i en liknande situation. I exemplet ovan ser vi två olika typer av förstärkning. Den första typen kallar vi positiv förstärkning. På vanlig svenska kallar vi detta för belöning. När ett beteende resulterar i något vi vill ha, är det troligt att vi kommer att utföra beteendet igen. Ex: Lisa får 500 kr varje gång hon får MVG på ett prov. De flesta som gått i skolan och fått en normal uppfostran har lärt sig att utföra en del beteenden för att undvika obehag. Det kallas för negativ förstärkning. Vi skulle lika gärna kunna kalla det för straff. Även beteende som gör att vi undviker något obehagligt resulterar i att vi upprepar beteendet. Ex: Per slipper få utegångsförbud om han gör sina läxor ordentligt. Lisa slipper få kvarsittning om hon inte pratar på lektionerna. Positiv förstärkning och klassisk betingning Ivan Pavlov (1849-1936) var en pionjär inom psykologin, kanske främst för den tidiga behaviorismen. Han gjorde experiment med hundar, som främst rörde salivbildningen i deras munnar när de serverades mat. 1904 tilldelades han Nobelpriset i medicin, bla. för denna upptäckt. Av en händelse upptäckte han att om han ringde en klocka innan de fick mat, så kom hundarna så småningom att börja utsöndra saliv vid ljudet av klockan oavsett om de fick mat eller ej. Vad som hände i experimentet, och som också utgör grunderna för klassisk betingning, är att en naturligt betingad stimulus (maten) ger upphov till en obetingad respons (saliv i hundarnas mun). Klockan som ringer strax innan maten utgör en betingad stimulus och följs i början alltid av mat. När detta skett några gånger lär sig organismen (hunden) att den betingade stimulusen alltid följs av maten och således på ett pålitligt sätt förutsäger händelsen. Responsen blir att hunden börjar producera saliv redan vid ljudet av klockan, och en betingad respons har uppstått. Istället för att bortse från denna oförutsedda händelse tog Pavlov till vara på det och lade om sina experiment i den riktningen. Han definierade genom dessa experiment ett begrepp som kallas Pavloviansk inlärning (eller, vilket är en vanligare benämning, klassisk betingning) där organismen lär sig vilka stimuli som föregår viktiga händelser, oavsett om dessa stimuli är naturligt kopplade till händelsen eller ej. Källa: Wikipedia Om vi hade vänt på Pavlovs experiment och gjort det till en övning i negativ förstärkning så hade vi till exempel utsatt hundarna för en elektrisk ström så fort de INTE åt sin mat. (slutade tugga) Båda metoderna är ett utmärkt sätt att få hundarna att äta, frågan är bara vilket som känns trevligast. Det är på detta experiment som klickerträning är byggd på, eller all belöning för den delen. Genom att lära hunden att rätt utförd uppgift följs av markering (klick/ ”bra”) och en belöning har vi ett tydligt och enkelt redskap att tala om för hunden vad som förväntas av den. Det skapar också en förväntan för hunden och en vilja att själv utföra uppgifter för att nå belöningen. Att använda klicker är det effektivaste sättet att ”shejpa” (forma) fram ett beteende. Belöning består av två moment och ingen av delarna fungerar var för sig. Delarna måsta alltid hänga ihop och det får dessutom inte gå för lång tid mellan markering och belöning. Markering klick/röst Belöning Förstärkning godis/leksak Men nu är det inte så enkelt att det bara är att klicka och belöna. Det första man måste göra är att klicka in hunden. Oavsett om du använder klicker eller inte så måste du lära hunden att klick/bra följs av en belöning. Det enda sättet att göra det är att öva. Hunden behöver inte utföra någon uppgift utan ska bara vara hos dig och får höra klick/bra och sedan få godis. Ca 50 repetitioner behövs för att hunden ska förknippa klicket med en delikat köttbulle. När hunden har förstått vad det går ut på kan man prova det på saker som hunden redan kan, tex. sitt. Det klickern talar om för hunden är att ”det här är rätt, godis är på väg”. Klicker kan man välja att använda till vissa moment eller genom hela träningen. Belöning måste man däremot använda hela tiden. Tänk dig själv om chefen slutade betala ut lön bara för du blivit skicklig i ditt arbete. Fördelar med klicker Ljudet av klickern är mycket tydligare än ord! Dels för att ord finns i många typer och att hunden först måste sortera in orden i rätt fack. Man kan säga att det finns fyra typer av ord och hunden måste snabbt bestämma sig för vad som hördes. Klickern är dessutom bättre än ord eftersom få människor kan dölja sina verkliga känslor bakom ett ord. Tonläget avslöjar för hunden vilket humör du är på och det är inte så lyckat om du egentligen är ganska missnöjd med din och hundens prestation. FY FIDO! (straff) BRA! (belöning) HIT! (signal) BLA BLA BLA (människobabbel) Vad är det hon menar???? Belöningens regler För enkelhetens skull kommer vi i fortsättningen av använda oss av ordet klicka men ni som inte använder klicker läser helt enkelt ordet ”bra”. För att belöningen ska bli effektiv och rätt så finns det fyra regler man måste följa. Kriterier – vad vill jag belöna? Frekvens – hur ofta ska jag belöna? Timing – när ska jag belöna för det beteende jag vill ha? Kvalitet – hur mycket gillar hunden belöningen? Position – var ska hunden befinna sig när belönar den? Vilken riktning har hunden? 1. Kriterier Att sätta bra kriterier är det som skiljer bra hundtränare från de mindre bra. Ett kriterie är det som hunden måste utföra för att få belöningen. Ett bra kriterie kännetecknas av att hunden lyckas med sin uppgift så ofta som möjligt. Det som skiljer bra hundträning från mindre bra hundträning är hur förnuftiga kriterierna är. Till vår hjälp har vi en så kallad kriterieplan. Längre fram i kursen kommer vi att kalla den för träningsplan. Kriterieplanen beskriver vägen från där vi är till dit vi vill komma. Man kan likna kriterieplanen vid en vägbeskrivning. Det är lite jobbigt om man bara ungefär vet var Göteborg ligger. Om man kör fel redan i början så blir det svårt att hitta dit man ska. Men har vi tittat i kartboken och vet att vi måste passera Halmstad, Falkenberg och Varberg så blir det genast mycket lättare. Träningen blir mest effektiv om vi sätter kriterierna så att hunden lyckas (=gör rätt och blir belönad) så ofta som möjligt. Beroende på vägen till målet är långt eller kort så kan det vara bra att skriva ner sin kriterieplan på papper. Exempel på kriterieplan Moment: Hunden ska kunna sitta kvar i starten tills föraren kallar. Hunden sitter framför hindret med föraren stående framför sig med ryggen mot hindret. Hunden sitter framför hindret med föraren stående jämsides med höger resp. vänster hinderstöd. Hunden sitter framför hindret och föraren rör sig runt ett hinderstöd och ställer sig bakom hindret. Hunden sitter framför hindret och föraren rör sig ett helt varv runt hindret. Hunden sitter framför hindret och föraren rör sig först ett varv runt hindret och sedan tillbaka. Hunden sitter framför hindret och föraren rör sig 1 m. bakom hindret. Hunden sitter framför hindret och föraren rör sig 3 m. bakom hindret. Hunden sitter framför hindret till föraren ger den signal att komma. 80 % -reglen Hur ska du kunna veta att du jobbar med rätt kriterie? Och hur ska du veta när det är dags att gå vidare? Om hunden lyckas med 80 % av repetitionerna, dvs. 4 av 5 eller 8 av 10, då vet du att ni är på rätt väg. Att hunden inte utför beteendet inom latenstiden räknas som att hunden inte utför kriteriet. Latenstid Latenstiden är tiden från det att du ger kommandot till dess att hunden utför beteendet. Latenstiden varierar beroende på vilket beteende man tränar. Om du ger ett kommando som hunden kan väl bör latenstiden inte vara mer än 0,2 sekunder. Målet är ju att hunden ska kunna reagera omedelbart på våra kommandon. Om du jobbar med ett nytt beteende kanske latenstiden är 3 sekunder. Om inte hunden erbjudit beteende inom 3 sekunder avbryter du, förflyttar dig kanske och provar igen. Att sätta en latenstid har flera fördelar. 1. Du lär hunden att jobba snabbt. Den kommer att förstå att den inte har all tid i världen och det gäller att göra det den ska innan dörren till godisaffären stängs. 2. Det tvingar dig till att sätta förnuftiga kriterier. Det är allt för vanligt att man sätter för höga kriterier och väntar i flera minuter på ett beteende. Om hunden inte erbjudit beteendet inom 3-5 sekunder i 80 % av repetitionerna är du tvungen att tänka om. Skynda långsamt – men inte FÖR långsamt Det är lätt att förstå att man inte ska gå för fort fram. Men vad du kanske inte vet är att det är lika illa att gå för långsamt fram. Som exempel kan vi ta slalom och slalomträning. Du nöter på 4-pinnarsslalom långt efter det att hunden klarar det 80-100% av repetitionerna. Risken är då att det blir problem när ytterligare två pinnar ska läggas till. Det är vanligt att hunden då ignorerar de två nya pinnarna eller kanske går ur redan i början av slalom. 2. Frekvens Frekvensen beskriver hur länge hunden måste jobba mellan varje belöning. När man börjar lära hunden något så måste frekvensen vara hög och det ska gå fort från klick till godis. Hög frekvens ger snabb inlärning och man behåller hundens uppmärksamhet. När du börjar belöna mera sällan och låter hunden jobba längre tid mellan belöningarna så måste du vara försiktig för annars riskerar beteendet att fall samman. Frekvensen hänger nämligen nära samman med kriterierna. För höga kriterier Hunden lyckas för sällan Dåligt med belöning (låg frekvens) Resultatet blir ofta att hunden hittar belöning på andra ställen än hos föraren. (självbelöning) För att frekvensen ska bli hög så måste belöningen vara lätt tillgänglig. Godiset förvaras i lätt åtkomlig i jackfickan eller i en speciell belöningspåse som kan hängas i byxlinningen eller utanpå fickan. Det finns alltså inte utrymme för att springa iväg och hämta godis i jackan som man lämnat på staketet 10 meter bort. Samma sak gäller naturligtvis för leksaker. Praktik: Frekvens Det är viktigt att vara snabb med belöningen och det kan man öva på i hemmets lugna vrå. Ha en massa små godisbitar i fickan eller i en belöningspåse. Håll klickern i handen och låt armarna hänga fritt. Ställ en liten skål på bordet framför dig. Ta en kompis till hjälp och räkna hur många gånger du hinner belöna ”hunden” på 45-60 sekunder. Öva med båda händerna. En annan variant är att ladda med 30-50 godisbitar och sedan ta tid på hur lång tid det tar att lägga bitarna i skålen, en för varje klick. Öva på att sätta kriterier Ju mer du tränar desto duktigare blir du på att sätta kriterier. 1. Lek träningsleken 2. Gör alltid en träningsplan 3. För träningsblog/dagbok 3. Timing Timingen beskriver när jag ska belöna för att få det beteende jag vill ha. Att belöna någon tiondels sekund för sent kan vara skillnaden mellan rätt beteende och fel. Ta tex kontaktfältsträning med två av och två på. Exakt belöning är när hunden står med just två tassar av och två tassar på. Försenad belöning och du belönar att hunden är på väg av kontaktfältet. Det betyder alltså att om timingen är för dålig så riskerar du att förstärka ett annat beteende än det du tänkt. Belöna hellre för tidigt än för sent. Sannolikheten att du förstärker det rätta beteendet öka då. Tänk dig att klickern är en kamera. Lyckades du få en perfekt bild eller fick du bara med svansen? Den här föraren var nog lite sent ute. Man får det man förstärker – inte det man avser att förstärka. Bob Bailey You get what you click Anita Axelsson Praktik: Timing Som hundtränare måste du vara snabb på att uppfatta och reagera. Dessutom måste du veta vilket beteende du tittar efter. Enda sättet att uppnå detta är att öva, öva och öva. I början är det bra att inte utsätta hunden för experiment utan öva på egen hand. Tennisbollsövningen a. Kasta upp en tennisboll i luften. Klicka precis när bollen träffar golvet. Fortsätt tills du klickar rätt. Tänk på att kasta bollen olika högt. b. Studsa bollen hårt i golvet. Klicka när bollen når den högsta punkten, precis innan den börjar falla mot golvet. 4. Kvalitet Det finns många olika sätt att belöna och man behöver inte hålla sig till bara ett. Det viktigaste är att hunden blir glad och lycklig. Ju bättre belöning du har desto större chans har du att lyckas. En hund som är en riktig belöningstok är i regel väldigt lätt att träna. En sådan hund ger sin förare en stor felmarginal och man har råd att sätta fel kriterier eller belöna för sällan, hunden kommer att utvecklas i alla fall och felen är lätta att rätta till. Det är därför som polisen, tullen och målmedvetna förare väljer ras och individ med stor omsorg. Om man har en hund som är svår att belöna måste man se till att samtliga punkter är så bra som möjligt och det krävs mycket av föraren för att det ska fungera. Att skapa intresse för olika belöningar är det viktigaste vi kan göra under valp och unghundstiden. Ofta får man höra att man inte ska leka med valpen. Och man SKA vara försiktig så man inte skadar deras mjuka skelett. Men det betyder inte att man inte ska leka alls. Godis De flesta hundar jobbar gärna för mat. Det är den mest ursprungliga anledningen till fysisk aktivitet som finns. Om din hund har anlag för att lägga på sig - ta då med ett mål mat och servera som belöning. Välj godis som hunden verkligen gillar. Köttbullar, kyckling, korv, pannkaka, ost, blodpudding, m.m. är sådant som många hundar älskar. Många märker att hundens ansträngning och fart ökar när godiset faller hunden i smaken. Godiset kan delas upp i vardagsgodis och jackpot-godis. Vardagsgodiset använder man till att belöna lättare saker med eller saker som hunden redan kan. Godiset måste ändå vara så gott att hunden är villig att jobba för det. Jackpot-godiset använder du när du lär in något svårt eller när hunden har varit extra duktig och det godiset måste vara strået vassare. Den typen av godis passar utmärkt att använda efter målgången på en tävling. Godiset ska vara i små bitar, även till stora hundar. Det är inte meningen att hunden ska bli mätt på det. Om hunden är mätt så blir godiset inte lika åtråvärt längre. Om man ger mycket godis ska det inte vara torrt som tex. torrfoder eller kex. Det belastar magen som måste blöta upp det torra, hunden blir törstig och godiset i magen sväller och orsakar magont. Lek Det finns flera sorters lek, både jaktlek där hunden jagar efter en leksak och kamplek som är dragkamp eller brottning. Inte alla hundar intresserade av den typen av lek men om den är det så är det bara att gratulera. Vad man ska tänka på är att lek är uppstressande vilket i och för sig gör att hunden blir extra livlig, men vissa individer passar inte för stress. Är hunden redan stressad av iver är det bättre att lugna den i belöningen och ge den godis istället. Man kan inte stressa och äta samtidigt. I en situation där man vill att hunden ska tänka och fokusera är det lämpligare att belöna med något lugnande. Leksaksbelöning är extra lämplig efter tunnlar och hopphinder eftersom de ska göras i hög fart och de hindren är lätta att göra rätt. Den här hunden gillar sin belöning väldigt mycket 5. Position Position står för i vilken riktning hunden ska befinna sig när klicket kommer. Ta tex. kontaktfälten. Vi vill hela tiden att hunden ska söka sig ner/fram. Men om vi hela tiden tvingar hunden att komma till föraren för att få sin belöning så kommer hunden snart att sluta söka sig neråt och istället söka sig mot föraren. Detta kan resultera i ett kraschat kontaktfältsbeteende eller i sneda kontaktfält. Ett annat exempel är när hunden i slalom efter varje sväng söker sig tillbaka mot föraren istället för att dra framåt. Den hunden har förmodligen tvingats söka upp föraren för att få sin belöning, istället för att belöningen har funnits framför hundens nos i den riktning den ska gå. © Linda Andkvist 2007