Inlärning och belöning

Inlärning och belöning
Positiv och negativ förstärkning
De allra flesta har fått lära sig att hundar utför våra kommandon för att:
- vi säger det
- vi har ett bra ledarskap
- hundarna älskar oss
- osv.
DETTA ÄR HELT FEL!!
Hundar jobbar för att:
1. få något den vill ha (godis, boll, kel)
2. undvika något obehagligt (ryck i kopplet, smäll på nosen, tagen i nackskinnet)
Våra kommandon talar bara om för hunden att om den utför ett visst beteende just nu så har den
chans att:
1. få en belöning
2. undvika obehag
Båda alternativen innebär att hunden vinner något på att utföra rätt beteende. Det är bara
inlärningsmetoden, vägen till rätt beteende, som skiljer sig.
Beteende
Lisa trycker ner dörrhandtaget
Hunden drar i kopplet
Kalle går runt en vattenpöl
Pelle låter bli att äta nötter
Konsekvens (resultat)
Dörren öppnas
Hunden kommer fortare fram
Kalle slipper bli blöt om fötterna
Pelle slipper att få svårt att andas
I varje exempel här ovanför ser vi att beteendet har ett resultat, eller konsekvens som det också
heter. Antingen uppnår vi något vi vill ha eller så slipper vi något obehagligt.
I alla situationerna bli beteende förstärkt. Det vill säga, att sannolikheten ökar för att beteendet
ska upprepas nästa gång vi handlar i en liknande situation.
I exemplet ovan ser vi två olika typer av förstärkning. Den första typen kallar vi positiv
förstärkning.
På vanlig svenska kallar vi detta för belöning. När ett beteende resulterar i något vi vill ha, är det
troligt att vi kommer att utföra beteendet igen.
Ex: Lisa får 500 kr varje gång hon får MVG på ett prov.
De flesta som gått i skolan och fått en normal uppfostran har lärt sig att utföra en del beteenden för
att undvika obehag. Det kallas för negativ förstärkning. Vi skulle lika gärna kunna kalla det för
straff. Även beteende som gör att vi undviker något obehagligt resulterar i att vi upprepar
beteendet.
Ex: Per slipper få utegångsförbud om han gör sina läxor ordentligt. Lisa slipper få kvarsittning om
hon inte pratar på lektionerna.
Positiv förstärkning och klassisk betingning
Ivan Pavlov (1849-1936) var en pionjär inom psykologin, kanske främst för den tidiga behaviorismen.
Han gjorde experiment med hundar, som främst rörde salivbildningen i deras munnar när de
serverades mat. 1904 tilldelades han Nobelpriset i medicin, bla. för denna upptäckt.
Av en händelse upptäckte han att om han ringde en klocka innan de fick mat, så kom hundarna så
småningom att börja utsöndra saliv vid ljudet av klockan oavsett om de fick mat eller ej.
Vad som hände i experimentet, och som också utgör grunderna för klassisk betingning, är att en
naturligt betingad stimulus (maten) ger upphov till en obetingad respons (saliv i hundarnas mun).
Klockan som ringer strax innan maten utgör en betingad stimulus och följs i början alltid av mat.
När detta skett några gånger lär sig organismen (hunden) att den betingade stimulusen alltid följs av
maten och således på ett pålitligt sätt förutsäger händelsen. Responsen blir att hunden börjar
producera saliv redan vid ljudet av klockan, och en betingad respons har uppstått.
Istället för att bortse från denna oförutsedda händelse tog Pavlov till vara på det och lade om sina
experiment i den riktningen. Han definierade genom dessa experiment ett begrepp som kallas
Pavloviansk inlärning (eller, vilket är en vanligare benämning, klassisk betingning) där organismen
lär sig vilka stimuli som föregår viktiga händelser, oavsett om dessa stimuli är naturligt kopplade till
händelsen eller ej. Källa: Wikipedia
Om vi hade vänt på Pavlovs experiment och gjort det till en övning i negativ förstärkning så hade vi
till exempel utsatt hundarna för en elektrisk ström så fort de INTE åt sin mat. (slutade tugga) Båda
metoderna är ett utmärkt sätt att få hundarna att äta, frågan är bara vilket som känns trevligast.
Det är på detta experiment som klickerträning är byggd på, eller all belöning för den delen. Genom
att lära hunden att rätt utförd uppgift följs av markering (klick/ ”bra”) och en belöning har vi ett
tydligt och enkelt redskap att tala om för hunden vad som förväntas av den. Det skapar också en
förväntan för hunden och en vilja att själv utföra uppgifter för att nå belöningen.
Att använda klicker är det effektivaste sättet att ”shejpa” (forma) fram ett beteende.
Belöning består av två moment och ingen av delarna fungerar var för sig. Delarna måsta alltid hänga
ihop och det får dessutom inte gå för lång tid mellan markering och belöning.
Markering
klick/röst
Belöning
Förstärkning
godis/leksak
Men nu är det inte så enkelt att det bara är att klicka och belöna.
Det första man måste göra är att klicka in hunden. Oavsett om du använder klicker eller inte så
måste du lära hunden att klick/bra följs av en belöning. Det enda sättet att göra det är att öva.
Hunden behöver inte utföra någon uppgift utan ska bara vara hos dig och får höra klick/bra och
sedan få godis. Ca 50 repetitioner behövs för att hunden ska förknippa klicket med en delikat
köttbulle. När hunden har förstått vad det går ut på kan man prova det på saker som hunden redan
kan, tex. sitt.
Det klickern talar om för hunden är att ”det här är rätt, godis är på väg”.
Klicker kan man välja att använda till vissa moment eller genom hela träningen. Belöning måste
man däremot använda hela tiden. Tänk dig själv om chefen slutade betala ut lön bara för du blivit
skicklig i ditt arbete.
Fördelar med klicker
Ljudet av klickern är mycket tydligare än ord! Dels för att ord finns i många typer och att hunden
först måste sortera in orden i rätt fack. Man kan säga att det finns fyra typer av ord och hunden
måste snabbt bestämma sig för vad som hördes. Klickern är dessutom bättre än ord eftersom få
människor kan dölja sina verkliga känslor bakom ett ord. Tonläget avslöjar för hunden vilket humör
du är på och det är inte så lyckat om du egentligen är ganska missnöjd med din och hundens
prestation.
FY FIDO!
(straff)
BRA!
(belöning)
HIT!
(signal)
BLA BLA BLA
(människobabbel)
Vad är det hon
menar????
Belöningens regler
För enkelhetens skull kommer vi i fortsättningen av använda oss av ordet klicka men ni som inte
använder klicker läser helt enkelt ordet ”bra”.
För att





belöningen ska bli effektiv och rätt så finns det fyra regler man måste följa.
Kriterier – vad vill jag belöna?
Frekvens – hur ofta ska jag belöna?
Timing – när ska jag belöna för det beteende jag vill ha?
Kvalitet – hur mycket gillar hunden belöningen?
Position – var ska hunden befinna sig när belönar den? Vilken riktning har hunden?
1. Kriterier
Att sätta bra kriterier är det som skiljer bra hundtränare från de mindre bra. Ett kriterie är det
som hunden måste utföra för att få belöningen.
Ett bra kriterie kännetecknas av att hunden lyckas med sin uppgift så ofta som möjligt.
Det som skiljer bra hundträning från mindre bra hundträning är hur förnuftiga kriterierna är. Till vår
hjälp har vi en så kallad kriterieplan. Längre fram i kursen kommer vi att kalla den för träningsplan.
Kriterieplanen beskriver vägen från där vi är till dit vi vill komma. Man kan likna kriterieplanen vid
en vägbeskrivning. Det är lite jobbigt om man bara ungefär vet var Göteborg ligger. Om man kör fel
redan i början så blir det svårt att hitta dit man ska. Men har vi tittat i kartboken och vet att vi
måste passera Halmstad, Falkenberg och Varberg så blir det genast mycket lättare.
Träningen blir mest effektiv om vi sätter kriterierna så att hunden lyckas (=gör rätt och blir
belönad) så ofta som möjligt.
Beroende på vägen till målet är långt eller kort så kan det vara bra att skriva ner sin kriterieplan på
papper.
Exempel på kriterieplan
Moment: Hunden ska kunna sitta kvar i starten tills föraren kallar.
Hunden sitter framför hindret med föraren stående framför sig med ryggen mot hindret.
Hunden sitter framför hindret med föraren stående jämsides med höger resp. vänster hinderstöd.
Hunden sitter framför hindret och föraren rör sig runt ett hinderstöd och ställer sig bakom hindret.
Hunden sitter framför hindret och föraren rör sig ett helt varv runt hindret.
Hunden sitter framför hindret och föraren rör sig först ett varv runt hindret och sedan tillbaka.
Hunden sitter framför hindret och föraren rör sig 1 m. bakom hindret.
Hunden sitter framför hindret och föraren rör sig 3 m. bakom hindret.
Hunden sitter framför hindret till föraren ger den signal att komma.
80 % -reglen
Hur ska du kunna veta att du jobbar med rätt kriterie? Och hur ska du veta när det är dags att gå
vidare?
Om hunden lyckas med 80 % av repetitionerna, dvs. 4 av 5 eller 8 av 10, då vet du att ni är på rätt
väg.
Att hunden inte utför beteendet inom latenstiden räknas som att hunden inte utför kriteriet.
Latenstid
Latenstiden är tiden från det att du ger kommandot till dess att hunden utför beteendet.
Latenstiden varierar beroende på vilket beteende man tränar. Om du ger ett kommando som
hunden kan väl bör latenstiden inte vara mer än 0,2 sekunder. Målet är ju att hunden ska kunna
reagera omedelbart på våra kommandon.
Om du jobbar med ett nytt beteende kanske latenstiden är 3 sekunder. Om inte hunden erbjudit
beteende inom 3 sekunder avbryter du, förflyttar dig kanske och provar igen.
Att sätta en latenstid har flera fördelar.
1. Du lär hunden att jobba snabbt. Den kommer att förstå att den inte har all tid i världen och
det gäller att göra det den ska innan dörren till godisaffären stängs.
2. Det tvingar dig till att sätta förnuftiga kriterier. Det är allt för vanligt att man sätter för
höga kriterier och väntar i flera minuter på ett beteende. Om hunden inte erbjudit
beteendet inom 3-5 sekunder i 80 % av repetitionerna är du tvungen att tänka om.
Skynda långsamt – men inte FÖR långsamt
Det är lätt att förstå att man inte ska gå för fort fram. Men vad du kanske inte vet är att det är lika
illa att gå för långsamt fram.
Som exempel kan vi ta slalom och slalomträning. Du nöter på 4-pinnarsslalom långt efter det att
hunden klarar det 80-100% av repetitionerna. Risken är då att det blir problem när ytterligare två
pinnar ska läggas till. Det är vanligt att hunden då ignorerar de två nya pinnarna eller kanske går ur
redan i början av slalom.
2. Frekvens
Frekvensen beskriver hur länge hunden måste jobba mellan varje belöning.
När man börjar lära hunden något så måste frekvensen vara hög och det ska gå fort från klick till
godis. Hög frekvens ger snabb inlärning och man behåller hundens uppmärksamhet.
När du börjar belöna mera sällan och låter hunden jobba längre tid mellan belöningarna så måste du
vara försiktig för annars riskerar beteendet att fall samman. Frekvensen hänger nämligen nära
samman med kriterierna.
För höga kriterier
Hunden lyckas för
sällan
Dåligt med belöning
(låg frekvens)
Resultatet blir ofta att hunden hittar belöning på andra ställen än hos föraren. (självbelöning)
För att frekvensen ska bli hög så måste belöningen vara lätt tillgänglig. Godiset förvaras i lätt
åtkomlig i jackfickan eller i en speciell belöningspåse som kan hängas i byxlinningen eller utanpå
fickan. Det finns alltså inte utrymme för att springa iväg och hämta godis i jackan som man lämnat
på staketet 10 meter bort. Samma sak gäller naturligtvis för leksaker.
Praktik:
Frekvens
Det är viktigt att vara snabb med belöningen och det kan man öva på i hemmets lugna vrå.
Ha en massa små godisbitar i fickan eller i en belöningspåse. Håll klickern i handen och låt armarna
hänga fritt. Ställ en liten skål på bordet framför dig.
Ta en kompis till hjälp och räkna hur många gånger du hinner belöna ”hunden” på 45-60 sekunder.
Öva med båda händerna.
En annan variant är att ladda med 30-50 godisbitar och sedan ta tid på hur lång tid det tar att lägga
bitarna i skålen, en för varje klick.
Öva på att sätta kriterier
Ju mer du tränar desto duktigare blir du på att sätta kriterier.
1. Lek träningsleken
2. Gör alltid en träningsplan
3. För träningsblog/dagbok
3. Timing
Timingen beskriver när jag ska belöna för att få det beteende jag vill ha. Att belöna någon
tiondels sekund för sent kan vara skillnaden mellan rätt beteende och fel.
Ta tex kontaktfältsträning med två av och två på. Exakt belöning är när hunden står med just två
tassar av och två tassar på. Försenad belöning och du belönar att hunden är på väg av kontaktfältet.
Det betyder alltså att om timingen är för dålig så riskerar du att förstärka ett annat beteende än
det du tänkt. Belöna hellre för tidigt än för sent. Sannolikheten att du förstärker det rätta
beteendet öka då.
Tänk dig att klickern är en kamera. Lyckades du få en perfekt bild eller fick du bara med svansen?
Den här föraren var nog lite sent ute.
Man får det man förstärker – inte det man avser att förstärka.
Bob Bailey
You get what you click
Anita Axelsson
Praktik:
Timing
Som hundtränare måste du vara snabb på att uppfatta och reagera. Dessutom måste du veta vilket
beteende du tittar efter. Enda sättet att uppnå detta är att öva, öva och öva. I början är det bra att
inte utsätta hunden för experiment utan öva på egen hand.
Tennisbollsövningen
a. Kasta upp en tennisboll i luften. Klicka precis när bollen träffar golvet. Fortsätt tills du
klickar rätt. Tänk på att kasta bollen olika högt.
b. Studsa bollen hårt i golvet. Klicka när bollen når den högsta punkten, precis innan den
börjar falla mot golvet.
4. Kvalitet
Det finns många olika sätt att belöna och man behöver inte hålla sig till bara ett. Det viktigaste är
att hunden blir glad och lycklig. Ju bättre belöning du har desto större chans har du att lyckas.
En hund som är en riktig belöningstok är i regel väldigt lätt att träna. En sådan hund ger sin förare
en stor felmarginal och man har råd att sätta fel kriterier eller belöna för sällan, hunden kommer
att utvecklas i alla fall och felen är lätta att rätta till. Det är därför som polisen, tullen och
målmedvetna förare väljer ras och individ med stor omsorg.
Om man har en hund som är svår att belöna måste man se till att samtliga punkter är så bra som
möjligt och det krävs mycket av föraren för att det ska fungera.
Att skapa intresse för olika belöningar är det viktigaste vi kan göra under valp och unghundstiden.
Ofta får man höra att man inte ska leka med valpen. Och man SKA vara försiktig så man inte skadar
deras mjuka skelett. Men det betyder inte att man inte ska leka alls.
Godis
De flesta hundar jobbar gärna för mat. Det är den mest ursprungliga anledningen till fysisk aktivitet
som finns.
Om din hund har anlag för att lägga på sig - ta då med ett mål mat och servera som belöning.
Välj godis som hunden verkligen gillar. Köttbullar, kyckling, korv, pannkaka, ost, blodpudding, m.m.
är sådant som många hundar älskar. Många märker att hundens ansträngning och fart ökar när
godiset faller hunden i smaken.
Godiset kan delas upp i vardagsgodis och jackpot-godis. Vardagsgodiset använder man till att
belöna lättare saker med eller saker som hunden redan kan. Godiset måste ändå vara så gott att
hunden är villig att jobba för det.
Jackpot-godiset använder du när du lär in något svårt eller när hunden har varit extra duktig och det
godiset måste vara strået vassare. Den typen av godis passar utmärkt att använda efter målgången
på en tävling.
Godiset ska vara i små bitar, även till stora hundar. Det är inte meningen att hunden ska bli mätt på
det. Om hunden är mätt så blir godiset inte lika åtråvärt längre. Om man ger mycket godis ska det
inte vara torrt som tex. torrfoder eller kex. Det belastar magen som måste blöta upp det torra,
hunden blir törstig och godiset i magen sväller och orsakar magont.
Lek
Det finns flera sorters lek, både jaktlek där hunden jagar efter en leksak och kamplek som är
dragkamp eller brottning. Inte alla hundar intresserade av den typen av lek men om den är det så är
det bara att gratulera.
Vad man ska tänka på är att lek är uppstressande vilket i och för sig gör att hunden blir extra livlig,
men vissa individer passar inte för stress. Är hunden redan stressad av iver är det bättre att lugna
den i belöningen och ge den godis istället. Man kan inte stressa och äta samtidigt.
I en situation där man vill att hunden ska tänka och fokusera är det lämpligare att belöna med något
lugnande.
Leksaksbelöning är extra lämplig efter tunnlar och hopphinder eftersom de ska göras i hög fart och
de hindren är lätta att göra rätt.
Den här hunden gillar sin belöning väldigt mycket
5. Position
Position står för i vilken riktning hunden ska befinna sig när klicket kommer.
Ta tex. kontaktfälten. Vi vill hela tiden att hunden ska söka sig ner/fram. Men om vi hela tiden
tvingar hunden att komma till föraren för att få sin belöning så kommer hunden snart att sluta söka
sig neråt och istället söka sig mot föraren. Detta kan resultera i ett kraschat kontaktfältsbeteende
eller i sneda kontaktfält.
Ett annat exempel är när hunden i slalom efter varje sväng söker sig tillbaka mot föraren istället för
att dra framåt. Den hunden har förmodligen tvingats söka upp föraren för att få sin belöning,
istället för att belöningen har funnits framför hundens nos i den riktning den ska gå.
© Linda Andkvist 2007

Inlärning och belöning

Related documents

Products

Support

Inlärning och belöning

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib