STATISTIK Räkna med sannolikheter Statistikskolan Hur stor är sannolikheten att någon gång ha tur och vinna på ett lotteri som man deltar i ett visst antal gånger? Sådant går att räkna ut med sannolikhetslärans räknelagar. Med dem kan man belysa utsikterna för lite svårfångade händelser, som att ha tur någon gång. Liknande beräkningar har tillämpningar inte minst inom statistik. Av Martin Ribe E 18 prickar hamnar uppåt, när man kastar en tärning? Även här finns det sex möjliga utfall. Av dem är tre gynnsamma för händelsen, nämligen att en sida med en, två eller tre prickar hamnar uppåt. Sannolikheten för händelsen blir då 3/6 = 1/2 = 0,5. Den här klassiska definitionen på sannolikhet är användbar just när det gäller tärningar och sådant. Men hur går det om man är med om flera tärningskast i följd? Då kan det vara intressant att få veta chanserna att turen eller oturen håller i sig. n tärning har sex sidor, som alla lika gärna kan hamna uppåt när man kastar tärningen. Hur stor är sannolikheten att det blir en sexa, alltså att sidan med sex prickar hamnar uppåt när man kastar tärningen? Det ger sig ganska naturligt. Av tärningens sex sidor är det en som har sex prickar. Det finns därför en möjlighet på sex att det blir en sexa. Sannolikheten att det blir en sexa blir då en på sex, alltså en sjättedel. Svaret blir 1/6, eller 0,17 avrundat. Sannolikheten för en händelse är ett tal mellan noll och ett. Sannolikheten är noll för en händelse som omöjligt kan inträffa, t.ex. att man får en åtta när man kastar en tärning. Någon sida med åtta prickar finns ju inte på tärningen. På motsvarande sätt är sannolikheten lika med ett för en händelse som absolut säkert kommer att inträffa. Sannolikheter har även tidigare tagits upp i VälfärdsBulletinens statistikskola (1997, nr 3). Om man gör två tärningskast efter varandra, vad är då sannolikheten att det blir en sexa i båda kasten? I första kastet är sannolikheten för sexa lika med 1/6, som vi just såg. I andra kastet är situationen densamma, och sannolikheten för sexa är då också lika med 1/6. När man kommer till andra kastet spelar det ingen roll hur det gick i första kastet. Sannolikheten för sexa i andra kastet är alltid lika med 1/6, oberoende av om det blev sexa i första kastet eller ej. Annars kunde man möjligen tro att om det blev sexa i första kastet, så skulle det minska chansen för sexa i andra kastet. Turen skulle så att säga vara lite förbrukad i första kastet, om det blev sexa då. Men så är det inte. Det andra kastet är en sak för sig och fungerar oberoende av hur det gick i första kastet. Nu vill vi räkna ut sannolikheten att det blir sexa i båda kasten. En klassiker En hjälpsam räknelag För länge sedan kom man på en matematisk definition på sannolikhet som numera kallas den klassiska. Denna klassiska definition säger hur man kan räkna ut sannolikheten för en händelse: Man dividerar antalet gynnsamma utfall med antalet möjliga. Vad betyder det? Tärningen har sex sidor som alla kan hamna uppåt, och därför finns det sex möjliga utfall. Av dessa möjliga utfall är det ett som är gynnsamt för sexa. Därför dividerar vi 1 med 6 och får 1/6, och detta tal är som sagt lika med sannolikheten för sexa. På samma sätt kan man räkna fram sannolikheter för andra händelser. Hur stor är t.ex. sannolikheten att en sida med högst tre Vi kan ta hjälp av en fundamental räknelag för sannolikheter, som kallas sannolikhetslärans multiplikationssats. Den handlar om hur man får fram sannolikheten för att två olika händelser båda kommer att inträffa. Den säger att för detta ska vi multiplicera de båda händelsernas sannolikheter med varandra. Det här gäller under den förutsättningen att två händelserna är oberoende och därmed inte kan påverka varandra. Vi har nu att göra med två oberoende händelser, sexa i första kastet och sexa i andra kastet. Båda händelserna har sannolikheten 1/6. Sannolikheten för att båda händelserna inträffar får vi nu med vår räknelag: Två tärningskast VälfärdsBulletinen Nr 4 1998 STATISTIK Vi multiplicerar de båda händelsernas sannolikheter med varandra. Sannolikheten för sexa i båda kasten blir då (1/6) × (1/6) = 1/36 = 0,028. Grövre uttryckt blir det knappt tre hundradelar, alltså ganska nära noll. Det betyder att det är ganska sällsynt med två sexor i följd. Hur ofta något händer Sannolikheten för en händelse kan uppfattas som ett mått på hur vanlig händelsen är i det långa loppet. Vi kan tänka oss att vi gång på gång är med om situationen att två tärningskast görs. Med tiden blir det ett mycket stort antal gånger. Andelen gånger som det blir sexa i båda kasten kommer då med tiden att hamna nära sannolikheten för den händelsen. I det långa loppet kommer alltså denna händelse att inträffa mindre än tre gånger på hundra. Händelserna vars sannolikheter multipliceras ihop måste som sagt vara oberoende av varandra. Annars gäller inte den här muliplikationslagen. Oberoende betyder att händelserna utspelas var för sig och inte kan påverka varandra. Tärningskast är oberoende. Exempel på händelser som däremot inte är oberoende är vädret i morgon och i övermorgon. Blir det sol i morgon så påverkar det chansen att det blir sol i övermorgon, om t.ex. ett högtryck ligger kvar. Där råder ett beroende. På liknande sätt som nyss kan vi gå till väga om vi har en situation med flera än två tärningskast. Om man t.ex. gör fem kast i följd, hur stor är då sannolikheten att det blir sexa i varje kast? Även nu multiplicerar vi ihop händelsernas sannolikheter, och det ger (1/6) × (1/6) × (1/6) × (1/6) × (1/6) = (1/6)5 = 0,00013, bara lite mer än ett på tio tusen. Det här kan man utveckla vidare och tillämpa på många intressanta vis. Chansen att få tur På en större arbetsplats finns en konstförening för de anställda. Två gånger om året lottar man ut vinster i form av konstverk till tolv av medlemmarna i föreningen. Utlottningen görs slumpmässigt bland alla medlemmar, utan hänsyn till vilka som fått vinster tidigare. Antalet medlemmar i föreningen ligger konstant på 400, antar vi för enkelhets skull. Om en person är med i konstföreningen i tio år, hur stor är då sannolikheten att personen får åtminstone en vinst? Det är lättare att se det från andra hållet, sannolikheten att inte få vinst. I varje utlottVälfärdsBulletinen Nr 4 1998 ning är det 400 – 12 = 388 medlemmar som blir utan vinst. Sannolikheten att en person blir utan vinst i en utlottning blir därför 388/400. Under tio år är personen med i 20 utlottningar, varje gång med sannolikheten 388/400 att bli utan vinst. Enligt vår räknelag ska vi multiplicera ihop de 20 sannolikheterna med varandra, vilket ger (388/400)20 = 0,54. Detta är sannolikheten att personen jämt har otur och inte får någon vinst på 20 utlottningar. Den motsatta händelsen är att personen får tur och vinner minst en gång under den tiden. Sannolikheten för det är lika med ett minus talet 0,54 och är alltså 0,46. Vi ser att under de förutsättningar vi antog så är det ungefär lika stor chans för en person att vinna minst en gång som att aldrig vinna. De utvalda Såna här situationer förekommer förstås inte bara i lotterier och spel. De kan inte minst dyka upp i statistiska sammanhang. Tänk på två urvalsundersökningar som görs oberoende av varandra. Undersökningarna använder varsitt urval på 3 000 personer ur samma population på 6 000 000 personer, t.ex. alla svenskar utom de yngsta och de äldsta. Urvalen görs oberoende av varandra och i form av s.k. oberoende slumpmässiga urval. Där har alla i populationen samma chans att komma med. Sannolikheten för en person att komma med i urvalet är då i vardera undersökningen lika med 3 000 / 6 000 000 = 1 / 2 000. Nu kan vi räkna ut sannolikheten att en person kommer med i båda undersökningarna. På samma sätt som förut blir den sannolikheten lika med (1 / 2 000) × (1 / 2 000) = 1/ 4 000 000. ”Risken” för en person att komma med i båda undersökningarna är alltså bara en på fyra miljoner. Det betyder att det är ytterligt sällsynt att komma med i båda undersökningarna. Det här gäller dock i exakt mening bara när urvalen dras som oberoende slumpmässiga urval. I praktiken är det ofta vanligt med andra former av urval, och då blir beräkningen mera komplicerad. Det här var lite exempel på vad man kan komma åt med räknelagar för sannolikheter. I andra former och kombinationer kan sådana lagar bland annat ge mått på osäkerhet i statistiska undersökningar. ● Martin Ribe är metodstatistiker vid SCB, tfn 08-783 48 54. 19