STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Louise af Klintberg Lösningar Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011 ———————————————— Uppgift 1 a) För att få hög validitet borde mätningarna ha gjorts vid samma tidpunkt. Det är ju rimligt att tro att bland annat vädret och antalet bilar i staden påverkar partikelhalten. För att få hög validitet för hela staden borde man också gjort mätningar på flera ställen i staden. Åtminstone borde man ha valt en annan gatukorsning hellre än att ställa sig vid Tvärgatan igen. b) Man kan åskådliggöra materialet med histogram eller lådagram. Gör man histogram kan man t ex låta dem stå rygg mot rygg. Se nästa sida. Vilken typ av diagram man än använder är det svårt att avgöra om det finns någon signifikant skillnad mellan dessa två datamaterial. Lösning Sannolikhetslära och statistik (lärarprogrammet) , 12 februari 2011 2 Lösning Sannolikhetslära och statistik (lärarprogrammet) , 12 februari 2011 3 Uppgift 2 a) Man kan se det som att man slumpmässigt väljer två av lärarna, en i taget. Att båda de valda lärarna har namn som börjar på B innebär att den första väljs bland de 3 med namn på B bland de totalt 10 lärarna i rummet, och därefter en av de 2 kvarvarande väljs bland de 9 återstående. Den sökta 3∗2 1 sannolikheten blir alltså 10∗9 = 15 = 0.067 b) Med samma resonemang som i a) får man att sannolikheten för att båda 5∗4 de kvarvarande lärarna är matematiklärare blir 10∗9 = 29 = 0.22 c) Ja, eftersom snitthändelsen till ”båda kvarvarande lärarna har namn som börjar på B” och ”båda kvarvarande lärarna är matematiklärare” är händelsen att det i rummet sitter kvar två matematiklärare vars namn börjar på B vilket är omöjligt . d) Sannolikheten att båda kvarvarande lärarna har namn som börjar på B och båda kvarvarande lärarna är matematiklärare är 0, vilket framgår av c). Men produkten av sannolikheterna för de två händelserna är strikt större än 0. Händelserna är alltså inte oberoende. Om det sitter kvar två lärare med namn som börjar på B kan ju inte båda vara matematiklärare. Uppgift 3 a) Eftersom P4 k=1 pX (k) 1=c 4 X = 1 får man k(5 − k) = c (4 + 6 + 6 + 4) = c · 20 k=1 vilket ger c = 1 20 . b) Enligt formeln för beräkning av väntevärdet för en diskret slumpvariabel får man: E(X) = 4 X k· k=1 1 1 · k(5 − k) = (4 + 12 + 18 + 16) = 2, 5 20 20 c) För variansberäkningen kan man använda sambandet V (X) = E(X 2 ) − (E(X))2 där E(X 2 ) = 4 X k2 · k=1 vilket ger att V (X) = 21 20 1 1 146 (5 − x) = (4 + 24 + 54 + 64) = 20 20 20 = 1.05 och D(X) = q 21 20 = 1.025. Lösning Sannolikhetslära och statistik (lärarprogrammet) , 12 februari 2011 4 Uppgift 4 a) Sannolikheten att en viss av vännerna, t ex Asta får 5 eller fler fiskar är 1 − P (X ≤ 4) där X ∼ P o(5). Från tabellen över Poissonfördelningen får vi P (X ≤ 4) = 0.44 (avrundat till 2 decimaler). Så sannolikheten att Asta får 5 eller fler fiskar är då 1-0.44=0.56. Eftersom man drar upp fiskar oberoende av varandra är antalet som får minst 5 fiskar ∼ Bin(3, 0.56). Sannolikheten att exakt 2 av vännerna får minst 5 fiskar blir 3 2 0.562 · 0.44 = 0.414 b) Sannolikheten att åtminstone två av vännerna får 5 eller fler fiskar var är lika med sannolikheten att exakt två av vännerna får 5 eller fler fiskar plus sannolikheten att alla tre får 5 eller fler fiskar. Till sannolikheten beräknad i a) ska vi alltså lägga till 0.563 = 0.176 som är sannolikheten att alla tre får minst 5 fiskar. Den sökta sannolikheten blir alltså 0.414 + 0.176 = 0.59 Uppgift 5 Edit köper 300 pärlor. Pärlorna räcker om högst 40 är har den tråkiga färgskiftningen. Låt X vara antalet pärlor med färgskiftning. Vi söker sannolikheten P (X ≤ 40). Sannolikhetsfördelningen för X är Bin(n, p) där n = 300 och p = 0.15. Eftersom np(1 − p) = 38.25 är större än 10 är det tillåtet att approximera med normalfördelningen med parametrar µ = np = 45 och p σ = np(1 − p) = 6.185. Ur normalfördelningstabellen får vi 40 − 45 P (X ≤ 40) = Φ 6.185 = Φ(−0.81) = 1 − 0.791 = 0.209 Uppgift 6 a) Ur formelsamlingen har vi att ett konfidensintervall för µx − µy beräknas ur formeln Iµx −µy 1 1 + = x̄ − ȳ ± t(nx − ny − 2)α/2 · s nx ny ! Här är nx = ny = 20, α = 0.05, s2 = s2x + s2y vilket ger t(nx − ny − 2)α/2 = t(38)0.025 = 2.02 (Eftersom t(38)0.025 inte finns i tabellen går vi på t(40)0.025 ). Eftersom nx = ny blir s2 = 1 2 s2x + s2y vilket ger s = 0.104. Lösning Sannolikhetslära och statistik (lärarprogrammet) , 12 februari 2011 5 Vi får konfidensintervallet Iµx −µy = 0.14 ± 0.067 b) Vi kan dra slutsatsen att de två datamängderna skiljer sig signifikant från varandra. Däremot kan vi av skäl som anges i lösningen till uppgift 1 inte av det dra lutsatsen att partikelhalten på Storgatan är värre än på andra ställen i tätorten.