STOKASTISKA VARIABLER DISKRETA STOKASTISKA VARIABLER

Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
STOKASTISKA VARIABLER
Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).
Definition 1. En reellvärld funktion definierad på ett utfallsrum Ω kallas en (endimensionell)
stokastisk variabel.
Stokastiska variabler betecknas oftast med versaler X, Y, Z,... eller med grekiska bokstäver,
ξ (ksi eller xi) ,
η (eta) , ζ (zeta).
Exempel: I en låda finns fem lappar med talet 40, tre lappar markerade med 80 och 12
lappar markerade med 90. Vi tar ut en lapp på måfå. Möjliga utfall är följande reella tal 40,
80 ,90. Vi betecknar resultat med X. Då är X en stokastisk variabel.
Sannolikheten att X får värdet x betecknar vi med P(X=x).
T ex P(X=40)=5/20 eller P(X=80)=3/20. I det här fallet (ändligt antal möjliga utfall) kan vi
ange alla möjliga resultat med motsvarande sannolikheter:
X
P(X=x)
40
5/20
80
3/20
90
12/20
DISKRETA STOKASTISKA VARIABLER
Definition 2 En stokastisk variabel kallas DISKRET om den antar numrerbart
(=uppräkneligt) antal olika värden.
Sannolikhetsfördelning för en diskret stokastisk variabel oftast anges med en tabell:
ξ
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯)
π‘₯π‘₯1
𝑝𝑝1
π‘₯π‘₯2
𝑝𝑝2
…
…
π‘₯π‘₯π‘˜π‘˜
π‘π‘π‘˜π‘˜
…
…
οΏ½ π‘π‘π‘˜π‘˜ = 1
π‘˜π‘˜
Definition 3. Låt ξ vara en diskret stokastisk variabel. Funktionen p( x ) = P(x = x ) kallas
sannolikhetsfunktionen till ξ .
1 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
Definition 4. Låt πœ‰πœ‰ vara en diskret stokastisk variabel. Följande funktion
𝐹𝐹(π‘₯π‘₯) = 𝑃𝑃(πœ‰πœ‰ ≤ π‘₯π‘₯)
kallas fördelningsfunktionen för πœ‰πœ‰.
För en diskret s.v. kan fördelningsfunktionen bestämmas genom att addera alla p k för de x k
som är mindre eller lika med x:
F ( x) =
∑ p( x
k
)
xk ≤ x
==========================================================
VÄNTEVÄRDE OCH VARIANS för diskreta s.v.
VÄNTEVÄRDET för en diskret s.v. ξ betecknas m, µ eller 𝐸𝐸(πœ‰πœ‰) , och definieras som
där π‘π‘π‘˜π‘˜ = 𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯π‘˜π‘˜ )
𝐸𝐸(πœ‰πœ‰) = οΏ½ π‘₯π‘₯π‘˜π‘˜ βˆ™ π‘π‘π‘˜π‘˜
π‘˜π‘˜
VARIANSEN för en diskret s.v. ξ betecknas 𝑉𝑉(πœ‰πœ‰) , Var, 𝜎𝜎 2 eller
𝑉𝑉(πœ‰πœ‰) = οΏ½(π‘₯π‘₯π‘˜π‘˜ − π‘šπ‘š)2 βˆ™ π‘π‘π‘˜π‘˜
𝑠𝑠 2 och definieras som
π‘˜π‘˜
STANDARDAVVIKELSEN för en diskret s.v. ξ betecknas 𝜎𝜎 eller s och definieras som
𝜎𝜎 = √𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉
2 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
NÅGRA VIKTIGA DISKRETA FÖRDELNINGAR
Fördelning
Sannolikhetsfunk.
P (x = x)
Väntevärde
Varians
Binomial
Bin(n,p)
n x
 ο£·ο£· p (1 − p ) n − x
ο£­ xο£Έ
x = 0,1,..., n
λx
e −λ ⋅
x!
x = 0, 1, 2, 3...
np
np (1 − p )
λ
λ
 N 1  N 2 
 
ο£·ο£·
ο£­ x ο£Έο£­ n − x ο£Έ
N
 
ο£­nο£Έ
np
np (1 − p )( N − n)
N −1
Poisson
Po(λ )
Hypergeometrisk
Hyp(N,n,p)
N=N 1 +N 2
𝑝𝑝 = 𝑁𝑁1 /𝑁𝑁
========================================================
ÖVNINGSUPPGIFTER
Uppgift 1.
I nedanstående tabell finns sannolikhetsfördelning för en diskret stokastisk variabel ξ.
π‘₯π‘₯1 π‘₯π‘₯2 π‘₯π‘₯3 π‘₯π‘₯4 π‘₯π‘₯5
3
4
5
8 10
ξ
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) 0.2 0.1 0.3 0.1 0.3
a) Bestäm väntevärdet och variansen och standardavvikelsen för ξ.
b) Rita stolpdiagrammet för tillhörande sannolikhetsfunktion 𝑝𝑝(π‘₯π‘₯) = 𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) .
c) Bestäm och rita grafen till fördelningsfunktion 𝐹𝐹(π‘₯π‘₯) = 𝑃𝑃(πœ‰πœ‰ ≤ π‘₯π‘₯).
d) Beräkna följande sannolikheter:
P ( 4 ≤ ξ ≤ 8) ,
P ( 4 < ξ ≤ 8) , P ( 4 ≤ ξ < 8) , P ( 4 < ξ < 8) ,
P(ξ ≤ 8) ,
P(ξ < 8) , P( 4 < ξ ) ,
P( 4 ≤ ξ ) ,
P(ξ ≤ 10) , P(ξ > 10) , P(ξ ≤ −3) , P(ξ > −3) .
Lösning:
a) VÄNTEVÄRDET:
π’Žπ’Ž = 𝐸𝐸( πœ‰πœ‰) = οΏ½ π‘₯π‘₯π‘˜π‘˜ βˆ™ π‘π‘π‘˜π‘˜ = 3 βˆ™ 0.2 + 4 βˆ™ 0.1 + 5 βˆ™ 0.3 + 8 βˆ™ 0.1 + 10 βˆ™ 0.3 = 6.3
π‘˜π‘˜
3 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
VARIANSEN: V(ξ) = ∑π‘˜π‘˜(π‘₯π‘₯π‘˜π‘˜ − π‘šπ‘š)2 βˆ™ π‘π‘π‘˜π‘˜ =
(3 − 6.3) 2 βˆ™ 0.2 + (4 − 6.3) 2 βˆ™ 0.1 + (5 − 6.3) 2 βˆ™ 0.3 + (8 − 6.3) 2 βˆ™ 0.1 + (10 − 6.3) 2 βˆ™ 0.3 = 7.61
STANDARDAVVIKELSEN :
𝜎𝜎 = √𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 = √7.61 = 2.7586
b) Grafen till sannolikhetsfunktionen 𝑝𝑝(π‘₯π‘₯)
(stolpdiagram)
0,4
0,3
0,2
0,1
0
3
4
5
8
10
c) Fördelningsfunktion 𝐹𝐹(π‘₯π‘₯) = 𝑃𝑃(πœ‰πœ‰ ≤ π‘₯π‘₯) bestäms av kumulativa sannolikheter:
ο£± 0
 0.2

 0.3
F ( x) = ο£²
 0.6
0.7

ο£³ 1
om x < 3
om 3 ≤ x < 4
om 4 ≤ x < 5
om 5 ≤ x < 8
om 8 ≤ x < 10
om 10 ≤ x
4 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
d) Från tabellen
ξ
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯)
π‘₯π‘₯1 π‘₯π‘₯2
π‘₯π‘₯3
π‘₯π‘₯4
π‘₯π‘₯5
3
4
5
8 10
0.2 0.1 0.3 0.1 0.3
får vi:
P( 4 ≤ ξ ≤ 8) = 0.1 + 0.3 + 0.1 = 0.5 ,
P( 4 < ξ ≤ 8) = 0.3 + 0.1 = 0.4 ,
P( 4 ≤ ξ < 8) = 0.1 + 0.3 = 0.4 ,
P( 4 < ξ < 8) = 0.3 ,
P(ξ ≤ 8) = 0.2 + 0.1 + 0.3 + 0.1 = 0.7 ,
P(ξ < 8) = 0.2 + 0.1 + 0.3 = 0.6 ,
P( 4 < ξ ) = 0.3 + 0.1 + 0,3 = 0.7 ,
P( 4 ≤ ξ ) = 0.1 + 0.3 + 0.1 + 0.3 = 0.8 ,
P(ξ ≤ 10) = 1 ,
P(ξ > 10) = 0 ,
P(ξ ≤ −3) = 0 ,
P(ξ > −3) = 1 .
Uppgift 2. (Hypergeometrisk fördelning)
Bland 15 produkter finns 5 defekta. Man väljer på måfå 4 produkter.
Bestäm sannolikheten att få
a) ingen defekt
b) exakt en defekt
c) minst en defekt.
5 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
Lösning:
a)
οΏ½50οΏ½ βˆ™ οΏ½10
οΏ½
4
οΏ½15
οΏ½
4
b)
=
οΏ½51οΏ½ βˆ™ οΏ½10
οΏ½
3
c)
𝟏𝟏 −
οΏ½15
οΏ½
4
οΏ½
οΏ½50οΏ½ βˆ™ οΏ½10
4
οΏ½15
οΏ½
4
2
= 0.1538
13
= 0.43956
= 𝟏𝟏 −
2
= 0.8462
13
Binomialfördelning
Låt A vara en händelse som inträffar med sannolikheten p vid ett försök.
𝐴𝐴
𝐴𝐴𝐢𝐢
𝑃𝑃(𝐴𝐴) = 𝑝𝑝
𝑃𝑃(𝐴𝐴𝐢𝐢 ) = π‘žπ‘ž (= 1 − 𝑝𝑝)
Vi upprepar försöket n gånger och kollar hur många gånger A inträffar.
Låt ξ vara antalet gånger A inträffar vid n försök.
Då gäller
𝑛𝑛
𝑛𝑛−π‘₯π‘₯
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) = οΏ½ οΏ½ 𝑝𝑝π‘₯π‘₯ (1 − 𝑝𝑝)
,
π‘₯π‘₯
π‘₯π‘₯ = 0, 1, β‹― , 𝑛𝑛.
Vi säger att variabeln ξ är binomialfördelad med parametrar n och p och betecknar
Man betecknar ofta 1
πœ‰πœ‰ ∈ 𝐡𝐡𝐡𝐡𝐡𝐡(𝑛𝑛, 𝑝𝑝).
− 𝑝𝑝 = π‘žπ‘ž. Föregående formel kan då skrivas kortare
𝑛𝑛
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) = οΏ½ οΏ½ 𝑝𝑝π‘₯π‘₯ π‘žπ‘žπ‘›π‘›−π‘₯π‘₯ ,
π‘₯π‘₯
π‘₯π‘₯ = 0, 1, β‹― , 𝑛𝑛.
För en binomialfördelad s. v. ξ med parametrar n (antalet upprepningar av ett försök A) och
p (sannolikheten för ett försök A) gäller följande formler
Väntevärdet:
E(ξ) =np
6 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
Variansen:
V(ξ) =npq
och standardavvikelsen: σ = npq
Uppgift 3. (Binomialfördelning)
Vi planerar att producera 10 st produkter i en maskin. Sannolikheten för att en produkt blir
defekt är 5%.
Bestäm sannolikheten att få
a) exakt 1 defekt produkt
b) högst 1 defekt produkt
c) minst 1 defekt
d) ingen defekt
e) alla defekta
Lösning: Antalet defekta är en s. v. som vi betecknar med ξ .
Variabeln är binomialfördelad med parametrar
𝑛𝑛 = 10 och 𝑝𝑝 = 0.05 ( och π‘žπ‘ž = 1 − 𝑝𝑝 = 0.95),
som vi betecknar ξ ∈ Bin(10, 0.05)
a) Sannolikheten att få exakt 1 defekt produkt är
𝑝𝑝1 = 𝑃𝑃(πœ‰πœ‰ = 1) = οΏ½
10 1 9
οΏ½ 𝑝𝑝 π‘žπ‘ž = 0.3151
1
b) Sannolikheten för högst 1 defekt produkter är 𝑝𝑝0 + 𝑝𝑝1 där
𝑝𝑝0 = 𝑃𝑃(πœ‰πœ‰ = 0) = οΏ½
(𝑝𝑝1 har vi beräknat i a)
Därför 𝑝𝑝0 + 𝑝𝑝1 = 0.9139
c) 𝑃𝑃( π‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘š 𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑) = 𝑝𝑝1 + 𝑝𝑝2 + β‹― 𝑝𝑝𝑛𝑛
Eftersom 𝑝𝑝0 + 𝑝𝑝1 + 𝑝𝑝2 + β‹― 𝑝𝑝𝑛𝑛 = 1 har vi
10 0 10
οΏ½ 𝑝𝑝 π‘žπ‘ž = 0.5987
0
𝑃𝑃( π‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘šπ‘š 𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑) = 𝑝𝑝1 + 𝑝𝑝2 + β‹― 𝑝𝑝𝑛𝑛 = 1 − 𝑝𝑝0 = 1 − 0.5987 = 0.4013
d) Sannolikheten för ingen defekt är
𝑝𝑝0 = 𝑃𝑃(πœ‰πœ‰ = 0) = οΏ½
e) Sannolikheten för alla defekta är
𝑝𝑝10 = 𝑃𝑃(πœ‰πœ‰ = 10) = οΏ½
10 0 10
οΏ½ 𝑝𝑝 π‘žπ‘ž = 0.5987
0
10 10 0
οΏ½ 𝑝𝑝 π‘žπ‘ž = 9.766 βˆ™ 10−14
10
Poissonfördelning.
Poissonfördelningen används oftast i modeller som beskriver antalet oberoende händelser
under ett tidsintervall.
Om för en stokastisk variabel ξ gäller
π‘₯π‘₯
πœ†πœ†
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) = π‘₯π‘₯! 𝑒𝑒−πœ†πœ† ,
𝑑𝑑äπ‘Ÿπ‘Ÿ π‘₯π‘₯ = 0, 1, 2, 3, ….
7 av 8
Armin Halilovic: EXTRA ÖVNINGAR
Diskreta fördelningar
då säger vi att ξ är Poissonfördelad med parameter πœ†πœ† och skriver πœ‰πœ‰ ∈ 𝑃𝑃𝑃𝑃(πœ†πœ†).
För en Poissonfördelad s. v. med parameter πœ†πœ† gäller följande formler
Väntevärdet:
E(ξ) = λ
Variansen:
V(ξ) = λ
och standardavvikelsen: 𝜎𝜎 = √πœ†πœ†
==============================
APPROXIMATION av Bin(n,p) med 𝑃𝑃𝑃𝑃(πœ†πœ†).
Om n är stor och p litet ( tumregel 𝑛𝑛 > 10, 𝑝𝑝 < 0.1) i en binomialfördelning Bin(n,p) då
kan fördelningen Bin(n,p) approximeras med Poissonfördelningen 𝑃𝑃𝑃𝑃(πœ†πœ†) med πœ†πœ† = 𝑛𝑛𝑛𝑛.
Uppgift 4. (Poissonfördelning)
Till en telefonväxel ankommer i genomsnitt 90 anrop per timme. Vi antar att ankomster är
Poissonfördelade. Bestäm sannolikheten att exakt 2 anrop kommer under ett tidsintervall som
är en minut långt.
Lösning.
Viktigt: Parameter λ i en Poissonfördelad s.v. ξ är lika med väntevärdet E(ξ).
Vi har i genomsnitt 90 ankomster per timme och därför 90/60=1.5 ankomster per minut.
Vi betecknar antalet ankomster per minut med λ. Då är πœ‰πœ‰ ∈ 𝑃𝑃𝑃𝑃(πœ†πœ†).
där λ = 1.5 ankomster per minut. Vi använder formeln
π‘₯π‘₯
πœ†πœ† −πœ†πœ†
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) =
𝑒𝑒 ,
och substituerar πœ†πœ† = 1.5 och π‘₯π‘₯ = 2.
π‘₯π‘₯!
1.52 −1.5
𝑃𝑃(πœ‰πœ‰ = 2) =
𝑒𝑒
= 0.2510
2!
Uppgift 5. (APPROXIMATION. Binomialfördelning, Poissonfördelning)
Man ska tillverka 1000 produkter. Vad är sannolikheten att få exakt 2 defekta produkter
bland 1000, om felsannolikheten (sannolikheten att en produkt blir defekt) är 0.003.
Lösning:
Låt πœ‰πœ‰ beteckna antalet defekta produkter. Då gäller
πœ‰πœ‰ ∈ 𝐡𝐡𝐡𝐡𝐡𝐡(1000,0.003).
Metod 1. Vi beräknar sannolikheten direkt (binomialfördelningen)
dvs
𝑛𝑛
𝑛𝑛−π‘₯π‘₯
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) = οΏ½ οΏ½ 𝑝𝑝π‘₯π‘₯ (1 − 𝑝𝑝)
,
π‘₯π‘₯
π‘₯π‘₯ = 0, 1, β‹― , 𝑛𝑛.
1000 2
οΏ½ 𝑝𝑝 (1 − 𝑝𝑝)998 = 0.2242
2
Metod 2. Vi kan approximera sannolikheten med hjälp av Poissonfördelningen med
parameter λ=np=1000·0.003=3.
𝑝𝑝2 = οΏ½
𝑃𝑃(πœ‰πœ‰ = π‘₯π‘₯) ≈
πœ†πœ†π‘₯π‘₯ −πœ†πœ†
32 −3
𝑒𝑒
=
𝑒𝑒 = 0.2240
π‘₯π‘₯!
2!
8 av 8