ò ò ò ò ò ò ò åå åå åå å å

Flerdimensionella stokastiska variabler
Flerdimensionella stokastiska variabler
Väntevärde
• Väntevärde, Korrelation och Kovarians
• Flerdimensionell (multivariat
-)
(multivariat-)
normalfördelning
Väntevärdet till en funktion av en flerdimensionell
stokastisk variabel
∞
E (g ( X , Y )) =
ò ò
∞
−∞ −∞
g (x, y ) f X ,Y (x, y )dxdy
Exempel: Väntevärdet av X:
E (X ) =
∞
ò ò
∞
−∞ −∞
xf X ,Y (x, y )dydx =
ò
∞
−∞
xf X (x )dx
Korrelation och Kovarians
Definition: Korrelationen mellan X och Y definieras som
väntevärdet av XY,
R XY = E ( XY ) =
∞
ò ò
∞
−∞ −∞
xyf X ,Y (x, y )dydx
Definition: Kovariansen mellan X och Y definieras som
C XY = Kov ( X , Y ) = E ((X − X )(Y − Y ))
Flerdimensionella stokastiska variabler
Korrelation och Kovarians
Korrelationskoefficienten den normaliserade kovariansen
och definieras som:
ρ XY =
E ((X − X )(Y − Y ))
= C XY / σ X σ Y
σ XσY
−1 ≤ ρ XY ≤ 1
Man kan härleda följande samband mellan korrelationen
och kovariansen:
C XY = E ((X − X )(Y − Y )) = R XY − XY
Två stokastiska variabler är okorrelerade om
R XY = E ( X )E (Y )
C XY = 0
Två oberoende variabler är alltid okorrelerade, men det
omvända är inte alltid sant.
Två stokastiska variabler är ortogonala om
R XY = 0
C XY = − E ( X )E (Y )
Flerdimensionella stokastiska variabler
Räkneregler
V ( X + Y ) = V ( X ) + V (Y ) + 2 Kov( X , Y )
V ( X − Y ) = V ( X ) + V (Y ) − 2 Kov ( X , Y )
V (a1 X 1 + a2 X 2 + a3 X 3 ) =
a12 V ( X 1 ) + a22 V ( X 2 ) + a32 V ( X 3 ) + 2 a1a2 Kov( X 1 , X 2 )
+ 2 a1a3 Kov ( X 1 , X 3 ) + 2 a2 a3 Kov ( X 2 , X 3 )
ö
æ m
V ç ai X i ÷ =
÷
ç
ø
è i =1
å
m
å a V(X ) + åå
2
i
i
i =1
(
2 ai a j Kov X i , X j
i< j
Kov( X , X ) = V ( X )
Kov(aX , bY ) = abKov( X , Y )
Kov(aX + b, cY + d ) = acKov( X , Y )
Kov(aX + bY , cZ ) = acKov ( X , Z ) + bcKov (Y , Z )
æ m
Kovç ai X i ,
ç
è i =1
å
n
ö
m
ø
i =1 j =1
n
å b Y ÷÷ = åå a b Kov(X , Y )
j j
j =1
i j
i
j
)
Flerdimensionella stokastiska variabler
Betingade fördelningar
Flerdimensionella stokastiska variabler
Exempel:
Två mycket viktiga satser i rörande betingade fördelningar:
3
E(Y ) = E(E(Y | X ))
V (Y ) = V (E(Y | X )) + E(V (Y | X ))
(Y | X = x )∈ N (0.08 x,1)
1
b
c
d
4
4
4
2
2
2
2
0
0
0
0
-2
-2
-2
-2
0
5
-4
-5
0
5
4
4
4
2
2
2
2
0
0
0
0
-2
-2
-2
-2
4
-4
-4
-2
0
2
4
-4
-4
4
Kov ( X , Y )
= 0 .4 / 0 .6 = 2 / 3
σ XσY
-2
0
2
4
-4
-4
ì X ' = aX
í
îY ' = bY
Så gäller att
-4
-5
4
2
3
Observationer
4
0
2
Flerdimensionella stokastiska variabler
Om
-2
0.1
Kov( X , Y ) = 1 *1 * 0.2 + ( −1)( −1)0.2 = 0.4
Kovarians och korrelation
-4
-4
0.2
σ X2 = σ X2 = 1 * 0.3 + 1 * 0.3 = 0.6
Flerdimensionella stokastiska variabler
-4
-5
0.1
Blodvolymen i liter
givet kroppsvikten.
ρ (X ,Y ) =
5
0.2
E ( X ) = 2 * 0.3 + 3 * 0.4 + 4 * 0.3 = 3
E (Y ) = 1 * 0.3 + 2 * 0.4 + 3 * 0.3 = 2
Bestäm E(Y|X=x) och V(Y|X=x).
Bestäm E(Y) och V(Y).
0
0.1
Vikten i kilogram.
X ∈ N (75,10)
-4
-5
0.2
1
Exempel: Blodvolymen hos en människa är starkt
korrelerat till kroppsvikten. Man kan anta följande
fördelningar:
a
0.1
2
0
5
Kov( X ' , Y ' ) = abKov ( X , Y )
ρ ( X ' , Y ' ) = sign( ab) ρ ( X , Y )
Slutsats: Storleken på kovariansen talar inte direkt om
hur beroende X och Y är. Däremot gör
korrelationskoefficienten det.
ì 1 a>0
Om Y = aX + b så är ρ ( X , Y ) = í
î− 1 a < 0
-2
0
2
4
a) X och Y oberoende (Ingen korrelation ρ=0)
b) X och Y har tendens att avvika åt samma håll (positivt
beroende ρ=0.5)
c) X och Y avviker åt olika håll (negativt beroende ρ=-0.5)
d) samma som b) fast starkare beroende (ρ=0.9)
Om X∈Re(-1,1) och Y=X2 så är ρ(X,Y)=0 trots att
X och Y är beroende (olinjärt beroende).
Flerdimensionella stokastiska variabler
Flerdimensionella stokastiska variabler
Stokastiska vektorer
Stokastiska vektorer
Flerdimensionella stokastiska variabler skriver
man ofta på vektorform.
Linjär transformation av en stokastisk vektor:
é X1 ù
ú
ê
X
X=ê 2ú
ê M ú
ú
ê
ëê X N ûú
æ X1 ö
÷
ç
ç X2 ÷
X=ç
M ÷
÷
ç
çX ÷
è Nø
æ a11 a12
ç
a 22
ça
Y = AX + b = ç 21
M
M
ç
ça
è M 1 aM 2
X i = E (X i )
L C1N ù
L C2 N ú
ú = E (X − X )(X − X )T
O
M ú
ú
L C NN û
[
a1N öæ X 1 ö
÷ æ b1 ö
֍
L a 2 N ÷ç X 2 ÷ ç ÷
+ç M ÷
O
M ÷ç M ÷ ç ÷
÷ è bM ø
֍
L a MN ÷øçè X N ÷ø
Sats: Väntevärde och kovariansmatris för den nya Mdimensionella stokastiska vektorn Y ges av:
Väntevärdena kan representeras med en (Nx1)vektor (väntevärdesvektorn). Alla kombinationer
av kovarianser (och varianser) representeras av
den så kallade kovariansmatrisen.
é C11 C12
êC
C22
C X = ê 21
ê M
M
ê
ëC N 1 C N 2
L
Y = E (Y ) = E (AX + b ) = AX + b
C Y = AC X A T
]
æ 1 0 .6 ö
Exempel: Y = çç
÷÷ X
è 0.6 1 ø
där
æ æ 3ö æ 2 0 ö ö
÷÷ ÷÷
X ∈ N çç çç ÷÷, çç
è è 3ø è 0 2 ø ø
æ 1 0.6 öæ 3 ö æ 4.8 ö
÷÷çç ÷÷ = çç ÷÷
Y = AX = çç
è 0.6 1 øè 3 ø è 4.8 ø
æ 1 0.6 öæ 2 0 öæ 1 0.6 ö æ 2.72 2.4 ö
÷÷çç
÷÷çç
÷÷ = çç
÷÷
C Y = AC X A T = çç
è 0.6 1 øè 0 2 øè 0.6 1 ø è 2.4 2.72 ø
OBS! Kovariansmatrisen är alltid symmetrisk.
Flerdimensionella stokastiska variabler
Multivariat Normalfördelning
Flerdimensionella stokastiska variabler
Multivariat Normalfördelning
En stokastisk variabel med täthetsfunktion på formen:
−
f X ,Y (x, y ) =
e
1
2 1− ρ 2
(
æ æ x −m
çç
X
çç σ X
èè
)
2
ö æ y − mY
÷÷ + çç
ø è σY
2
ö 2 ρ ( x − m X )( y − m ) ö÷
÷÷ −
÷
σ XσY
ø
ø
2πσ X σ Y 1 − ρ 2
•Om en normalfördelning är okorrelerad så är den också
oberoende.
•Varje marginalfördelning till en normalfördelning är en
normalfördelning.
•Varje linjär transformation av en normalfördelning är en
normalfördelning.
•En normalfördelning bestäms av väntevärdesvektorn och
kovariansmatrisen.
kallas för en tvådimensionell normalfördelad variabel.
En N-dimensionell normalfördelad variabel har
täthetsfunktion på formen:
f X ,Y (x, y ) =
1
(2π )N C
där
é X1 ù
é X1 ù
ú
ê
êX ú
X
X=ê 2ú X=ê 2ú
ê M ú
ê M ú
ú
ê
ê
ú
ëX N û
ëê X N ûú
e
−
(
)
(
T
1
X − X C −1 X − X
2
é C11 C12
êC
C22
C = ê 21
ê M
M
ê
C
C
N2
ë N1
(
)
L C1N ù
L C2 N ú
ú
O
M ú
ú
L C NN û
(
Cij = E (X i − X i ) X j − X j
Några egenskaper hos normalfördelningen
))
Flerdimensionella stokastiska variabler
Multivariat Normalfördelning
Några egenskaper hos normalfördelningen
•Om en normalfördelning är okorrelerad så är den också
oberoende.
•Varje marginalfördelning till en normalfördelning är en
normalfördelning.
•Varje linjär transformation av en normalfördelning är en
normalfördelning.
•En normalfördelning bestäms av väntevärdesvektorn och
kovariansmatrisen.