Flerdimensionella stokastiska variabler Flerdimensionella stokastiska variabler Väntevärde • Väntevärde, Korrelation och Kovarians • Flerdimensionell (multivariat -) (multivariat-) normalfördelning Väntevärdet till en funktion av en flerdimensionell stokastisk variabel ∞ E (g ( X , Y )) = ò ò ∞ −∞ −∞ g (x, y ) f X ,Y (x, y )dxdy Exempel: Väntevärdet av X: E (X ) = ∞ ò ò ∞ −∞ −∞ xf X ,Y (x, y )dydx = ò ∞ −∞ xf X (x )dx Korrelation och Kovarians Definition: Korrelationen mellan X och Y definieras som väntevärdet av XY, R XY = E ( XY ) = ∞ ò ò ∞ −∞ −∞ xyf X ,Y (x, y )dydx Definition: Kovariansen mellan X och Y definieras som C XY = Kov ( X , Y ) = E ((X − X )(Y − Y )) Flerdimensionella stokastiska variabler Korrelation och Kovarians Korrelationskoefficienten den normaliserade kovariansen och definieras som: ρ XY = E ((X − X )(Y − Y )) = C XY / σ X σ Y σ XσY −1 ≤ ρ XY ≤ 1 Man kan härleda följande samband mellan korrelationen och kovariansen: C XY = E ((X − X )(Y − Y )) = R XY − XY Två stokastiska variabler är okorrelerade om R XY = E ( X )E (Y ) C XY = 0 Två oberoende variabler är alltid okorrelerade, men det omvända är inte alltid sant. Två stokastiska variabler är ortogonala om R XY = 0 C XY = − E ( X )E (Y ) Flerdimensionella stokastiska variabler Räkneregler V ( X + Y ) = V ( X ) + V (Y ) + 2 Kov( X , Y ) V ( X − Y ) = V ( X ) + V (Y ) − 2 Kov ( X , Y ) V (a1 X 1 + a2 X 2 + a3 X 3 ) = a12 V ( X 1 ) + a22 V ( X 2 ) + a32 V ( X 3 ) + 2 a1a2 Kov( X 1 , X 2 ) + 2 a1a3 Kov ( X 1 , X 3 ) + 2 a2 a3 Kov ( X 2 , X 3 ) ö æ m V ç ai X i ÷ = ÷ ç ø è i =1 å m å a V(X ) + åå 2 i i i =1 ( 2 ai a j Kov X i , X j i< j Kov( X , X ) = V ( X ) Kov(aX , bY ) = abKov( X , Y ) Kov(aX + b, cY + d ) = acKov( X , Y ) Kov(aX + bY , cZ ) = acKov ( X , Z ) + bcKov (Y , Z ) æ m Kovç ai X i , ç è i =1 å n ö m ø i =1 j =1 n å b Y ÷÷ = åå a b Kov(X , Y ) j j j =1 i j i j ) Flerdimensionella stokastiska variabler Betingade fördelningar Flerdimensionella stokastiska variabler Exempel: Två mycket viktiga satser i rörande betingade fördelningar: 3 E(Y ) = E(E(Y | X )) V (Y ) = V (E(Y | X )) + E(V (Y | X )) (Y | X = x )∈ N (0.08 x,1) 1 b c d 4 4 4 2 2 2 2 0 0 0 0 -2 -2 -2 -2 0 5 -4 -5 0 5 4 4 4 2 2 2 2 0 0 0 0 -2 -2 -2 -2 4 -4 -4 -2 0 2 4 -4 -4 4 Kov ( X , Y ) = 0 .4 / 0 .6 = 2 / 3 σ XσY -2 0 2 4 -4 -4 ì X ' = aX í îY ' = bY Så gäller att -4 -5 4 2 3 Observationer 4 0 2 Flerdimensionella stokastiska variabler Om -2 0.1 Kov( X , Y ) = 1 *1 * 0.2 + ( −1)( −1)0.2 = 0.4 Kovarians och korrelation -4 -4 0.2 σ X2 = σ X2 = 1 * 0.3 + 1 * 0.3 = 0.6 Flerdimensionella stokastiska variabler -4 -5 0.1 Blodvolymen i liter givet kroppsvikten. ρ (X ,Y ) = 5 0.2 E ( X ) = 2 * 0.3 + 3 * 0.4 + 4 * 0.3 = 3 E (Y ) = 1 * 0.3 + 2 * 0.4 + 3 * 0.3 = 2 Bestäm E(Y|X=x) och V(Y|X=x). Bestäm E(Y) och V(Y). 0 0.1 Vikten i kilogram. X ∈ N (75,10) -4 -5 0.2 1 Exempel: Blodvolymen hos en människa är starkt korrelerat till kroppsvikten. Man kan anta följande fördelningar: a 0.1 2 0 5 Kov( X ' , Y ' ) = abKov ( X , Y ) ρ ( X ' , Y ' ) = sign( ab) ρ ( X , Y ) Slutsats: Storleken på kovariansen talar inte direkt om hur beroende X och Y är. Däremot gör korrelationskoefficienten det. ì 1 a>0 Om Y = aX + b så är ρ ( X , Y ) = í î− 1 a < 0 -2 0 2 4 a) X och Y oberoende (Ingen korrelation ρ=0) b) X och Y har tendens att avvika åt samma håll (positivt beroende ρ=0.5) c) X och Y avviker åt olika håll (negativt beroende ρ=-0.5) d) samma som b) fast starkare beroende (ρ=0.9) Om X∈Re(-1,1) och Y=X2 så är ρ(X,Y)=0 trots att X och Y är beroende (olinjärt beroende). Flerdimensionella stokastiska variabler Flerdimensionella stokastiska variabler Stokastiska vektorer Stokastiska vektorer Flerdimensionella stokastiska variabler skriver man ofta på vektorform. Linjär transformation av en stokastisk vektor: é X1 ù ú ê X X=ê 2ú ê M ú ú ê ëê X N ûú æ X1 ö ÷ ç ç X2 ÷ X=ç M ÷ ÷ ç çX ÷ è Nø æ a11 a12 ç a 22 ça Y = AX + b = ç 21 M M ç ça è M 1 aM 2 X i = E (X i ) L C1N ù L C2 N ú ú = E (X − X )(X − X )T O M ú ú L C NN û [ a1N öæ X 1 ö ÷ æ b1 ö ÷ç L a 2 N ÷ç X 2 ÷ ç ÷ +ç M ÷ O M ÷ç M ÷ ç ÷ ÷ è bM ø ÷ç L a MN ÷øçè X N ÷ø Sats: Väntevärde och kovariansmatris för den nya Mdimensionella stokastiska vektorn Y ges av: Väntevärdena kan representeras med en (Nx1)vektor (väntevärdesvektorn). Alla kombinationer av kovarianser (och varianser) representeras av den så kallade kovariansmatrisen. é C11 C12 êC C22 C X = ê 21 ê M M ê ëC N 1 C N 2 L Y = E (Y ) = E (AX + b ) = AX + b C Y = AC X A T ] æ 1 0 .6 ö Exempel: Y = çç ÷÷ X è 0.6 1 ø där æ æ 3ö æ 2 0 ö ö ÷÷ ÷÷ X ∈ N çç çç ÷÷, çç è è 3ø è 0 2 ø ø æ 1 0.6 öæ 3 ö æ 4.8 ö ÷÷çç ÷÷ = çç ÷÷ Y = AX = çç è 0.6 1 øè 3 ø è 4.8 ø æ 1 0.6 öæ 2 0 öæ 1 0.6 ö æ 2.72 2.4 ö ÷÷çç ÷÷çç ÷÷ = çç ÷÷ C Y = AC X A T = çç è 0.6 1 øè 0 2 øè 0.6 1 ø è 2.4 2.72 ø OBS! Kovariansmatrisen är alltid symmetrisk. Flerdimensionella stokastiska variabler Multivariat Normalfördelning Flerdimensionella stokastiska variabler Multivariat Normalfördelning En stokastisk variabel med täthetsfunktion på formen: − f X ,Y (x, y ) = e 1 2 1− ρ 2 ( æ æ x −m çç X çç σ X èè ) 2 ö æ y − mY ÷÷ + çç ø è σY 2 ö 2 ρ ( x − m X )( y − m ) ö÷ ÷÷ − ÷ σ XσY ø ø 2πσ X σ Y 1 − ρ 2 •Om en normalfördelning är okorrelerad så är den också oberoende. •Varje marginalfördelning till en normalfördelning är en normalfördelning. •Varje linjär transformation av en normalfördelning är en normalfördelning. •En normalfördelning bestäms av väntevärdesvektorn och kovariansmatrisen. kallas för en tvådimensionell normalfördelad variabel. En N-dimensionell normalfördelad variabel har täthetsfunktion på formen: f X ,Y (x, y ) = 1 (2π )N C där é X1 ù é X1 ù ú ê êX ú X X=ê 2ú X=ê 2ú ê M ú ê M ú ú ê ê ú ëX N û ëê X N ûú e − ( ) ( T 1 X − X C −1 X − X 2 é C11 C12 êC C22 C = ê 21 ê M M ê C C N2 ë N1 ( ) L C1N ù L C2 N ú ú O M ú ú L C NN û ( Cij = E (X i − X i ) X j − X j Några egenskaper hos normalfördelningen )) Flerdimensionella stokastiska variabler Multivariat Normalfördelning Några egenskaper hos normalfördelningen •Om en normalfördelning är okorrelerad så är den också oberoende. •Varje marginalfördelning till en normalfördelning är en normalfördelning. •Varje linjär transformation av en normalfördelning är en normalfördelning. •En normalfördelning bestäms av väntevärdesvektorn och kovariansmatrisen.