STG220
Föreläsning 10
Felspecificerade modeller
• Om den verkliga modellen är
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝜀
men vi passar modellen
𝑦 = 𝛼0 + 𝛼1 𝑥1 + 𝛿
så är den passade modellen felspecificerad
Felspecificerade modeller
• Om vi använder felspecificerade modeller kan
olika problem uppstå
• Om 𝑥1 och 𝑥2 är korrelerade så kommer inte OLSskattningarna av 𝛼0 och 𝛼1 vara
väntevärdesriktiga
• Om 𝑥1 och 𝑥2 inte är korrelerade så kommer inte
OLS-skattningen av 𝛼0 vara väntevärdesriktig
Att testa om en modell är
felspecificerad
• Ett test som kan användas kallas RamseyRESET-test, där RESET står för Regression
Equation Specification Error Test
• Intuitionen är att om modellen är
felspecificerad så kommer man se mönster i
residualerna
• Mönster är inte alltid så lätta att se…
Ramsey RESET
• Steg 1: OLS-skatta regressionsmodellen, t ex
𝑦 = 𝛼0 + 𝛼1 𝑥1 + 𝛿
• Steg 2: Spara prediktionerna
𝑦 = 𝑎0 + 𝑎1 𝑥1
• Steg 3: OLS-skatta modellen
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑦 2 + 𝛽3 𝑦 3 + 𝜀
Ramsey RESET
• Nollhypotesen är att modellen vi passade i
steg 1 är korrekt specificerad, alltså
𝐻0 : 𝛽2 = 𝛽3 = 0
• Vi kan uttrycka modellerna och hypotesen
med matriser på liknande sätt som vi gjorde
för Breusch-Pagan och Breusch-Godfrey
Ramsey RESET
• Modellen
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑦 2 + 𝛽3 𝑦 3 + 𝜀
blir på matrisform
𝑦 = 𝑍′𝛽 + 𝜀
1
där 𝑍 ′ = ⋮
1
𝑥11
⋮
𝑥1𝑛
𝑦1
⋮
𝑦𝑛
2
2
𝑦1
⋮
𝑦𝑛
3
3
𝛽0
𝜀1
𝛽1
,𝛽 =
och 𝜀 = ⋮
𝛽2
𝜀𝑛
𝛽3
Ramsey RESET
• Nollhypotesen kan vi skriva
𝐾′𝛽 = 0
0
där 𝐾 =
0
′
0 1
0 0
0
1
Ramsey RESET
• Testfunktionen blir den 𝐹 𝑟𝑎𝑛𝑘 𝐾 , 𝑛 − 𝑟𝑎𝑛𝑘 𝑍 fördelade kvoten
𝑄/𝑟𝑎𝑛𝑘 𝐾
𝑆𝑆𝐸/ 𝑛 − 𝑟𝑎𝑛𝑘 𝑍
där 𝑄 = 𝐾 ′ 𝑏 ′ 𝐾′ 𝑍 ′ 𝑍 −1 𝐾
OLS-skattningarna av 𝛽 och
−1
𝐾 ′ 𝑏, där 𝑏 är
𝑆𝑆𝐸 = 𝑦 − 𝑍 ′ 𝑏 ′ 𝑦 − 𝑍 ′ 𝑏
Exempel
• Det här är ett lätt överdrivet och påhittat
exempel, bara för att illustrera vad som kan
hända
• Den riktiga modellen är
𝑦 = 100 + 10𝑥 − 0.4𝑥 2 + 𝜀
där 𝜀~𝑁 0,5 och stickprovsdata för 20
observationer har genererats i Excel
Exempel
Exempel
• Vi tror att modellen som ska passas är
𝑦 = 𝛼0 + 𝛼1 𝑥 + 𝜀
och OLS-skattar koefficienterna med PROC REG
Exempel
• För att kunna göra RESET-testet så skapar vi
kvadrater och kuber av predikterade värden
• För själva testet använder vi PROC AUTOREG
Exempel
• Outputen från testet är
• Detta betyder att vi ska förkasta nollhypotesen
och att modellen är felspecificerad
Att avhjälpa problemet
• Att man får ett signifikant RESET-test kan bero
på att
• Modellen är underspecificerad, alltså att man
”glömt” variabler som borde vara med
• Att data är autokorrelerade
• Att man har fel funktionell form, som i vårt
exempel där vi passade en rät linje till data
från en kvadratisk modell
Att avhjälpa problemet
• Det är alltid en bra idé att göra scatter plots
innan man börjar passa modeller och kolla i
litteraturen vilka funktionella samband som
bör gälla och vilka variabler som bör
inkluderas i modellerna
• Om man tänker efter från början så minskar
risken att få ett signifikant RESET-test…
PROC IML
• I PROC IML kan man bland annat skapa och
göra olika operationer på matriser
• Vi kanske vill skriva ett program som skapar
matriserna 𝑎 = 2 3 4 ′, 𝑏 = 1 4 7 ′,
′
2 3 4
slår samman dessa till 𝑐 =
och
1 4 7
2 3 4
transponerar 𝑐 till 𝑑 =
1 4 7
PROC IML
• Programmet skulle kunna se ut så här
• Om vi vill kolla att vi ”gör rätt” så kan vi lägga
till rader med ”print” för att få ut det vi gör
som resultatutskrifter
PROC IML
• Vi kan även invertera och plocka ut element ur
matriser
Loopar
• Vi har sett att man kan göra DO-loopar i
datasteg
• Det kan man göra i PROC IML med
• Vi kanske vill skapa en kolonnvektor med
heltalen från 3 till och med 12
Att läsa in data i PROC IML
• Om vi har ett dataset i work så kan vi plocka in
det, eller delar av det, i PROC IML
• Vi kanske vill ta outputen från den
felspecificerade regressionen vi gjorde i
exemplet ovan och utföra RESET-testet i PROC
IML
Skapa Z-matrisen
Koefficientskattningar och SSE
Konstruera och utföra testet