STG220 Föreläsning 10 Felspecificerade modeller • Om den verkliga modellen är 𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝜀 men vi passar modellen 𝑦 = 𝛼0 + 𝛼1 𝑥1 + 𝛿 så är den passade modellen felspecificerad Felspecificerade modeller • Om vi använder felspecificerade modeller kan olika problem uppstå • Om 𝑥1 och 𝑥2 är korrelerade så kommer inte OLSskattningarna av 𝛼0 och 𝛼1 vara väntevärdesriktiga • Om 𝑥1 och 𝑥2 inte är korrelerade så kommer inte OLS-skattningen av 𝛼0 vara väntevärdesriktig Att testa om en modell är felspecificerad • Ett test som kan användas kallas RamseyRESET-test, där RESET står för Regression Equation Specification Error Test • Intuitionen är att om modellen är felspecificerad så kommer man se mönster i residualerna • Mönster är inte alltid så lätta att se… Ramsey RESET • Steg 1: OLS-skatta regressionsmodellen, t ex 𝑦 = 𝛼0 + 𝛼1 𝑥1 + 𝛿 • Steg 2: Spara prediktionerna 𝑦 = 𝑎0 + 𝑎1 𝑥1 • Steg 3: OLS-skatta modellen 𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑦 2 + 𝛽3 𝑦 3 + 𝜀 Ramsey RESET • Nollhypotesen är att modellen vi passade i steg 1 är korrekt specificerad, alltså 𝐻0 : 𝛽2 = 𝛽3 = 0 • Vi kan uttrycka modellerna och hypotesen med matriser på liknande sätt som vi gjorde för Breusch-Pagan och Breusch-Godfrey Ramsey RESET • Modellen 𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑦 2 + 𝛽3 𝑦 3 + 𝜀 blir på matrisform 𝑦 = 𝑍′𝛽 + 𝜀 1 där 𝑍 ′ = ⋮ 1 𝑥11 ⋮ 𝑥1𝑛 𝑦1 ⋮ 𝑦𝑛 2 2 𝑦1 ⋮ 𝑦𝑛 3 3 𝛽0 𝜀1 𝛽1 ,𝛽 = och 𝜀 = ⋮ 𝛽2 𝜀𝑛 𝛽3 Ramsey RESET • Nollhypotesen kan vi skriva 𝐾′𝛽 = 0 0 där 𝐾 = 0 ′ 0 1 0 0 0 1 Ramsey RESET • Testfunktionen blir den 𝐹 𝑟𝑎𝑛𝑘 𝐾 , 𝑛 − 𝑟𝑎𝑛𝑘 𝑍 fördelade kvoten 𝑄/𝑟𝑎𝑛𝑘 𝐾 𝑆𝑆𝐸/ 𝑛 − 𝑟𝑎𝑛𝑘 𝑍 där 𝑄 = 𝐾 ′ 𝑏 ′ 𝐾′ 𝑍 ′ 𝑍 −1 𝐾 OLS-skattningarna av 𝛽 och −1 𝐾 ′ 𝑏, där 𝑏 är 𝑆𝑆𝐸 = 𝑦 − 𝑍 ′ 𝑏 ′ 𝑦 − 𝑍 ′ 𝑏 Exempel • Det här är ett lätt överdrivet och påhittat exempel, bara för att illustrera vad som kan hända • Den riktiga modellen är 𝑦 = 100 + 10𝑥 − 0.4𝑥 2 + 𝜀 där 𝜀~𝑁 0,5 och stickprovsdata för 20 observationer har genererats i Excel Exempel Exempel • Vi tror att modellen som ska passas är 𝑦 = 𝛼0 + 𝛼1 𝑥 + 𝜀 och OLS-skattar koefficienterna med PROC REG Exempel • För att kunna göra RESET-testet så skapar vi kvadrater och kuber av predikterade värden • För själva testet använder vi PROC AUTOREG Exempel • Outputen från testet är • Detta betyder att vi ska förkasta nollhypotesen och att modellen är felspecificerad Att avhjälpa problemet • Att man får ett signifikant RESET-test kan bero på att • Modellen är underspecificerad, alltså att man ”glömt” variabler som borde vara med • Att data är autokorrelerade • Att man har fel funktionell form, som i vårt exempel där vi passade en rät linje till data från en kvadratisk modell Att avhjälpa problemet • Det är alltid en bra idé att göra scatter plots innan man börjar passa modeller och kolla i litteraturen vilka funktionella samband som bör gälla och vilka variabler som bör inkluderas i modellerna • Om man tänker efter från början så minskar risken att få ett signifikant RESET-test… PROC IML • I PROC IML kan man bland annat skapa och göra olika operationer på matriser • Vi kanske vill skriva ett program som skapar matriserna 𝑎 = 2 3 4 ′, 𝑏 = 1 4 7 ′, ′ 2 3 4 slår samman dessa till 𝑐 = och 1 4 7 2 3 4 transponerar 𝑐 till 𝑑 = 1 4 7 PROC IML • Programmet skulle kunna se ut så här • Om vi vill kolla att vi ”gör rätt” så kan vi lägga till rader med ”print” för att få ut det vi gör som resultatutskrifter PROC IML • Vi kan även invertera och plocka ut element ur matriser Loopar • Vi har sett att man kan göra DO-loopar i datasteg • Det kan man göra i PROC IML med • Vi kanske vill skapa en kolonnvektor med heltalen från 3 till och med 12 Att läsa in data i PROC IML • Om vi har ett dataset i work så kan vi plocka in det, eller delar av det, i PROC IML • Vi kanske vill ta outputen från den felspecificerade regressionen vi gjorde i exemplet ovan och utföra RESET-testet i PROC IML Skapa Z-matrisen Koefficientskattningar och SSE Konstruera och utföra testet