Multivariabel statistik beware of the wolf

Multivariabel statistik
beware of the wolf
Johan Lindbäck
Uppsala Clinical Research Center
Kvalitetsregisterforskningskonferens
Arlanda 26 maj 2015
Introduktion
Några saker att beakta
Utvärdering av modeller
Multivariabel statistik
Förtydligande
I
Multivariat = flera utfallsvariabler
I
Multivariabel = flera förklaringsvariabler/prediktorer
I
Behöver inte innebära modellering men vi kommer idag
uteslutande prata om (regressions)modeller
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
2/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Innehåll
Introduktion
Frågeställning
Statistiska (regressions)modeller
Några saker att beakta vid konstruktion av multivariabla modeller
Confounding
Modellanpassning/överanpassning
Bortfall/saknade observationer
Kodning och val av variabler
Stegvis regression
Utvärdering av modeller
Diskriminering
Kalibrering
Validering
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
3/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Frågeställning
Tre områden där vi typiskt använder multivariabla modeller är
I
Hypotesprövning
Finns det ett samband mellan graden av fysisk aktivitet och
risken för hjärtsjukdom?
I
Estimering
Hur mycket minskar blodtrycket om man får en viss typ av
blodtrycksmedicin?
I
Prediktion
Vad är sannolikheten att en 70-årig kvinna med
förmaksflimmer drabbas av en stroke inom 3 år?
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
4/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Statistisk modell
Vanliga regressionsmodeller inom medicinsk forskning
Linjär regressionsmodell
Y = β0 + β1 X1 + β2 X2 + . . . + βk Xk + ε,
ε ∼ N 0, σ 2
Logistisk regressionsmodell
e β0 +β1 X1 +β2 X2 +...+βk Xk
⇐⇒
1 + e β0 +β1 X1 +β2 X2 +...,βk Xk
P(Y = 1)
ln
= β0 + β1 X1 + β2 X2 + . . . , βk Xk
P(Y = 0)
P(Y = 1) =
Cox-regressionsmodell
h(t) = h0 (t)e β1 X1 +β2 X2 +...+βk Xk
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
5/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Confounding
Exempel
●
120
●
Biomarker X (ng/L)
●
●
100
●
●
●
●
●
●
●
●
80
●
●
●
●
●
●
●
●
60
10
20
30
40
50
60
70
Age
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
6/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Confounding
Exempel
●
●
Female
Male
●
120
120
●
●
●
●
100
●
●
●
●
●
●
●
●
●
●
80
Biomarker X (ng/L)
Biomarker X (ng/L)
●
●
●
●
●
100
●
●
●
●
●
●
80
●
●
●
60
60
10
20
30
40
50
60
70
10
J Lindbäck (UCR)
20
30
40
50
60
70
Age
Age
Multivariabla modeller
26/5 2015
6/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Simulerade data
10
●
●
8
●
●
●
● ●●
●
● ● ●
●
● ●● ●
●
●
●●
●●
●
●●● ●●
●
● ●●
● ●
●
●
●●
y
4
●●● ●
● ●
●
● ●
●● ●
●
●
●
●
●● ● ●
●
●
● ●
●
● ●●
● ●
●
●
●
●
●
0
● ● ●●
●●● ●
●●
●
● ●
●●
6
2
●
● ●
●
●
●● ●
●
●
●
0
20
40
60
80
100
x
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
7/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Hur bra kan vi anpassa en modell till dessa data?
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
8/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Linjär modell
10
●
●
8
●
●
●
● ●●
●
● ● ●
●
● ●● ●
●
●
●●
●●
●
●●● ●●
●
● ●●
● ●
●
●
●●
y
4
●●● ●
● ●
●
● ●
●● ●
●
●
●
●
●● ● ●
●
●
● ●
●
● ●●
● ●
●
●
●
●
●
0
● ● ●●
●●● ●
●●
●
● ●
●●
6
2
●
● ●
●
●
●● ●
●
●
●
0
20
40
60
80
100
x
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
9/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Loess (s = 0.2)
10
●
●
8
●
●
●
● ●●
●
● ● ●
●
● ●● ●
●
●
●●
●●
●
●●● ●●
●
● ●●
● ●
●
●
●●
y
4
●●● ●
● ●
●
● ●
●● ●
●
●
●
●
●● ● ●
●
●
● ●
●
● ●●
● ●
●
●
●
●
●
0
● ● ●●
●●● ●
●●
●
● ●
●●
6
2
●
● ●
●
●
●● ●
●
●
●
0
20
40
60
80
100
x
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
10/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Loess (s = 0.1)
10
●
●
8
●
●
●
● ●●
●
● ● ●
●
● ●● ●
●
●
●●
●●
●
●●● ●●
●
● ●●
● ●
●
●
●●
y
4
●●● ●
● ●
●
● ●
●● ●
●
●
●
●
●● ● ●
●
●
● ●
●
● ●●
● ●
●
●
●
●
●
0
● ● ●●
●●● ●
●●
●
● ●
●●
6
2
●
● ●
●
●
●● ●
●
●
●
0
20
40
60
80
100
x
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
11/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Loess (s = 0.05)
10
●
●
8
●
●
●
● ●●
●
● ● ●
●
● ●● ●
●
●
●●
●●
●
●●● ●●
●
● ●●
● ●
●
●
●●
y
4
●●● ●
● ●
●
● ●
●● ●
●
●
●
●
●● ● ●
●
●
● ●
●
● ●●
● ●
●
●
●
●
●
0
● ● ●●
●●● ●
●●
●
● ●
●●
6
2
●
● ●
●
●
●● ●
●
●
●
0
20
40
60
80
100
x
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
12/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
'Verkligheten' & loess (s = 0.1)
10
Sann ekvation:
y = sin(x 3) + x 10
●
●
8
●
●
●
● ●●
●
● ● ●
●
● ●● ●
●
●
●●
●●
●
●●● ●●
●
● ●●
● ●
●
●
●●
y
4
●●● ●
● ●
●
● ●
●● ●
●
●
●
●
●● ● ●
●
●
● ●
●
● ●●
● ●
●
●
●
●
●
0
● ● ●●
●●● ●
●●
●
● ●
●●
6
2
●
● ●
●
●
●● ●
●
●
●
0
20
40
60
80
100
x
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
13/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Modellanpassning
Essentially, all models are wrong, but some are useful
(George E. P. Box)
It is better to be vaguely right than exactly wrong
(Carveth Read)
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
14/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Överanpassning
Exempel
I en studie på 20 sjukhus mättes blodtrycket i både höger och
vänster arm på ett antal patienter för att ta reda på om det fanns
någon systematisk skillnad. Den genomsnittliga differensen mellan
höger och vänster arms blodtryck plottades för alla sjukhus för att
se om det fanns någon skillnad mellan sjukhusen
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
15/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Överanpassning
Skillnad i blodtryck [mmHg]
10
5
●
●
●
●
0
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−5
−10
A B C D E F G H I J K L M N O P Q R S T
Sjukhus
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
16/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Överanpassning
10
5
●
●
●
●
0
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−5
−10
Skillnad i blodtryck [mmHg]
Skillnad i blodtryck [mmHg]
10
5
●
0
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−5
−10
A B C D E F G H I J K L M N O P Q R S T
I C G Q D H J M R B A P E F T O L S N K
Sjukhus
Sjukhus (sorterade)
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
16/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Bortfall
Statistikprogram tar typiskt bort alla observationer (rader) där
åtminstone någon av variablerna saknar sitt värde
Table: First 6 rows of some data . . .
J Lindbäck (UCR)
Id
Age
1
2
3
4
5
6
65
70
75
72
54
Sex
M
M
M
F
F
F
BP
167
143
150
188
Multivariabla modeller
died
0
1
1
0
0
0
26/5 2015
17/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Bortfall
I
Ju fler variabler med bortfall desto större risk att det endast
är få observationer med komplett information
I
Helt slumpmässigt bortfall (ovanligt!) → precisionen minskar.
I
Ej slumpmässigt bortfall → systematiskt fel. Ofta kan man
framgångsrikt imputera nya värden genom att fånga upp
samband med övriga variabler
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
18/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Variabelval
Vilka variabler?
Hur väljer man vilka variabler som ska vara med i modellen?
I
Klinisk erfarenhet
I
Vetenskaplig litteratur
I
Tillgänglighet
I
Inte alls?
I
Låt datorn (statistikprogrammet) välja
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
19/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Variabelval
Hur många variabler?
Hur många variabler kan (ska/bör/får) man ha med i modellen?
I
Alla?
I
Ingen?
I
Några? Hur många?
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
20/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Variabelval
Hur många variabler?
För att få tillräckligt bra precision finns några tumregler
I
Linjär regression: minst 10 obs per parameter i modellen
I
Logistisk regression: minst 10 obs i den minsta klassen i
utfallet per parameter i modellen
I
Cox-regression: minst 10 händelser per parameter i modellen
OBS! parameter 6= variabel
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
21/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Kodning av variabler
I
För kategoriska variabler med flera klasser kan det ibland vara
vettigt att slå ihop (små) klasser
I
Undvik att kategorisera kontinuerliga variabler. Samband är
väldigt sällan “stegformade”
I
Bättre: anpassa “smarta” splinefunktioner med få parametrar
I
Transformationer: log-transformation gör att vi går från
additiv till multiplikativ skala
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
22/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Kategorisering av kontinuerlig variabel
Ålder kontinuerlig
Ålder dikotomiserad vid 70 år
190
●
●
180
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
160
●
150
●
●
●
●
170
●
bp
●
160
●
●
●
180
●
●●
●
●
●
●
●
●
●
●
●
170
bp
190
●
●
●
150
●
●
●
●
●
●
●
●
●
●
140
140
●
●
60
70
80
90
age
J Lindbäck (UCR)
60
70
80
90
age
Multivariabla modeller
26/5 2015
23/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Stegvis regression
I
“Forward”
I
I
I
I
Börja utan variabler (medelvärdet)
Lägg till en variabel i taget baserat på vilken som är “bäst”
Sluta när modellen inte förbättras längre
“Backward” (bättre)
I
I
I
Börja med alla variabler i modellen.
Ta bort den variabel som minst påverkar modellen
Sluta då modellen signifikant försämras om ytterligare någon
variabel tas bort
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
24/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Stegvis regression (exempel)
I en studiepopulation bestående av patienter med akut
kranskärlssjukdom som genomgått någon form av revaskularisering
(ballongvidgning med eller utan stent eller bypass-operation) vill vi
ta fram en prediktionsmodell för att bestämma risken för en ny
allvarlig händelse (stroke, kardiovaskulär död eller spontan
hjärtinfarkt)
I
9448 patienter
I
841 händelser
I
30 kandidatvariabler
I
4 prespecificerade interaktioner
I
Icke-linjära transformationer för samtliga kontinuerliga
variabler
I
Totalt 79 parametrar i modellen
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
25/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Stegvis regression
100 bootstrapstickprov
●
●
●
●
20
●
●
●
●
●
●
●
15
●
●
●
●
Frequency
CADEX3
sttia
GDF_0
BMI
NTpBNP_0
stemi3
gender
MI
TropT_0
PCI_CABG
stemi3 * TropT_0
ApoB_0
KILLIP2
HB0
CYST_0
stemi3 * NTpBNP_0
CROBPD
PAD
stemi3 * WBC0
HRATEBL
ApoA1_0
WBC0
AGE
diabetes
smoker
compl_revasc
SBPSUBL
CRP_0
stemi3 * CRP_0
DYSHCHOL
CRENDIS
HYP
GIBLEED
CHF
●
●
●
●
●
10
●
●
●
●
●
5
●
●
●
●
●
●
●
0
●
●
0
20
40
60
80
100
6
Frequency selected
J Lindbäck (UCR)
7
8
9
10
11
12
13
14
15
16
17
Number of variables included in final model
Multivariabla modeller
26/5 2015
26/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Problem med stegvis regression
I
Risk för överanpassning
I
R 2 systematiskt för hög
I
Regressionskoefficienter systematiskt för stora (i absoluta tal)
I
Medelfel systematiskt för små
I
p-värden systematiskt för låga
I
Konfidensintervall systematiskt för smala
I
Dålig på att hantera multikolinjäritet (godtycklighet)
I
“It allows us to not think about the problem” (F.E. Harrell)
I
Automatiska procedurer är sällan implementerade så att de
hanterar interaktioner på “rätt” sätt
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
27/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Diskriminering
En modell har god diskriminerande förmåga om den klarar av att
skilja på individer med “höga” och “låga” utfall. D.v.s. om
modellen förutsäger att individ A har högre risk än individ B och
individ A dör innan individ B så har modellen god diskriminerande
förmåga
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
28/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Kalibrering
I
Om det predicerade utfallet är lika som det observerade
utfallet så är modellen välkalibrerad. Plotta observerat mot
predicerat utfall
I
Övergripande kalibrering (interceptet på kalibreringskurvan).
Om alla predicerade sannolikheter är för höga eller för låga.
Det skulle t.ex. kunna bero på att det totala risken har
minskats (p.g.a. förändringar i samhället?)
I
Lutningen på kalibreringskurvan. Om lutningen < 1 innebär
det att låga prediktioner är för låga och höga prediktioner är
för höga. Kan vara ett tecken på överanpassning
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
29/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Kalibrering
0.95
0.90
0.85
0.80
Fraction Surviving 365 Day
1.00
Exempel
0.80
0.85
0.90
0.95
1.00
Predicted 365 Day Survival
Black: observed Gray: ideal
Blue : optimism corrected
J Lindbäck (UCR)
B=50 based on observed−predicted
Mean |error|=0.002 0.9 Quantile=0.003
Multivariabla modeller
26/5 2015
30/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Validering
I
Vi vill veta hur bra modellen generaliserar till nya data
I
Vi skiljer på intern och extern validitet
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
31/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Extern validitet
I
Extern validitet är “gold standard”
I
Fungerar modellen i den kliniska verkligheten den var
framtagen att användas i?
I
Helst en annan region under en annan tid av andra tillämpare
I
Beräkna prediktioner baserat på den framtagna modellen och
jämför med observerat utfall i valideringsdatat (OBS! inte
samma sak som att ta fram en ny modell på de nya data)
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
32/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Intern validitet
I
Modellen utvärderas på samma data som den framtagits på
I
Ser ofta bra ut p.g.a. överanpassning
I
Försök efterlikna extern validitet genom att dela upp data.
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
33/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Intern validitet
Dela i två delar
I
Dela upp i modelleringsdata och ett valideringsdata.
I
Vanligen 2/3 för framtagning av modell och 1/3 för validering.
I
Slöseri med data. Minskar möjligheten till flexibel modellering.
I
Annan indelning ger troligen annat resultat
I
Rekommenderas ej!
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
34/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Intern validitet
Bättre: korsvalidering
I
Dela upp data i k st delar.
I
Ta fram modellen på samma sätt som för alla data men
använd bara k − 1 av delarna och utvärdera på den del som
hölls ute.
I
Upprepa k ggr så att alla observationer utvärderats en gång.
I
Fungerar ofta ok
I
k väljs vanligen till 5 eller 10.
I
Kan upprepas (upprepad korsvalidering) med nya indelningar
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
35/36
Introduktion
Några saker att beakta
Utvärdering av modeller
Intern validitet
Bäst: bootstrap
I
Dra nya stickprov (med återläggning) av samma storlek som
ursprungsdata
I
Ta fram modellen på samma sätt som för alla data
I
Utvärdera modellen på orginaldatat
I
Beräkna mått för diskrininering, kalibrering, etc. ta
genomsnitt över alla bootstrapstickprov.
I
Skillnaden mellan dessa och de ursprungliga måtten mäter
överoptimismen.
I
Genom att ta hänsyn till optimismen kan man få en
uppskattning om hur modellen kommer att fungera på “nya”
data och justera sin modell utifrån det.
J Lindbäck (UCR)
Multivariabla modeller
26/5 2015
36/36