IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen...
-
Upload
christiane-eckstein -
Category
Documents
-
view
104 -
download
0
Transcript of IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen...
IBE, MultVar. (L6-3) 1
Multivariate Regressionsverfahren
Quantitative Methoden in der klinischen Epidemiologie
IBE, MultVar. (L6-3) 2
Lernziele
• Logistische Regression– Grundlagen/Einführung/Beispiel– Datenformate– Modell der logistischen Regression– Exkurs: Schätzen der Regressionskoeffizienten– Interpretation
• Cox (Proportional Hazards - PH) Modell– Grundlagen/Einführung/Beispiel– Datenformate– Cox Modell– Interpretation
• Zusammenfassung– Vergleichende Übersicht– Modellannahmen– Offene Aspekte
IBE, MultVar. (L6-3) 3
Multivariate Regressionen
• Zweck:Bestimmt und quantifiziert den relativen Beitrag verschiedener Einflüsse auf ein Ereignis.
• Die vier wichtigsten Gründe für multivariate Regressionen– Identifiziere Risikofaktoren bei gleichzeitiger Adjustierung für Confounder
um eine objektive Darstellung ihrer Bedeutung zu erhalten– Adjustiere für Unterschiede zu den Eigenschaften einer Bezugsgruppe– Ableiten von Aussagen zur Diagnose– Ableiten von Aussagen zur Prognose
IBE, MultVar. (L6-3) 4
Logistische Regression
• Wie wirkt ein Faktor (X) auf einen Outcome (Y): X Y• X ist ein prognostischer (Risiko-) Faktor (Kondomgebrauch)
Y ist eine binäre Statusgröße, Krankheit: HIV+ (1) oder HIV- (0) .• Risikofaktor: modifizierbar (Lebensstilfaktor)
Kovariablen: nicht modifizierbar aber mit Einfluss auf das Risiko (Alter)
• Es können auch multiple prognostische Faktoren (Vektor X) und Kovariablen (Vector C) vorliegen
X1,X2,X3,C1,C2 Y(Kondomgebrauch, Alter) (HIV +/-)
• Analysen werden mit zunehmender Anzahl von Einflussgrößen komplexer.
• Logistische Regression: Beschreibt quantitativ den Einfluss unabhängiger Variablen auf einen binären Zustand. Wie beeinflussen die Ausprägungen verschiedener Variablen die Auftretenswahrscheinlichkeit für eine oder die Prävalenz einer Erkrankung?
IBE, MultVar. (L6-3) 5
Fallbeispiel
Welche Risikofaktoren gibt es neben dem PSA-Wert zur Vorhersage eines Prostatakarzinoms? Wie beeinflusst der PSA-Wert das Risiko eines Prostatakarzinoms?
Thompson IM, et al. (2006) Screen-based prostate cancer risk: results from the Prostate Cancer Prevention Trial, Journal of the National Cancer Institute, 98: 529-534.
Es werden 5519 Patienten aus dem Placeboarm des PCPT (Prostate Cancer Prevention Trial) betrachtet, bei denen:
• durch eine Biopsie der wahre Gesundheitsstatus erhoben wurde• bei denen zeitnahe zur Biopsie (1 Jahr) sowohl eine PSA Messung als auch eine rektale Tastuntersuchung (DRE - digital rectal exam) durchgeführt wurde.
Weitere wichtige Einflussgrößen: Veränderung des PSA-Wertes, Familienanamnese zum Prostatakarzinom, Alter.
IBE, MultVar. (L6-3) 6
PCPT
18882 Männer, ≥ 55 Jahre, normales DRE und unauffällige PSA-
Werte
Finasteride
Placebo
Inzidenz von Prostata- Karzinomen
Inzidenz von Prostata- Karzinomen
Studienfollow-Up7 Jahre
Aus der Placebogruppe kann Information über den natürlichen Krankheitsverlauf des Prostatakarzinoms gewonnen werden.
Hieraus Ableitung von Screening-Empfehlungen, Diagnoseleitlinien, ….
Ausschlaggebend für die Analyse sind die Faktorwerte, die zeitnah zur Biopsie erhoben wurden.
IBE, MultVar. (L6-3) 7
Fragen zu den Daten
1. Wie viele Männer gehen in die Analyse ein?2. Was sind die Einschlusskriterien für die Auswahl der Männer?3. Welche Raten von Prostatakarzinomen würde man in der
ausgewählten Population erwarten?4. Welche Raten an Prostatakarzinomen wurden beobachtet?5. Welche Faktoren haben einen prognostischen Effekt?6. Welche Richtung der Wirkung würden Sie für den Faktor
Familienanamnese erwarten? Führt eine positive Familienanamnese zu einem erhöhten Karzinomrisiko?
7. Welche Faktoren hatten keinen prognostischen Effekt?
IBE, MultVar. (L6-3) 8
Beschreibung der Population
IBE, MultVar. (L6-3) 9
Explorative Analyse
IBE, MultVar. (L6-3) 10
Datenformat
ID Y PSA DRE Family History ...778 0 2.1 0 0835 1 4.3 0 0732 1 2.6 1 1001 0 1.5 0 0
Wie viele Karzinomfälle gibt es in diesem Datensatz?Wie viele Karzinomfälle haben einen positiven DRE-Befund?Haben Karzinomfälle höhere PSA-Werte als Nicht-Karzinomfälle?
Y - Karzinomfall (1), kein Karzinom (0)
Y kann ebenfalls ein fortgeschrittenes Karzinom kodieren (Beide Untersuchungen werden durchgeführt)
IBE, MultVar. (L6-3) 11
Wahrscheinlichkeit
• P[Y=1] beschreibt die Wahrscheinlichkeit, dass eine {0, 1}-codierte Variable Y den Wert 1 annimmt.
• Beispiel Prostatakarzinom:P[Y=1]
- Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einer Bezugspopulation ein Prostatakarzinom hat(individuelles Risiko)
- Anteil von Prostatakarzinomen in einer Bezugspopulation(Prävalenz)
• Kann die Zufallsgröße Y nur die Werte 0 und 1 annehmen, so gilt:P[Y=0] = 1-P[Y=1]
IBE, MultVar. (L6-3) 12
Odds
• Eine Odds beschreibt das Verhältnis von günstigen zu ungünstigen Ausgängen (einer Wette). Somit ist es eine Chance: "Die Chance steht 1 zu 3".
• Formal ist die Odds ein Quotient aus Wahrscheinlichkeit zur Gegenwahrscheinlichkeit in einer Situation mit binären Ereignismöglichkeiten.
• O[Y=1] = P[Y=1] / P[Y=0] = P[Y=1] / (1-P[Y=1]) • O[Y=0] = 1 / O[Y=1]• P[Y=1] = O[Y=1] / (1+O[Y=1])
• Beispiel: In der Bezugspopulation ist die Prävalenz für ein Prostatakarzinom 21.9%. Was ist die Odds für ein Prostatakarzinom? Wie stehen die Chancen?
O[Prostatakarzinom] = P[Prostatakarzinom] / (1- P[Prostatakarzinom] ) =
0.219 / 0.771 =0.284
• Wahrscheinlichkeiten nehmen Werte zwischen 0 und 1 an: [0,1]. Eine Odds kann einen Wert zwischen 0 und Unendlich annehmen: ]0,∞[.
IBE, MultVar. (L6-3) 13
Logits
• Der natürliche Logarithmus einer Odds wird Logit genannt.
• L[Y=1] = ln(O[Y=1]) O[Y=1] = exp(L[Y=1]) P[Y=1] = exp(L[Y=1]) / (1 + exp(L[Y=1])) = 1 / (1 + exp(-L[Y=1])
• Wertebereich eines Logits: ]-∞,∞[
• Der Schritt zur multivariaten Regression Beschreibe den Logit eines Ereignisses durch einen Score, der sich additiv aus gewichteten Komponenten ergibt → linearer Prädiktor
IBE, MultVar. (L6-3) 14
Logit und Wahrscheinlichkeit
]xexp[1]xexp[
]x|1Y[P
-4 -2 0 2 4
0.0
0.2
0.4
0.6
0.8
1.0
linearer Praediktor (x)
Wa
hrs
che
inlic
hke
it fü
r O
utc
om
e
Es gibt noch weitere Möglichkeiten den Zusammenhang zwischen linearem Prädiktor und Wahrscheinlichkeit herzustellen: z.B. probit.
IBE, MultVar. (L6-3) 15
Logistische Regression
Zusammenhang zwischen der individuellen Erkrankungswahrscheinlichkeit und ihren Einflussfaktoren:
Linearer Prädiktor: a0+a1x1+…+amxm
Regressionskoeffizienten: ai; i = 0,…, m
Kennt man die Ausprägung der Einflussfaktoren und die Werte der Regressionskoeffizienten, so kann man für einen beobachteten Satz von Einflussfaktoren die damit zusammenhängende Erkrankungswahrscheinlichkeit berechnen.
Konstruktionsprinzip für klinische und epidemiologische Scores!
]xa...xaaexp[1
]xa...xaaexp[]x,...,x|1Y[P
mm110
mm110m1
IBE, MultVar. (L6-3) 16
Linearer Prädiktor
Der lineare Prädiktor fasst die verschiedenen Einflussgrößen zu einer Zahl zusammen: Risikoscore.
Je höher der Wert des linearen Prädiktors für einen Patienten, desto höher ist die W‘keit, an der interessierenden Erkrankung erkrankt zu sein. Negative Werte des linearen Prädiktors stehen für geringere Erkrankungsw‘keiten.
Falls im Risikomodell nur die Familienanamnese (XFA: 1 ja, 0 nein) Einfluss hätte, so wäre der lineare Prädiktor a0 + a1∙XFA.
a0: Quantifiziert den Logit für die Erkrankung bei Personen ohne familiäre Belastung
a1: Quantifiziert die Logitveränderung für die Erkrankung bei Personen mit familiärer Belastung gegenüber Personen ohne familiäre Belastung.
IBE, MultVar. (L6-3) 17
Linearer Prädiktor
Berechnen Sie den linearen Prädiktor für eine Person mit positiver Familienanamnese und deren Erkrankungsw‘keit, wenn die beiden Regressionskoeffizienten folgende Werte haben: a0=-1, a1=2.
Machen Sie die analoge Rechnung auch für eine Person mit negativer Familienanamnese.
IBE, MultVar. (L6-3) 18
Linearer Prädiktor
XFA = 0 linearer Prädiktor: -1 + 2∙0 = -1, individuelle W‘keit P[Y=1|XFA=0] = exp(-1)/[1+exp(-1)] = 0.269
XFA = 1 linearer Prädiktor: -1 + 2∙1 = 1, individuelle W‘keit P[Y=1|XFA=1] = exp(1)/[1+exp(1)] = 0.731
linearer Prädiktor a0 + a1∙XFA
a0=-1, a1=2
IBE, MultVar. (L6-3) 19
Linearer Prädiktor
Eine etwas komplexere Situation:
Linearer Prädikor: a0 + a1∙XFA+a2∙XPSA
XFA = 0: negative Familienanamnese, 1: positive Familienanamnese.
XPSA = PSA Wert
a0=-1, a1=1, a2=2
Berechne den Wert des linearen Prädiktors für eine Person, die
Neg. Familienanamn. und einen PSA-Wert von 2 hat?Neg. Familienanamn. und einen PSA-Wert von 4 hat? Pos. Familienanamn. und einen PSA-Wert von 3 hat?
IBE, MultVar. (L6-3) 20
Linearer Prädiktor
Berechne den Wert des linearen Prädiktors für eine Person, die
Neg. Familienanamn. und einen PSA-Wert von 2 hat. -1+1∙0+2∙2 = 3Neg. Familienanamn. und einen PSA-Wert von 4 hat. -1+1∙0+2∙4 = 7Pos. Familienanamn. und einen PSA-Wert von 3 hat. -1+1∙1+2∙3 = 6
a0=-1, a1=1, a2=2
Wer von diesen Personen hat das höchste Risiko für ein Prostatakarzinom?
Was erhöht das Risiko mehr: eine positive Familienanamnese oder die Zunahme des PSA-Wertes um eine Einheit?
Wie soll die Veränderung gemessen werden?
• In Differenzen: Logit-Skala
• Multiplikative Veränderung: Odds-Skala → Odds-Ratio (OR)
IBE, MultVar. (L6-3) 21
Regressionskoeffizienten und Odds Ratio
Odds für die Erkrankung bei Faktorkonstellation X
O(X) = P[Y=1|X]/P[Y=0|X]: Um wie viel ist es wahrscheinlicher bei Konstellation X zu erkranken als nicht zu erkranken
Die Ausprägungen der Konstellationen X und X* sind in allen Variablen identisch, bis auf die Variable i. Der Wert der Variablen i in X ist um eine Einheit größer als der Wert der Variablen i in X*.
Dann gilt: ORi = O(X)/O(X*) = exp(ai)
Die exponierten Regressionskoeffizienten können somit als Odds Ratios interpretiert werden.
Die Wirkung eines Einflussfaktors auf das Risiko wird durch das Vorzeichen des Regressionskoeffizienten ausgedrückt:
a = 0 kein Einfluss des Faktorsa < 0 Faktor senkt die Wahrscheinlichkeita > 0 Faktor erhöht die Wahrscheinlichkeit
IBE, MultVar. (L6-3) 22
Odds Ratio
XFA = 0: negative Familienanamnese, 1: positive Familienanamnese.XPSA = PSA Wert
Linearer Prädikor: -1 + 1∙XFA+2∙XPSA
Kovariablenvektor pro Patient (XFA, XPSA)
X = (0, 3) und X* = (0, 4): Patient X hat keine familiären Belastungen und PSA Messung 3, LP = 5Patient X* hat keine familiären Belastungen und PSA Messung 4, LP = 7
Berechne das OR für den Faktor PSA
P[Y=1|X] = exp(5)/(1+exp(5)) = 0.9933 O(X) = P[Y=1|X]/P[Y=0|X] = 0.9933/0.0067 = 148.254P[Y=1|X*] = exp(7)/(1+exp(7)) = 0.9991
O(X*) = P[Y=1|X*]/P[Y=0|X*] = 0.9991/0.0009 = 1110.111
OR = O(X*) / O(X) = 1110.111/ 148.254 = 7.487899 = exp(2)
IBE, MultVar. (L6-3) 23
Odds Ratio
Odds für die Erkrankung mit (X=1)
OR = ------------------------------------------ = exp(logOR) = exp(a)
Odds für die Erkrankung mit (X=0)
OR > 1 : a > 0 (positiver Zusammenhang - Risiko wird erhöht)OR < 1 : a < 0 (negativer Zusammenhang - Risiko nimmt ab)OR = 1 : a = 0 (kein Zusammenhang)
Berichte des OR in Artikeln:
95%-Konfidenzintervall für OR, p-Wert für OR: falls p<0.05, so bedeutet dies, dass das OR signifikant von 1 verschieden ist und der Risikofaktor einen Effekt auf die Erkrankungsodds hat.
Oft werden auch die Regressionskoeffizienten berichtet, die in OR umgerechnet werden können - oder umgekehrt.
IBE, MultVar. (L6-3) 24
Schätzen der Koeffizienten in der log. Reg.
• Es wird ein Modell für die W‘keit der Erkrankung in einer spezifischen Teilgruppe formuliert: Angabe, welche Faktoren wie codiert eine Rolle spielen.
• Somit gilt für individuelle W‘keiten in einer durch den Vektor X beschriebenen Teilmenge das Modell:
• Durch die Kombination von Modell und beobachteten individuellen Krankheitszuständen lässt sich die Likelihood der vorliegenden Daten berechnen. Die Likelihood ist eine Funktion der nicht spezifizierten Regressionskoeffizienten a1, …, am.
• Die Maximierung der Likelihood ergibt die Schätzung der gesuchten Parameter. Weiterhin können Konfidenzintervalle berechnet werden, sowie p-Werte für die Nullhypothese, dass ai=0 ist.
]xa...xaaexp[1
]xa...xaaexp[]x,...,x|1Y[P
mm110
mm110m1
IBE, MultVar. (L6-3) 25
Fragen an die Daten
1. Was ist das OR für die Familienanamnese des Prostatakarzinoms?
2. Erhöht oder erniedrigt eine positive Familienanamnese die Odds für ein Prostatakarzinom.
3. Um wie viel verändert sich die Odds?
4. Ist dieser Effekt statistisch signifikant? Warum?
5. Ist der Effekt eines positiven DRE-Befundes größer als der einer pos. Familienanamnese?
6. In welchem Bereich liegt der Effekt einer positiven DRE?
7. Wird durch eine vorherige Biopsie (auch wenn negativ ausgefallen) die Odds für ein Prostatakarzinom erhöht?
8. Wird durch den logPSA-Wert die Odds für ein Prostatakarzinom erhöht oder erniedrigt? Interpretieren Sie den Wert des OR für die logPSA Messung.
9. Ist PSA der einzige Risikofaktor, den ein Arzt in Betracht ziehen soll, wenn er einen Patienten über sein Prostatakarzinomrisiko berät und die Durchführung einer Biopsie in Betracht zieht?
IBE, MultVar. (L6-3) 26
Darstellung eines komplexen Ergebnisses
]xa...xaaexp[1
]xa...xaaexp[]x,...,x|1Y[P
mm110
mm110m1
Unsicherheit aufgrund der SchätzungKonfidenzbänder für Risikoschätzer
Ris
iko f
ür
Pro
stata
karz
inom
Ris
iko f
ür
fort
gesc
hri
tten
es
Pro
stata
karz
inom
IBE, MultVar. (L6-3) 27
Überlebenswahrscheinlichkeiten
Wie verändert sich die Überlebenswahrscheinlichkeit (Kaplan-Meier-Kurve) in Abhängigkeit von Kovariablen und prognostischen Faktoren?
Proportional-Hazards-Modell von D. R. Cox (1972)
S(t|x) = S0(t)exp(a1∙x1 + … + ak∙xk)
S0(t): Baseline-Überlebenskurve
S0(t) = exp[-Λ0(t)]
Λ0(t): Kumulierte Baselinehazard, Patienten sammeln mit fort- schreitender Zeit immer mehr „Sterberisiko“ (Hazard), positive, monotone Funktion
Kumulativer Hazard einer Patientengruppe mit Kovariablenstruktur x:
Λ(t|x) = Λ0(t)∙exp(a1∙x1 + … + ak∙xk)
IBE, MultVar. (L6-3) 28
Überlebenswahrscheinlichkeiten
Linearer Prädiktor: a1∙x1 + … + ak∙xk
Linearer Prädiktor
< 0 - Überlebenswahrscheinlichkeit erhöht sich = 0 - Überlebenswahrscheinlichkeit identisch mit Baselinegruppe > 0 - Überlebenswahrscheinlichkeit erniedrigt sich
Beispiel:
Linearer Prädiktor: - 0.5∙Klinik_B + 1∙Prognosestadium
Klinik_B: 0 falls Patient in Klinik A behandelt wurde 1 falls Patient in Klinik B behandelt wurde
Prognosestadium: 0 gute Prognose1 schlechte Prognose
5-Jahres Überleben in Gruppe (0,0): 0.7Wie sieht das 5-Jahres Überleben in den anderen Gruppen aus?
IBE, MultVar. (L6-3) 29
Überlebenswahrscheinlichkeiten
Linearer Prädiktor: - 0.5∙Klinik_B + 1∙Prognosestadium
Klinik_B: 0 falls Patient in Klinik A behandelt wurde 1 falls Patient in Klinik B behandelt wurde
Prognosestadium: 0 gute Prognose1 schlechte Prognose
5-Jahres-Überleben in Gruppe
(0, 0): LP = 0 exp(0) = 1 5-Jahres-Rate: 0.71 = 0,7
(0, 1): LP = 1 exp(1) = 2.72 5-Jahres-Rate: 0.72.72 = 0,379
(1, 0): LP = -0.5exp(-0.5) = 0.61 5-Jahres-Rate: 0.70.61 = 0,804
(1, 1): LP = 0.5 exp(0.5) = 1.65 5-Jahres-Rate: 0.71.65 = 0,555
Praktische Konsequenzen?
IBE, MultVar. (L6-3) 30
Kurative Resektion des Rektumkarzinoms
Ueberleben in Monaten
Ue
be
rle
be
nsw
'ke
it
0 10 20 30 40 50 60
0.0
0.2
0.4
0.6
0.8
1.0
Klinik AKlinik B
Einfluss der Klinik auf das UeberlebenKlinik A: 309 Pat.
Klinik B: 196 Pat.
IBE, MultVar. (L6-3) 31
Ueberleben in Monaten
Ue
be
rle
be
nsw
'ke
it
0 10 20 30 40 50 60
0.0
0.2
0.4
0.6
0.8
1.0
Stadium IStadium IIStadium III
Einfluss des Tumorstadiums auf das Ueberleben
Patientenzahlen zu den Stadien auf den nächsten Folien
Kurative Resektion des Rektumkarzinoms
IBE, MultVar. (L6-3) 32
Unterscheidet sich das Überleben von kurativ resezierten Patienten mit Rektumkarzinom zwischen Klinik A und Klinik B?Log-Rank-Test
N Observed Expected (O-E)^2/E B 196 45 60.68 4.050A 309 100 84.32 2.914Chisq= 7 on 1 degrees of freedom, p= 0.008278
Sind die Kliniken hinsichtlich ihres Patientengutes vergleichbar?Chi-Quadrat-Test
Stadium I Stadium 2 Stadium 3 SummeB 33(16.8) 70(35.7) 93(47.5) 196A 84(27.2) 100(32.4) 125(40.4) 309
Chi² = 7.3026, FG = 2, p = 0.026
Kurative Resektion des Rektumkarzinoms
IBE, MultVar. (L6-3) 33
Stadium Klinik Fallzahl D (beobachtet)
E (erwartet)
SMR D/E RH
I B 33 2 2.59 0.772 0.71
A 84 7 6.41 1.092
II B 70 8 13.44 0.595 0.45
A 100 23 17.56 1.310
III B 93 35 52.79 0.663 0.49
A 125 70 52.21 1.341
Kurative Resektion des Rektumkarzinoms
SMR: Standardisierte Mortalitätsrate: Wie ist das Verhältnis von beobachteten zu erwarteten Todesfällen, wenn beide Kliniken sich im Mortalitätsrisiko nicht unterscheiden?
RH: relativer Hazard - wie verhält sich die SMR von Klinik B zu der von Klinik A (Klink A ist Bezugsgröße)
IBE, MultVar. (L6-3) 34
Klinik Stadium N D E SMR RH
A I 84 7 32.7 0.21
II 100 23 35.6 0.65 3.02
III 125 70 31.2 1.97 3.42
B I 33 2 8.47 0.23
II 70 8 16.89 0.47 2.01
III 93 35 19.84 1.78 3.70
Kurative Resektion des Rektumkarzinoms
SMR: Standardisierte Mortalitätsrate: Wie ist das Verhältnis von beobachteten zu erwarteten Todesfällen, wenn die drei Stadien sich im Mortalitätsrisiko nicht unterscheiden?
RH: relativer Hazard - wie verhält sich die SMR zum nächst besseren Stadium (Für Stadium III ist Stadium II Bezugsgröße, für Stadium II ist Stadium I Bezugsgröße: Risikoveränderung beim Wechseln ins nächste Stadium)
IBE, MultVar. (L6-3) 35
Hazard Ratio lower .95 upper .95 stage.2 2.799 1.332 5.882stage.3 3.574 2.390 5.346klinik_b 0.488 0.343 0.696
Klinik / Stadium I II III
A 1 2.8 2.83.6
B 0.5 2.80.5 2.83.60.5
Kurative Resektion des Rektumkarzinoms
Der Effekt der Klinik auf die Veränderung der SMR ist homogen über die Stadien. Der Effekt der Stadien auf die Veränderung der SMR ist homogen über die Kliniken.
Beide Faktoren (Stadium und Klinik) werden als unabhängige Faktoren in einer multivariaten Coxregression modelliert und ihre Effekte aufs Überleben quantifiziert.
Hieraus lässt sich für jede Kombination (Klinik, Stadium) der Faktor berechnen mit dem die Überlebensinformation der Bezugsgruppe (Klinik A, Stadium I) verändert wird.
IBE, MultVar. (L6-3) 36
0 10 20 30 40 50 60
0.0
0.2
0.4
0.6
0.8
1.0
Zeit in Monaten
Ue
be
rle
be
n
Klinik A
0 10 20 30 40 50 60
0.0
0.2
0.4
0.6
0.8
1.0
Zeit in MonatenU
eb
erl
eb
en
Klinik B
Kurative Resektion des Rektumkarzinoms
Vergleich von beobachtetem Überleben mit den Überlebenskurven, die das Cox-Modell aus den Daten schätzen würde. Modell und Wirklichkeit stimmen gut überein. Somit sind auch die aus dem Modell und der Analyse gezogenen Schlussfolgerungen ernst zu nehmen.
IBE, MultVar. (L6-3) 37
Klinik B ist die deutlich bessere Klinik.
Wie die Klinik auf das Überleben wirkt, konnte in einem multivariaten Proportional-Hazards-Modell quantifiziert werden: Hat ein Patient in Klinik A die Überlebenswahrscheinlichkeit SA(t), so gilt für die Klinik B
SB(t) = SA(t)0.5
Die folgende Tabelle gibt den formalen Zusammenhang nochmals an Beispielen wieder:
Überleben in Klinik A 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90Überleben in Klinik B 0.32 0.45 0.55 0.63 0.71 0.77 0.84 0.89 0.95Rel. Risiko 3.16 2.24 1.83 1.58 1.41 1.29 1.20 1.12 1.05
Das Beispiel macht auch klar, dass der relative Hazard nicht mit dem relativen Risiko identisch ist. Während sich das relative Risiko je nach Sterbewahrscheinlichkeit zwischen den Kliniken ändert, bleibt der relative Hazard konstant.
Kurative Resektion des Rektumkarzinoms
IBE, MultVar. (L6-3) 38
Zusammenfassung (I)
• Multivariate Verfahren erlauben das Zusammenfassen der Wirkung multipler Effekte auf einen Outcome.
• Damit ist es möglich, Scores zu erstellen, die für Diagnose und Prognose eine schärfere Diskriminierung erlauben.
• Multivariate Verfahren erlauben es ebenso, den Effekt eines Faktors in einem multivariablen Setting zu präzisieren. Dies geschieht durch das Herausrechnen des Effektes der anderen beteiligten Faktoren: Adjustierung.
IBE, MultVar. (L6-3) 39
Zusammenfassung (II)
Typ der abhängigen Variablen
Beispiele Art der multivariaten Regression
Intervallskaliert Gewicht, Blutdruck Multiple lineare Regression,
ANOVA, ANCOVA
Dichotom Überleben eines festen Zeitintervalls
(ja/nein),Krankheit liegt vor
(ja/nein)
Logistische Regression
Zeit bis zu einem Ereignis
Zeit bis zum Tod,Zeit bis zum Rezidiv,
Zeit bis zur Erkrankung
Cox-Modell,Accelerated Failure Time (AFT) Modelle
Seltene Ereignisse,Zählvariablen
Inzidenz seltener Erkrankungen,
Anzahl von Plaques
Poisson-Regression
IBE, MultVar. (L6-3) 40
Zusammenfassung (III)
Fragestellung Multiple lineare Regression
Multiple logistische Regression
Prop. HazardsCox-Modell
Was wird modelliert? Mittelwert der abhängigen Variablen
Logarithmus der Odds der abh. Variablen
(Logit)
Logarithmus des Hazard
Beziehung multipler unabhängiger
Variablen zur abh. Variablen
Der Mittelwert ändert sich linear mit einer
Einheitsänderung der unabhängigen
Variablen
Der Logit ändert sich linear mit einer
Einheitsänderung der unabhängigen
Variablen
Der Log-Hazard ändert sich linear mit einer
Einheitsänderung der unabhängigen Variablen
Verteilung der abhängigen Variablen
Normalverteilung Binomialverteilung Nicht spezifiziert,semiparametrisch
Varianz der abh. Variablen
Gleichmäßig um den Mittelwert
Abhängig von der W‘keit
der einzelnen Gruppe
Nimmt mit zunehmendem Hazard zu
Zensierte Beobachtungen
Kann nicht mit zensierten
Beobachtungen arbeiten
Kann nicht mit zensierten
Beobachtungen arbeiten
Zeiten können rechtszensiert sein
Relative Hazards - - Proportional zueinander,faktorielle Zerlegung
Beziehungen der unabhängigen
Variablen
Möglichst nicht oder nur wenig korreliert
Möglichst nicht oder nur wenig korreliert
Möglichst nicht oder nur wenig korreliert
Beobachtungen Unabhängig Unabhängig Unabhängig
IBE, MultVar. (L6-3) 41
Zusammenfassung (IV)
• Lernziel: Umgang mit dem linearen Prädiktor und dessen Rolle bei komplexen klinischen und epidemiologischen Fragestellungen.
• Nicht behandelt:
- Nicht-lineare Zusammenhänge (Wachstumskurven)
- Auswahl der relevanten unabhängigen Variablen
- Vorgehen bei der Verletzung wichtiger Modellannahmen
- Interaktionseffekte zwischen Faktoren
- abhängige (geclusterte) Beobachtungen
- Modellanpassung und Residualanalyse
- Hypothesentests und Konfidenzintervalle
- Hintergründe der Schätzverfahren