IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen...

41
IBE, MultVar. (L6-3) 1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie

Transcript of IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen...

Page 1: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 1

Multivariate Regressionsverfahren

Quantitative Methoden in der klinischen Epidemiologie

Page 2: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 2

Lernziele

• Logistische Regression– Grundlagen/Einführung/Beispiel– Datenformate– Modell der logistischen Regression– Exkurs: Schätzen der Regressionskoeffizienten– Interpretation

• Cox (Proportional Hazards - PH) Modell– Grundlagen/Einführung/Beispiel– Datenformate– Cox Modell– Interpretation

• Zusammenfassung– Vergleichende Übersicht– Modellannahmen– Offene Aspekte

Page 3: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 3

Multivariate Regressionen

• Zweck:Bestimmt und quantifiziert den relativen Beitrag verschiedener Einflüsse auf ein Ereignis.

• Die vier wichtigsten Gründe für multivariate Regressionen– Identifiziere Risikofaktoren bei gleichzeitiger Adjustierung für Confounder

um eine objektive Darstellung ihrer Bedeutung zu erhalten– Adjustiere für Unterschiede zu den Eigenschaften einer Bezugsgruppe– Ableiten von Aussagen zur Diagnose– Ableiten von Aussagen zur Prognose

Page 4: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 4

Logistische Regression

• Wie wirkt ein Faktor (X) auf einen Outcome (Y): X Y• X ist ein prognostischer (Risiko-) Faktor (Kondomgebrauch)

Y ist eine binäre Statusgröße, Krankheit: HIV+ (1) oder HIV- (0) .• Risikofaktor: modifizierbar (Lebensstilfaktor)

Kovariablen: nicht modifizierbar aber mit Einfluss auf das Risiko (Alter)

• Es können auch multiple prognostische Faktoren (Vektor X) und Kovariablen (Vector C) vorliegen

X1,X2,X3,C1,C2 Y(Kondomgebrauch, Alter) (HIV +/-)

• Analysen werden mit zunehmender Anzahl von Einflussgrößen komplexer.

• Logistische Regression: Beschreibt quantitativ den Einfluss unabhängiger Variablen auf einen binären Zustand. Wie beeinflussen die Ausprägungen verschiedener Variablen die Auftretenswahrscheinlichkeit für eine oder die Prävalenz einer Erkrankung?

Page 5: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 5

Fallbeispiel

Welche Risikofaktoren gibt es neben dem PSA-Wert zur Vorhersage eines Prostatakarzinoms? Wie beeinflusst der PSA-Wert das Risiko eines Prostatakarzinoms?

Thompson IM, et al. (2006) Screen-based prostate cancer risk: results from the Prostate Cancer Prevention Trial, Journal of the National Cancer Institute, 98: 529-534.

Es werden 5519 Patienten aus dem Placeboarm des PCPT (Prostate Cancer Prevention Trial) betrachtet, bei denen:

• durch eine Biopsie der wahre Gesundheitsstatus erhoben wurde• bei denen zeitnahe zur Biopsie (1 Jahr) sowohl eine PSA Messung als auch eine rektale Tastuntersuchung (DRE - digital rectal exam) durchgeführt wurde.

Weitere wichtige Einflussgrößen: Veränderung des PSA-Wertes, Familienanamnese zum Prostatakarzinom, Alter.

Page 6: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 6

PCPT

18882 Männer, ≥ 55 Jahre, normales DRE und unauffällige PSA-

Werte

Finasteride

Placebo

Inzidenz von Prostata- Karzinomen

Inzidenz von Prostata- Karzinomen

Studienfollow-Up7 Jahre

Aus der Placebogruppe kann Information über den natürlichen Krankheitsverlauf des Prostatakarzinoms gewonnen werden.

Hieraus Ableitung von Screening-Empfehlungen, Diagnoseleitlinien, ….

Ausschlaggebend für die Analyse sind die Faktorwerte, die zeitnah zur Biopsie erhoben wurden.

Page 7: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 7

Fragen zu den Daten

1. Wie viele Männer gehen in die Analyse ein?2. Was sind die Einschlusskriterien für die Auswahl der Männer?3. Welche Raten von Prostatakarzinomen würde man in der

ausgewählten Population erwarten?4. Welche Raten an Prostatakarzinomen wurden beobachtet?5. Welche Faktoren haben einen prognostischen Effekt?6. Welche Richtung der Wirkung würden Sie für den Faktor

Familienanamnese erwarten? Führt eine positive Familienanamnese zu einem erhöhten Karzinomrisiko?

7. Welche Faktoren hatten keinen prognostischen Effekt?

Page 8: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 8

Beschreibung der Population

Page 9: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 9

Explorative Analyse

Page 10: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 10

Datenformat

ID Y PSA DRE Family History ...778 0 2.1 0 0835 1 4.3 0 0732 1 2.6 1 1001 0 1.5 0 0

Wie viele Karzinomfälle gibt es in diesem Datensatz?Wie viele Karzinomfälle haben einen positiven DRE-Befund?Haben Karzinomfälle höhere PSA-Werte als Nicht-Karzinomfälle?

Y - Karzinomfall (1), kein Karzinom (0)

Y kann ebenfalls ein fortgeschrittenes Karzinom kodieren (Beide Untersuchungen werden durchgeführt)

Page 11: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 11

Wahrscheinlichkeit

• P[Y=1] beschreibt die Wahrscheinlichkeit, dass eine {0, 1}-codierte Variable Y den Wert 1 annimmt.

• Beispiel Prostatakarzinom:P[Y=1]

- Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einer Bezugspopulation ein Prostatakarzinom hat(individuelles Risiko)

- Anteil von Prostatakarzinomen in einer Bezugspopulation(Prävalenz)

• Kann die Zufallsgröße Y nur die Werte 0 und 1 annehmen, so gilt:P[Y=0] = 1-P[Y=1]

Page 12: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 12

Odds

• Eine Odds beschreibt das Verhältnis von günstigen zu ungünstigen Ausgängen (einer Wette). Somit ist es eine Chance: "Die Chance steht 1 zu 3".

• Formal ist die Odds ein Quotient aus Wahrscheinlichkeit zur Gegenwahrscheinlichkeit in einer Situation mit binären Ereignismöglichkeiten.

• O[Y=1] = P[Y=1] / P[Y=0] = P[Y=1] / (1-P[Y=1]) • O[Y=0] = 1 / O[Y=1]• P[Y=1] = O[Y=1] / (1+O[Y=1])

• Beispiel: In der Bezugspopulation ist die Prävalenz für ein Prostatakarzinom 21.9%. Was ist die Odds für ein Prostatakarzinom? Wie stehen die Chancen?

O[Prostatakarzinom] = P[Prostatakarzinom] / (1- P[Prostatakarzinom] ) =

0.219 / 0.771 =0.284

• Wahrscheinlichkeiten nehmen Werte zwischen 0 und 1 an: [0,1]. Eine Odds kann einen Wert zwischen 0 und Unendlich annehmen: ]0,∞[.

Page 13: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 13

Logits

• Der natürliche Logarithmus einer Odds wird Logit genannt.

• L[Y=1] = ln(O[Y=1]) O[Y=1] = exp(L[Y=1]) P[Y=1] = exp(L[Y=1]) / (1 + exp(L[Y=1])) = 1 / (1 + exp(-L[Y=1])

• Wertebereich eines Logits: ]-∞,∞[

• Der Schritt zur multivariaten Regression Beschreibe den Logit eines Ereignisses durch einen Score, der sich additiv aus gewichteten Komponenten ergibt → linearer Prädiktor

Page 14: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 14

Logit und Wahrscheinlichkeit

]xexp[1]xexp[

]x|1Y[P

-4 -2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

linearer Praediktor (x)

Wa

hrs

che

inlic

hke

it fü

r O

utc

om

e

Es gibt noch weitere Möglichkeiten den Zusammenhang zwischen linearem Prädiktor und Wahrscheinlichkeit herzustellen: z.B. probit.

Page 15: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 15

Logistische Regression

Zusammenhang zwischen der individuellen Erkrankungswahrscheinlichkeit und ihren Einflussfaktoren:

Linearer Prädiktor: a0+a1x1+…+amxm

Regressionskoeffizienten: ai; i = 0,…, m

Kennt man die Ausprägung der Einflussfaktoren und die Werte der Regressionskoeffizienten, so kann man für einen beobachteten Satz von Einflussfaktoren die damit zusammenhängende Erkrankungswahrscheinlichkeit berechnen.

Konstruktionsprinzip für klinische und epidemiologische Scores!

]xa...xaaexp[1

]xa...xaaexp[]x,...,x|1Y[P

mm110

mm110m1

Page 16: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 16

Linearer Prädiktor

Der lineare Prädiktor fasst die verschiedenen Einflussgrößen zu einer Zahl zusammen: Risikoscore.

Je höher der Wert des linearen Prädiktors für einen Patienten, desto höher ist die W‘keit, an der interessierenden Erkrankung erkrankt zu sein. Negative Werte des linearen Prädiktors stehen für geringere Erkrankungsw‘keiten.

Falls im Risikomodell nur die Familienanamnese (XFA: 1 ja, 0 nein) Einfluss hätte, so wäre der lineare Prädiktor a0 + a1∙XFA.

a0: Quantifiziert den Logit für die Erkrankung bei Personen ohne familiäre Belastung

a1: Quantifiziert die Logitveränderung für die Erkrankung bei Personen mit familiärer Belastung gegenüber Personen ohne familiäre Belastung.

Page 17: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 17

Linearer Prädiktor

Berechnen Sie den linearen Prädiktor für eine Person mit positiver Familienanamnese und deren Erkrankungsw‘keit, wenn die beiden Regressionskoeffizienten folgende Werte haben: a0=-1, a1=2.

Machen Sie die analoge Rechnung auch für eine Person mit negativer Familienanamnese.

Page 18: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 18

Linearer Prädiktor

XFA = 0 linearer Prädiktor: -1 + 2∙0 = -1, individuelle W‘keit P[Y=1|XFA=0] = exp(-1)/[1+exp(-1)] = 0.269

XFA = 1 linearer Prädiktor: -1 + 2∙1 = 1, individuelle W‘keit P[Y=1|XFA=1] = exp(1)/[1+exp(1)] = 0.731

linearer Prädiktor a0 + a1∙XFA

a0=-1, a1=2

Page 19: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 19

Linearer Prädiktor

Eine etwas komplexere Situation:

Linearer Prädikor: a0 + a1∙XFA+a2∙XPSA

XFA = 0: negative Familienanamnese, 1: positive Familienanamnese.

XPSA = PSA Wert

a0=-1, a1=1, a2=2

Berechne den Wert des linearen Prädiktors für eine Person, die

Neg. Familienanamn. und einen PSA-Wert von 2 hat?Neg. Familienanamn. und einen PSA-Wert von 4 hat? Pos. Familienanamn. und einen PSA-Wert von 3 hat?

Page 20: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 20

Linearer Prädiktor

Berechne den Wert des linearen Prädiktors für eine Person, die

Neg. Familienanamn. und einen PSA-Wert von 2 hat. -1+1∙0+2∙2 = 3Neg. Familienanamn. und einen PSA-Wert von 4 hat. -1+1∙0+2∙4 = 7Pos. Familienanamn. und einen PSA-Wert von 3 hat. -1+1∙1+2∙3 = 6

a0=-1, a1=1, a2=2

Wer von diesen Personen hat das höchste Risiko für ein Prostatakarzinom?

Was erhöht das Risiko mehr: eine positive Familienanamnese oder die Zunahme des PSA-Wertes um eine Einheit?

Wie soll die Veränderung gemessen werden?

• In Differenzen: Logit-Skala

• Multiplikative Veränderung: Odds-Skala → Odds-Ratio (OR)

Page 21: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 21

Regressionskoeffizienten und Odds Ratio

Odds für die Erkrankung bei Faktorkonstellation X

O(X) = P[Y=1|X]/P[Y=0|X]: Um wie viel ist es wahrscheinlicher bei Konstellation X zu erkranken als nicht zu erkranken

Die Ausprägungen der Konstellationen X und X* sind in allen Variablen identisch, bis auf die Variable i. Der Wert der Variablen i in X ist um eine Einheit größer als der Wert der Variablen i in X*.

Dann gilt: ORi = O(X)/O(X*) = exp(ai)

Die exponierten Regressionskoeffizienten können somit als Odds Ratios interpretiert werden.

Die Wirkung eines Einflussfaktors auf das Risiko wird durch das Vorzeichen des Regressionskoeffizienten ausgedrückt:

a = 0 kein Einfluss des Faktorsa < 0 Faktor senkt die Wahrscheinlichkeita > 0 Faktor erhöht die Wahrscheinlichkeit

Page 22: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 22

Odds Ratio

XFA = 0: negative Familienanamnese, 1: positive Familienanamnese.XPSA = PSA Wert

Linearer Prädikor: -1 + 1∙XFA+2∙XPSA

Kovariablenvektor pro Patient (XFA, XPSA)

X = (0, 3) und X* = (0, 4): Patient X hat keine familiären Belastungen und PSA Messung 3, LP = 5Patient X* hat keine familiären Belastungen und PSA Messung 4, LP = 7

Berechne das OR für den Faktor PSA

P[Y=1|X] = exp(5)/(1+exp(5)) = 0.9933 O(X) = P[Y=1|X]/P[Y=0|X] = 0.9933/0.0067 = 148.254P[Y=1|X*] = exp(7)/(1+exp(7)) = 0.9991

O(X*) = P[Y=1|X*]/P[Y=0|X*] = 0.9991/0.0009 = 1110.111

OR = O(X*) / O(X) = 1110.111/ 148.254 = 7.487899 = exp(2)

Page 23: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 23

Odds Ratio

Odds für die Erkrankung mit (X=1)

OR = ------------------------------------------ = exp(logOR) = exp(a)

Odds für die Erkrankung mit (X=0)

OR > 1 : a > 0 (positiver Zusammenhang - Risiko wird erhöht)OR < 1 : a < 0 (negativer Zusammenhang - Risiko nimmt ab)OR = 1 : a = 0 (kein Zusammenhang)

Berichte des OR in Artikeln:

95%-Konfidenzintervall für OR, p-Wert für OR: falls p<0.05, so bedeutet dies, dass das OR signifikant von 1 verschieden ist und der Risikofaktor einen Effekt auf die Erkrankungsodds hat.

Oft werden auch die Regressionskoeffizienten berichtet, die in OR umgerechnet werden können - oder umgekehrt.

Page 24: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 24

Schätzen der Koeffizienten in der log. Reg.

• Es wird ein Modell für die W‘keit der Erkrankung in einer spezifischen Teilgruppe formuliert: Angabe, welche Faktoren wie codiert eine Rolle spielen.

• Somit gilt für individuelle W‘keiten in einer durch den Vektor X beschriebenen Teilmenge das Modell:

• Durch die Kombination von Modell und beobachteten individuellen Krankheitszuständen lässt sich die Likelihood der vorliegenden Daten berechnen. Die Likelihood ist eine Funktion der nicht spezifizierten Regressionskoeffizienten a1, …, am.

• Die Maximierung der Likelihood ergibt die Schätzung der gesuchten Parameter. Weiterhin können Konfidenzintervalle berechnet werden, sowie p-Werte für die Nullhypothese, dass ai=0 ist.

]xa...xaaexp[1

]xa...xaaexp[]x,...,x|1Y[P

mm110

mm110m1

Page 25: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 25

Fragen an die Daten

1. Was ist das OR für die Familienanamnese des Prostatakarzinoms?

2. Erhöht oder erniedrigt eine positive Familienanamnese die Odds für ein Prostatakarzinom.

3. Um wie viel verändert sich die Odds?

4. Ist dieser Effekt statistisch signifikant? Warum?

5. Ist der Effekt eines positiven DRE-Befundes größer als der einer pos. Familienanamnese?

6. In welchem Bereich liegt der Effekt einer positiven DRE?

7. Wird durch eine vorherige Biopsie (auch wenn negativ ausgefallen) die Odds für ein Prostatakarzinom erhöht?

8. Wird durch den logPSA-Wert die Odds für ein Prostatakarzinom erhöht oder erniedrigt? Interpretieren Sie den Wert des OR für die logPSA Messung.

9. Ist PSA der einzige Risikofaktor, den ein Arzt in Betracht ziehen soll, wenn er einen Patienten über sein Prostatakarzinomrisiko berät und die Durchführung einer Biopsie in Betracht zieht?

Page 26: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 26

Darstellung eines komplexen Ergebnisses

]xa...xaaexp[1

]xa...xaaexp[]x,...,x|1Y[P

mm110

mm110m1

Unsicherheit aufgrund der SchätzungKonfidenzbänder für Risikoschätzer

Ris

iko f

ür

Pro

stata

karz

inom

Ris

iko f

ür

fort

gesc

hri

tten

es

Pro

stata

karz

inom

Page 27: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 27

Überlebenswahrscheinlichkeiten

Wie verändert sich die Überlebenswahrscheinlichkeit (Kaplan-Meier-Kurve) in Abhängigkeit von Kovariablen und prognostischen Faktoren?

Proportional-Hazards-Modell von D. R. Cox (1972)

S(t|x) = S0(t)exp(a1∙x1 + … + ak∙xk)

S0(t): Baseline-Überlebenskurve

S0(t) = exp[-Λ0(t)]

Λ0(t): Kumulierte Baselinehazard, Patienten sammeln mit fort- schreitender Zeit immer mehr „Sterberisiko“ (Hazard), positive, monotone Funktion

Kumulativer Hazard einer Patientengruppe mit Kovariablenstruktur x:

Λ(t|x) = Λ0(t)∙exp(a1∙x1 + … + ak∙xk)

Page 28: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 28

Überlebenswahrscheinlichkeiten

Linearer Prädiktor: a1∙x1 + … + ak∙xk

Linearer Prädiktor

< 0 - Überlebenswahrscheinlichkeit erhöht sich = 0 - Überlebenswahrscheinlichkeit identisch mit Baselinegruppe > 0 - Überlebenswahrscheinlichkeit erniedrigt sich

Beispiel:

Linearer Prädiktor: - 0.5∙Klinik_B + 1∙Prognosestadium

Klinik_B: 0 falls Patient in Klinik A behandelt wurde 1 falls Patient in Klinik B behandelt wurde

Prognosestadium: 0 gute Prognose1 schlechte Prognose

5-Jahres Überleben in Gruppe (0,0): 0.7Wie sieht das 5-Jahres Überleben in den anderen Gruppen aus?

Page 29: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 29

Überlebenswahrscheinlichkeiten

Linearer Prädiktor: - 0.5∙Klinik_B + 1∙Prognosestadium

Klinik_B: 0 falls Patient in Klinik A behandelt wurde 1 falls Patient in Klinik B behandelt wurde

Prognosestadium: 0 gute Prognose1 schlechte Prognose

5-Jahres-Überleben in Gruppe

(0, 0): LP = 0 exp(0) = 1 5-Jahres-Rate: 0.71 = 0,7

(0, 1): LP = 1 exp(1) = 2.72 5-Jahres-Rate: 0.72.72 = 0,379

(1, 0): LP = -0.5exp(-0.5) = 0.61 5-Jahres-Rate: 0.70.61 = 0,804

(1, 1): LP = 0.5 exp(0.5) = 1.65 5-Jahres-Rate: 0.71.65 = 0,555

Praktische Konsequenzen?

Page 30: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 30

Kurative Resektion des Rektumkarzinoms

Ueberleben in Monaten

Ue

be

rle

be

nsw

'ke

it

0 10 20 30 40 50 60

0.0

0.2

0.4

0.6

0.8

1.0

Klinik AKlinik B

Einfluss der Klinik auf das UeberlebenKlinik A: 309 Pat.

Klinik B: 196 Pat.

Page 31: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 31

Ueberleben in Monaten

Ue

be

rle

be

nsw

'ke

it

0 10 20 30 40 50 60

0.0

0.2

0.4

0.6

0.8

1.0

Stadium IStadium IIStadium III

Einfluss des Tumorstadiums auf das Ueberleben

Patientenzahlen zu den Stadien auf den nächsten Folien

Kurative Resektion des Rektumkarzinoms

Page 32: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 32

Unterscheidet sich das Überleben von kurativ resezierten Patienten mit Rektumkarzinom zwischen Klinik A und Klinik B?Log-Rank-Test

N Observed Expected (O-E)^2/E B 196 45 60.68 4.050A 309 100 84.32 2.914Chisq= 7 on 1 degrees of freedom, p= 0.008278

Sind die Kliniken hinsichtlich ihres Patientengutes vergleichbar?Chi-Quadrat-Test

Stadium I Stadium 2 Stadium 3 SummeB 33(16.8) 70(35.7) 93(47.5) 196A 84(27.2) 100(32.4) 125(40.4) 309

Chi² = 7.3026, FG = 2, p = 0.026

Kurative Resektion des Rektumkarzinoms

Page 33: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 33

Stadium Klinik Fallzahl D (beobachtet)

E (erwartet)

SMR D/E RH

I B 33 2 2.59 0.772 0.71

A 84 7 6.41 1.092

II B 70 8 13.44 0.595 0.45

A 100 23 17.56 1.310

III B 93 35 52.79 0.663 0.49

A 125 70 52.21 1.341

Kurative Resektion des Rektumkarzinoms

SMR: Standardisierte Mortalitätsrate: Wie ist das Verhältnis von beobachteten zu erwarteten Todesfällen, wenn beide Kliniken sich im Mortalitätsrisiko nicht unterscheiden?

RH: relativer Hazard - wie verhält sich die SMR von Klinik B zu der von Klinik A (Klink A ist Bezugsgröße)

Page 34: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 34

Klinik Stadium N D E SMR RH

A I 84 7 32.7 0.21

II 100 23 35.6 0.65 3.02

III 125 70 31.2 1.97 3.42

B I 33 2 8.47 0.23

II 70 8 16.89 0.47 2.01

III 93 35 19.84 1.78 3.70

Kurative Resektion des Rektumkarzinoms

SMR: Standardisierte Mortalitätsrate: Wie ist das Verhältnis von beobachteten zu erwarteten Todesfällen, wenn die drei Stadien sich im Mortalitätsrisiko nicht unterscheiden?

RH: relativer Hazard - wie verhält sich die SMR zum nächst besseren Stadium (Für Stadium III ist Stadium II Bezugsgröße, für Stadium II ist Stadium I Bezugsgröße: Risikoveränderung beim Wechseln ins nächste Stadium)

Page 35: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 35

Hazard Ratio lower .95 upper .95 stage.2 2.799 1.332 5.882stage.3 3.574 2.390 5.346klinik_b 0.488 0.343 0.696

Klinik / Stadium I II III

A 1 2.8 2.83.6

B 0.5 2.80.5 2.83.60.5

Kurative Resektion des Rektumkarzinoms

Der Effekt der Klinik auf die Veränderung der SMR ist homogen über die Stadien. Der Effekt der Stadien auf die Veränderung der SMR ist homogen über die Kliniken.

Beide Faktoren (Stadium und Klinik) werden als unabhängige Faktoren in einer multivariaten Coxregression modelliert und ihre Effekte aufs Überleben quantifiziert.

Hieraus lässt sich für jede Kombination (Klinik, Stadium) der Faktor berechnen mit dem die Überlebensinformation der Bezugsgruppe (Klinik A, Stadium I) verändert wird.

Page 36: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 36

0 10 20 30 40 50 60

0.0

0.2

0.4

0.6

0.8

1.0

Zeit in Monaten

Ue

be

rle

be

n

Klinik A

0 10 20 30 40 50 60

0.0

0.2

0.4

0.6

0.8

1.0

Zeit in MonatenU

eb

erl

eb

en

Klinik B

Kurative Resektion des Rektumkarzinoms

Vergleich von beobachtetem Überleben mit den Überlebenskurven, die das Cox-Modell aus den Daten schätzen würde. Modell und Wirklichkeit stimmen gut überein. Somit sind auch die aus dem Modell und der Analyse gezogenen Schlussfolgerungen ernst zu nehmen.

Page 37: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 37

Klinik B ist die deutlich bessere Klinik.

Wie die Klinik auf das Überleben wirkt, konnte in einem multivariaten Proportional-Hazards-Modell quantifiziert werden: Hat ein Patient in Klinik A die Überlebenswahrscheinlichkeit SA(t), so gilt für die Klinik B

SB(t) = SA(t)0.5

Die folgende Tabelle gibt den formalen Zusammenhang nochmals an Beispielen wieder:

Überleben in Klinik A 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90Überleben in Klinik B 0.32 0.45 0.55 0.63 0.71 0.77 0.84 0.89 0.95Rel. Risiko 3.16 2.24 1.83 1.58 1.41 1.29 1.20 1.12 1.05

Das Beispiel macht auch klar, dass der relative Hazard nicht mit dem relativen Risiko identisch ist. Während sich das relative Risiko je nach Sterbewahrscheinlichkeit zwischen den Kliniken ändert, bleibt der relative Hazard konstant.

Kurative Resektion des Rektumkarzinoms

Page 38: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 38

Zusammenfassung (I)

• Multivariate Verfahren erlauben das Zusammenfassen der Wirkung multipler Effekte auf einen Outcome.

• Damit ist es möglich, Scores zu erstellen, die für Diagnose und Prognose eine schärfere Diskriminierung erlauben.

• Multivariate Verfahren erlauben es ebenso, den Effekt eines Faktors in einem multivariablen Setting zu präzisieren. Dies geschieht durch das Herausrechnen des Effektes der anderen beteiligten Faktoren: Adjustierung.

Page 39: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 39

Zusammenfassung (II)

Typ der abhängigen Variablen

Beispiele Art der multivariaten Regression

Intervallskaliert Gewicht, Blutdruck Multiple lineare Regression,

ANOVA, ANCOVA

Dichotom Überleben eines festen Zeitintervalls

(ja/nein),Krankheit liegt vor

(ja/nein)

Logistische Regression

Zeit bis zu einem Ereignis

Zeit bis zum Tod,Zeit bis zum Rezidiv,

Zeit bis zur Erkrankung

Cox-Modell,Accelerated Failure Time (AFT) Modelle

Seltene Ereignisse,Zählvariablen

Inzidenz seltener Erkrankungen,

Anzahl von Plaques

Poisson-Regression

Page 40: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 40

Zusammenfassung (III)

Fragestellung Multiple lineare Regression

Multiple logistische Regression

Prop. HazardsCox-Modell

Was wird modelliert? Mittelwert der abhängigen Variablen

Logarithmus der Odds der abh. Variablen

(Logit)

Logarithmus des Hazard

Beziehung multipler unabhängiger

Variablen zur abh. Variablen

Der Mittelwert ändert sich linear mit einer

Einheitsänderung der unabhängigen

Variablen

Der Logit ändert sich linear mit einer

Einheitsänderung der unabhängigen

Variablen

Der Log-Hazard ändert sich linear mit einer

Einheitsänderung der unabhängigen Variablen

Verteilung der abhängigen Variablen

Normalverteilung Binomialverteilung Nicht spezifiziert,semiparametrisch

Varianz der abh. Variablen

Gleichmäßig um den Mittelwert

Abhängig von der W‘keit

der einzelnen Gruppe

Nimmt mit zunehmendem Hazard zu

Zensierte Beobachtungen

Kann nicht mit zensierten

Beobachtungen arbeiten

Kann nicht mit zensierten

Beobachtungen arbeiten

Zeiten können rechtszensiert sein

Relative Hazards - - Proportional zueinander,faktorielle Zerlegung

Beziehungen der unabhängigen

Variablen

Möglichst nicht oder nur wenig korreliert

Möglichst nicht oder nur wenig korreliert

Möglichst nicht oder nur wenig korreliert

Beobachtungen Unabhängig Unabhängig Unabhängig

Page 41: IBE, MultVar. (L6-3)1 Multivariate Regressionsverfahren Quantitative Methoden in der klinischen Epidemiologie.

IBE, MultVar. (L6-3) 41

Zusammenfassung (IV)

• Lernziel: Umgang mit dem linearen Prädiktor und dessen Rolle bei komplexen klinischen und epidemiologischen Fragestellungen.

• Nicht behandelt:

- Nicht-lineare Zusammenhänge (Wachstumskurven)

- Auswahl der relevanten unabhängigen Variablen

- Vorgehen bei der Verletzung wichtiger Modellannahmen

- Interaktionseffekte zwischen Faktoren

- abhängige (geclusterte) Beobachtungen

- Modellanpassung und Residualanalyse

- Hypothesentests und Konfidenzintervalle

- Hintergründe der Schätzverfahren