Was macht eine multiple Regression
Sie beachtet die Einflüsse mehrere Prädiktoren gleichzeitig
Was sind orthogonale Variablen?
Variablen, die nicht miteinander korreliert sind
Wie sieht die erweiterte Modellgleichung auf zwei Prädiktoren aus?
^Y = b1 * X1 + b2 * X2 + a
Weiteres Vorgehen: Gesucht werden b1, b2 und a mit denen die Summe der quadrierten Abweichungen der vorhergesagten von den empirischen Werten (also den Residuen) minimal wird
Visualisierung einer multiplen Regression
Berechnung einer multiplen Regression mit R
Bestimmung der Koeffizienten bei orthogonalen Prädiktoren
Zentruid
Aus dem Mittelwert von X1, X2 und dem Mittelwert von Y kann man dem Mittelwert nehmen. Dieser Wert liegt immer auf der Regressionsgeraden/-ebenen und heißt Zentruid
aufgeklärte Varianz R²
Allgemeiner Ansatz bei intervallskalierten Prädiktoren und Kriterium: q-viele Prädiktoren
Allgemeiner Ansatz bei intervallskalierten Prädiktoren und Kriterium: Interpretation der Regressionsgewichte einer multiplen Regression
Visualisierung der Wirkung eines Prädiktors bei Konstant halten des anderen Prädiktors
Prädiktor-Effekt-Plots
Paket: effects
Die Grundidee ist dabei, für jeden Prädiktor eine bedingte Regressionsgerade zu visualisieren, während alle anderen Prädiktoren auf einen festen Wert gesetzt werden; der Standwert ist hierbei der Mittelwert aller
Beobachtungen auf den jeweiligen Prädiktoren.
Unstandardisierte vs. standardisierte Regressionsgewichte
standardisierte Regressionsgewichte bei einfacher lineare Regression
standardisierte Regressionsgewichte bei einfacher multipler Regression
Alternative Berechnung von ß
ßp = bp * (Sxp / Sy)
Mit R:
1. Modell der Regression ganz einfach mit unstandardisierten Variablen berechnen: modell <- lm(Kriterium ~ Prädiktor1 + Prädiktor2, data = daten)
Allgemeiner Ansatz bei intervallskalierten Prädiktoren und Kriterium: Güte des Regressionsmodells
i.d.R. R²
Problem: bei Hinzunahme eines weiteren Prädiktors muss der Anteil der aufgeklärten Varianz fast zwangsläufig größer werden -> daher Anpassung und andere Maße, die gleichzeitig die Anzahl der Prädiktoren mit verrechnen, um dies zu berücksichtigen
Güte des Regressionsmodells: adjustiertes R²
Interferenzstatistik: allgemeiner Modelltest
Interferenzstatistik: allgemeiner Modelltest: totale Quadratsumme
Die totale Quadratsumme ergibt sich aus der Summe der quadrierten Abweichungen der Daten vom Mittelwert des Kriteriums:
n
SStotal = ∑ (y1 - My)²
i = 1
Interferenzstatistik: allgemeiner Modelltest: Fehler-Quadratsumme
ergibt sich aus der Summe der quadrierten Residuuen:
n
SSfehler= ∑ e²i
i = 1
Interferenzstatistik: allgemeiner Modelltest: Modell-Quadratsumme
ergibt sich aus der Summe der quadrierten Abweichungen der Regressionsgeraden (der vorhergesagten Werte) vom Mittelwert des Kriteriums:
n
SSmodell = ∑ (^yi - My) ²
i = 1
Interferenzstatistik: allgemeiner Modelltest: Mittlere Quadratsummen und F -Bruch
Interferenzstatsitik: allgemeiner Modelltest: multiple Regression
völlig Identisch zur linearen Regression
Tests der Regressionskoeffizienten: einfache lineare Regression