Lineare Regression - Modellspezifikation und Modellparameter
Modelschätzung
require(MASS)model_ses <-lm(data = nlschools, IQ ~ SES)summary(model_ses)
Call:
lm(formula = IQ ~ SES, data = nlschools)
Residuals:
Min 1Q Median 3Q Max
-8.2659 -1.1651 0.0345 1.2147 6.4551
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.163000 0.112430 90.39 <2e-16 ***
SES 0.060084 0.003764 15.96 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.963 on 2285 degrees of freedom
Multiple R-squared: 0.1004, Adjusted R-squared: 0.09996
F-statistic: 254.9 on 1 and 2285 DF, p-value: < 2.2e-16
Modelvorhersahen
# beta 0 (Intercept)b0 =10.163000# beta 1 (Steigung)b1 =0.060084# X-Werte für die erwartete Y-Werte geschätzt werden sollenx =0:10# Schätzen wir die Y-Werte mit der Formel der Regressionvorhersagen <- b0 + b1 * x# Speichern wir die Ergebnisse in einer Tabellevorhersagen_df <-data.frame(SES = x, IQ =round(vorhersagen, 3))
Error in geom_text_repel(data = intercept_0, box.padding = 0.5, hjust = "left", : could not find function "geom_text_repel"
Error in eval(expr, envir, enclos): object 'plot_reg' not found
Interpretation der Ergebnisse:
je höher SES, desto höher die Performanz der Schüler:innen.
Zusätzlich können wir der Effekt von SES auf die Perfromanz genau beschreiben:
Wenn SES um eine Einheit steigt, steigt die Performanz um 0.06. Das sollte für alle Schüler:innen ungefähr so stimmen (wir haben keine Gruppen/Klassen berücksichtigt).
Das Modell nimmt an, das der Effekt von SES auf die performance konstant (oder fix) ist. Das bedeutet, dass der geschätzte Effekt für alle Personen gleich ist (oder sein sollte) und nicht von Person zu Person variiert (oder sich nicht zwischen Personengruppen unterschiedet).
Fix-effects sind die Effekte, von denen man ausgeht, dass in der Population vorliegen (stabil sind).
Berücksichtigung der Gruppenzugehörigkeit (1)
Lasst uns die Analyse wiederholen. Allerdings werden wir dabei berücksichtigen, dass die Daten der Schüler:innen aus drei verschiedenen Klassen stammen.
In einem ersten Schritt filtern wir die Daten nach Klassen.
Danach können wir eine einfache Regression für jede Klasse berechnen und die Ergebnisse aus diesen Regressionen vergleichen.
Call:
lm(formula = IQ ~ SES, data = klasse_3)
Residuals:
1 2 3 4 5
0.49420 -0.04297 1.95703 -1.46862 -0.93963
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.39427 1.89266 4.435 0.0213 *
SES 0.10744 0.08994 1.194 0.3181
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.54 on 3 degrees of freedom
Multiple R-squared: 0.3223, Adjusted R-squared: 0.09641
F-statistic: 1.427 on 1 and 3 DF, p-value: 0.3181
Zwischenfazit (1)
Bei der Betrachtung von und stellen wir fest, dass es deutliche Unterschiede zwischen den Klassen gibt hinsichtlich:
deren \(\beta_{0, j}\). Also deutliche Unterschiede in deren “Ausgangsleistungsniveaus”.
Woraun kann man dies erkennen?
\(\beta_{0, j}\) ist der y-Achsenabschnitte, also die erwartete performance wenn SES = 0 ist.
den Zusammenhang zwischen SES und Perfromanz.
dies lässt sich in unterschiedlichen \(\beta_{1, j}\) ablesen (die geschätzte Steigung der Modelle).
Zwischenfazit (2)
Die Zugehörigkeit zu einer Klasse verändert also den Effekt von SES (zumindest deskriptiv). In einer einfachen linearen Regression könnten wir dies nicht sehen, weil das Modell “naiv” gegenüber die Klassenzugehörigkeit der Personen ist.
Es is wahrschienlich am sinnvollsten den Effekt von ses und Klassenzugehörigkeit (Ein fixer between-subjects Faktor mit 3 Stufen: Klasse 1, Klasse 2, Klasse 3) in einem gemeinsammen Modell zu untersuchen:
Bei nur drei Klassen könnten wir Klassenzugehörigkeit als Kontrollvariable im Modell aufnehmen:
lm(data = erste_drei, IQ ~ class + SES)
Dies würde für die Abhängigkeiten, die auf die Klassenzugehörigkeit zurück gehen kontrollieren.
Aber: Wenn wir keine Interaktion zwischen Klasse und ses zulassen, würde unser Modell nur für die Unterschiede der Klassen kontrollieren. Es würde also die Mittelwertsunterschiede der Klassen “heraus rechnen”.
Alternativ könnten wir Klassenzugehörigkeit als einen Moderator (Interaktion zwischen class und SES) im Modell aufnehmen:
Dies würde uns erlauben die unterschiedliche \(\beta_{1, j}\) zu untersuchen.
Zwischenfazit (3)
Fixed-Effects Modelle sind Modelle in denen Prädiktoren aufgenommen werden um, deren Effekte auf einenm Kriterium zu unterscuchen.
Fixed-Effects sind also die Effekte von den Prädiktoren die uns interessieren.
Die Prädiktoren können in dem Modell aufgenommen werden, um dafür zu Kontrollieren, oder ihre “kombinierte” Effekte mit anderen Prädiktoen zu untersuchen.