Dienstag, 20. September 2011

Regressionsanalyse mit R

Regressionsanalysen werden in R mit Hilfe des Allgemeinen Linearen Modells berechnet. Abhängige (Kriterium) und unabhängige (Prädiktoren) werden als Formel eingegeben.

fit <- lm(DatenEmpl$income ~ DatenEmpl$sex + DatenEmpl$age, data=DatenEmpl)
summary(fit)

Die abhängige Variable lautet in diesem Beispiel income (Einkommen) und wird mittels Geschlecht und Alter vorhergesagt. Das Ergebnis wird mit summary(fit) ausgegeben und umfasst die Gewichte, die Konstante sowie die Varianzaufklärung R²:

Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)   1027.743    187.240   5.489 4.77e-08 ***
DatenEmpl$sex 1040.789     96.128  10.827  < 2e-16 ***
DatenEmpl$age   53.812      5.001  10.760  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1806 on 1437 degrees of freedom
  (28 observations deleted due to missingness)
Multiple R-squared: 0.1466,     Adjusted R-squared: 0.1454
F-statistic: 123.4 on 2 and 1437 DF,  p-value: < 2.2e-16

Für standardisierte Gewichte, können die Variablen vorher z-transformiert (M = 0; SD = 1) werden

DatenEmpl$income <- scale(DatenEmpl$income)

Sollen zwei Modelle verglichen werden, geht dies mit dem ANOVA-Modell:

fit1 <- lm(DatenEmpl$income ~ DatenEmpl$sex + DatenEmpl$age + DatenEmpl$qual, data=DatenEmpl)
fit2 <- lm(DatenEmpl$income ~ DatenEmpl$sex + DatenEmpl$age + DatenEmpl$qual + DatenEmpl$N + DatenEmpl$E, data=DatenEmpl)
anova(fit1, fit2)

Weitere Posts in diesem Blog

Weitere Hilfe im Internet

Keine Kommentare:

Kommentar veröffentlichen