Dienstag, 30. August 2011

Mittelwertvergleiche mit R (boxplot, t-Test, ANOVA)

Ein einfacher Mittelwertvergleich beginnt mit einem Boxplot:

boxplot(Daten$IQ ~ Daten$Geschlecht)

Das Ergebnis ist eine Grafik, die sich leicht in anderen Anwendungen wiederverwenden oder speichern lässt:

Boxplot: IQ über Geschlecht und Missings
boxplot(Daten$IQ ~ Daten$Geschlecht, col="red")

zaubert rote Farbe in die Grafik.

t-Test

Für den t-Test gibt es den einfachen Befehl t.test(y~x), wobei y ein numerischer Wert (z.B. IQ) ist und x die Gruppenzugehörigkeit binär codiert.

Effektstärke berechnen (Cohens d)

Um auch die Effektstäre zu berechnen, benötigt man das Paket lsr

install.packages(„lsr“)

library(lsr)

cohensD(Daten$IQ ~ Daten$Geschlecht)


Für die Effektgröße gilt:

.20 ~ kleiner Effekt

.50 ~ mittlerer Effekt

.80 ~ großer Effekt

Mehr über t-Tests mit R:


Einfaktorielle Varianzanalyse

Eine einfache Varianzanalyse rechnet sich mit

Ergebnis<-aov(Daten$IQ ~ Daten$Geschlecht)
summary(Ergebnis)
plot(Ergebnis)
coefficients(Ergebnis) 

Mit dem Levene Test aus dem Modell car kann die Varianzhomogenität als Voraussetzung der Varinazanalyse überprüft werden (der Levene Test sollte nicht signifikant sein):

library(car)
leveneTest(Varianzanalyse)

Mit eta_sq aus dem Paket sjstats lässt sich zusätzlich die Varianzaufklärung R² berechnen ("between  group sum-of-squares" geteilt durch "total sum-of-squares".)

library(sjstats)
eta_sq(Varianzanalyse)

Wichtig: Vor dem Rechnen der Varianzanalyse müssen fehlende Werte (Missings) entsprechend gesetzt worden sein (siehe dazu Umgang mit fehlenden Werten in R in diesem Blog).

Keine Kommentare:

Kommentar veröffentlichen