Dienstag, 24. April 2012

Zufallsstichproben mit R

Konnte man keine echte Zufallsstichprobe ziehen, kann es sinnvoll sein, über das Quotenverfahren eine Stichprobe herzustellen, die in wesentlichen Merkmalen (z.B. Alter, Geschlecht oder Arbeitslosenquote) der Grundgesamtheit gleicht. Dieses Vorgehen wird auch Sampling genannt.

Um mit R zufällig bestimmte Fälle aus einer Stichprobe auszuwählen, wird folgender Befehl eingesetzt:

mydata.sub <- mydata[sample(100, 10), ]
 
Aus den Zeilen (Fällen) des Datensatzes mydata werden 10 von 100 Fällen zufällig gezogen.


Beispiel: In einer Stichprobe befinden sich zu viele weibliche Teilnehmer. Durch Sampling soll ein repräsentatives Geschlechtsverhältnis erreicht werden.

Vorgehen

Zunächst wird ein Datensatz gebildet, der alle männlichen Teilnehmer enthält

DatenM <- Daten[which(Daten$Sex=="männlich"),]

Und ein Datensatz, der alle weiblichen Teilnehmer umfasst.

DatenF <- Daten[which(Daten$Sex=="weiblich"),]

Aus dem Datensatz mit den weiblichen Teilnehmern werden durch Sampling so viele Fälle gezogen, bis das Verhältnis mit dem Merkmal in der Grundgesamtheit übereinstimmt.

DatenFS <- DatenF[sample(3134, 2466), ]

Die beiden Datensätze werden mit rbind wieder zusammengeführt.

DatenN <- rbind(DatenM,DatenFS)

Das Geschlechtsverhältnis wird kontrolliert.

table(DatenN$Sex)
table(DatenN$Sex)/length(DatenN$Sex)*100


Weiterführende Links


Keine Kommentare:

Kommentar veröffentlichen