Um mit R zufällig bestimmte Fälle aus einer Stichprobe auszuwählen, wird folgender Befehl eingesetzt:
mydata.sub <- mydata[sample(100, 10), ]
Aus den Zeilen (Fällen) des Datensatzes mydata werden 10 von 100 Fällen zufällig gezogen.
Beispiel: In einer Stichprobe befinden sich zu viele weibliche Teilnehmer. Durch Sampling soll ein repräsentatives Geschlechtsverhältnis erreicht werden.
Vorgehen
Zunächst wird ein Datensatz gebildet, der alle männlichen Teilnehmer enthält
DatenM <- Daten[which(Daten$Sex=="männlich"),]
Und ein Datensatz, der alle weiblichen Teilnehmer umfasst.
DatenF <- Daten[which(Daten$Sex=="weiblich"),]
Aus dem Datensatz mit den weiblichen Teilnehmern werden durch Sampling so viele Fälle gezogen, bis das Verhältnis mit dem Merkmal in der Grundgesamtheit übereinstimmt.
DatenFS <- DatenF[sample(3134, 2466), ]
Die beiden Datensätze werden mit rbind wieder zusammengeführt.
DatenN <- rbind(DatenM,DatenFS)
Das Geschlechtsverhältnis wird kontrolliert.
table(DatenN$Sex)
table(DatenN$Sex)/length(DatenN$Sex)*100
Weiterführende Links
Keine Kommentare:
Kommentar veröffentlichen