24. “Statistische Verzerrung”

24. “Statistische Verzerrung” (Deutsche Zusammenfassung von “Statistical Bias” von E. Yudkowsky)

Angenommen das durchschnittliche Gewicht deutscher Frauen ist 75Kg. Dies ist der “wahre” Wert.

Natürlich ist es nahezu unmöglich alle deutschen Frauen vor eine Waage zu zerren, also muss man sich einer Schätzung bedienen. Wie das? Man könnte das Gewicht von 100 zufällig ausgewählten Frauen (i.e. eine randomisierte Stichprobe) messen und berechnet dann den Mittelwert(=m). Dieser Mittelwert stellt nun eine recht gute Schätzung für den wahren Populationsmittelwert(=M) dar. Doch es ist unwahrscheinlich, dass die Schätzung perfekt ist.

Nun gilt wohl folgendes: M = m + zufälliger Fehler + systematischer Fehler

Der zufällige Fehler wird einfach durch Zufall bestimmt. Vielleicht haben wir durch Zufall einfach eine 300Kg-Hüpfburg von Frau ausgewählt, die nun den Durchschnitt verzerrt.

Der systematische Fehler (auch statistische Verzerrung genannt) geschieht bei der Auswahl aller Stichproben. Vielleicht ist z.B. unsere Waage fehlerhaft und zeigt immer um 1Kg zu wenig an. Oder die Experimentatoren sind halbblind und lesen z.B 90 Kg immer als 80Kg.

Wenn wir den systematischen Fehler beseitigen können, gilt nach dem Gesetz der großen Zahl, dass der Mittelwert der Stichprobe sich immer mehr dem Mittelwert der Gesamtpopulation annähert, je größer die Stichprobenzahl ist. (Genau genommen gilt, dass die Wahrscheinlichkeit eines geringen Abstands von M zu m mit größerem n zunimmt)

Ach, man kann Mathematik schlecht in Worten widergeben. Die Formel ist:

limes von m wenn n gegen unendlich: M

Leave a Reply