Varianz (Statistik)

Aus FLBK-Wiki
Zur Navigation springen Zur Suche springen

Wurden Merkmalsausprägungen zu einem quantitativen Merkmal erhoben, ist die Varianz das arithmetische Mittel der quadrierten Abweichungen der Merkmalsausprägungen vom Mittelwert. Die Varianz quantifiziert also, wie stark die einzelnen Datenpunkte im Datensatz um den Mittelwert streuen.

Definition

Es sei eine Zahlenfolge [math]\displaystyle{ x_1,x_2,...,x_n \in \mathbb{R} }[/math] mit [math]\displaystyle{ n \in \mathbb{N} }[/math] und dem arithmetischen Mittel [math]\displaystyle{ \bar{x} }[/math] gegeben, dann heißt [math]\displaystyle{ s^2=\frac{(x_1-\bar{x})^1+(x_1-\bar{x})^2+...+(x_n-\bar{x})^n}{n} }[/math] Varianz.

Varianz und Häufigkeiten

Es sei [math]\displaystyle{ a_i }[/math] die absolute Häufigkeit der Merkmalsausprägung [math]\displaystyle{ x_i }[/math] eines quantitativen Merkmals mit [math]\displaystyle{ n,a_i\in\mathbb{N} }[/math], [math]\displaystyle{ i \in \{1,...,n\} }[/math], [math]\displaystyle{ x_i \in \mathbb{R} }[/math] und [math]\displaystyle{ \bar{x} }[/math] das arithmetische Mittel. Der Erhebungsumfang ist [math]\displaystyle{ n }[/math]. Der Wert [math]\displaystyle{ s^2=\frac{a_1\cdot (x_1-\bar{x})^2+a_2 \cdot (x_1-\bar{x})^2+...+a_n \cdot (x_n-\bar{x})^n}{n} }[/math] heißt Varianz.

Standardabweichung

Es sei eine Zahlenfolge [math]\displaystyle{ x_1,x_2,...,x_n \in \mathbb{R} }[/math] mit [math]\displaystyle{ n \in \mathbb{N} }[/math] und der Varianz [math]\displaystyle{ s^2 }[/math] gegeben, dann heißt [math]\displaystyle{ s=\sqrt{s^2} }[/math] Standardabweichung.

Beispiele

Varianz und Standardabweichung berechnen

Die folgende Tabelle zeigt ein Beispiel für eine Urliste. Die Stichprobe besteht aus den betrachteten Schülern. Es wird für das quantitative Merkmal Körpergröße in cm die Varianz berechnet.

Schüler Nr. 1 2 3 4 5 6 7 8 9
Körpergröße in cm 183 172 163 154 158 166 177 188 190
  1. Die Merkmalsausprägungen des Merkmals Körpergröße in cm sind die Werte 183; 172; 163; 154; 158; 166; 177; 188; 190.
  2. Der Erhebungsumfang beträgt 9, da die Körpergröße von 9 Schülern erhoben wurde.
  3. Das arithmetische Mittel ist [math]\displaystyle{ \bar{x}=\frac{183+ 172+ 163+ 154+ 158+ 166+ 177+ 188+ 190}{9}\approx172,33 }[/math]
  4. Die Varianz ist [math]\displaystyle{ s^2=\frac{(183-172,33)^2+(172-172,33)^2+(163-172,33)^2+(154-172,33)^2+(158-172,33)^2+(166-172,33)^2+(177-172,33)^2+(188-172,33)^2+(190-172,33)^2}{9}\approx 151,23 }[/math]
  5. Die Standardabweichung ist [math]\displaystyle{ s=\sqrt{151,23} \approx 12,29 }[/math]

Varianz und Standardabweichung mit Häufigkeiten berechnen

Fügen wir noch einen 10. Schüler mit der Körpergröße 154 cm hinzu, so erhalten wir die folgende Urliste:

Schüler Nr. 1 2 3 4 5 6 7 8 9 10
Körpergröße in cm 183 172 163 154 158 166 177 188 190 154
  1. Die Merkmalsausprägungen des Merkmals Körpergröße in cm sind die Werte 183; 172; 163; 154; 158; 166; 177; 188; 190; 154.
  2. Der Erhebungsumfang beträgt 10, da die Körpergröße von 10 Schülern erhoben wurde.
  3. Die absolute Häufigkeit der Merkmalsausprägung 154 ist 2, da zwei Schüler 154 cm groß sind.
  4. Die absoluten Häufigkeiten der restlichen Merkmalsausprägungen sind 1, da jede andere Körpergröße nur genau einmal vorkommt.
  5. Das arithmetische Mittel ist [math]\displaystyle{ \bar{x}=\frac{183+ 172+ 163+ 154+ 158+ 166+ 177+ 188+ 190 + 2 \cdot 154}{10} = 170,5 }[/math]
  6. Die Varianz ist [math]\displaystyle{ s^2=\frac{2 \cdot (154-170,5)^2+(183-170,5)^2+(172-170,5)^2+(163-170,5)^2+(158-170,5)^2+(166-170,5)^2+(177-170,5)^2+(188-170,5)^2+(190-170,5)^2+(190-170,5)^2}{10} =177,25 }[/math]
  7. Die Standardabweichung ist [math]\displaystyle{ s=\sqrt{177,25} \approx 13,31 }[/math]

Die Abweichung vom Mittelwert ist in diesem Beispiel größer als zuvor. Die Körpergrößen der Schüler weisen also eine höhere Streuung auf.