Signifikanztest

Aus FLBK-Wiki
Zur Navigation springen Zur Suche springen

Ein Signifikanztest ist ein Werkzeug der Wahrscheinlichkeitsrechnung, mit dem überprüft wird, ob eine getroffene Annahme über eine Zufallsvariable auf Grundlage einer Stichprobe beibehalten oder verworfen werden sollte.

Null- und Gegenhypothese

Für die Durchführung eines Signifikanztests werden zwei Hypothesen formuliert:

  • Die Nullhypothese [math]\displaystyle{ H_0 }[/math]: Sie beschreibt die Ausgangsannahme über die Zufallsvariable und wird solange als gültig betrachtet, bis sie durch den Test widerlegt wird.
  • Die Gegenhypothese oder Alternativhypothese [math]\displaystyle{ H_1 }[/math]: Sie stellt die Alternative zu [math]\displaystyle{ H_0 }[/math] dar und wird angenommen, wenn genügend Hinweise vorliegen, dass [math]\displaystyle{ H_0 }[/math] nicht zutrifft.

Definition

Ein Signifikanztest überprüft auf Basis der Wahrscheinlichkeitsverteilung einer Zufallsvariable, ob die Nullhypothese [math]\displaystyle{ H_0 }[/math] auf einem vorgegebenen Signifikanzniveau [math]\displaystyle{ \alpha }[/math] verworfen wird.

  • Wird [math]\displaystyle{ H_0 }[/math] verworfen, spricht man von einem signifikanten Ergebnis.
  • Wird [math]\displaystyle{ H_0 }[/math] nicht verworfen, reichen die vorliegenden Daten nicht aus, um [math]\displaystyle{ H_1 }[/math] zu stützen.

Einseitiger Signifikanztest

Beim einseitigen Signifikanztest wird nur eine Abweichung in eine Richtung untersucht. Die Zufallsvariable [math]\displaystyle{ X }[/math] folgt unter der Nullhypothese einer bekannten Verteilung, z. B. einer Binomialverteilung.

  • Wird eine Abweichung nach oben untersucht, so sprechen wir von einem rechtsseitigen Signifikanztest.
  • Wird eine Abweichung nach unten untersucht, so sprechen wir von einem linksseitigen Signifikanztest.
  • Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] nicht verworfen wird, heißt Annahmebereich.
  • Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] verworfen wird, heißt Verwerfungsbereich.
  • Der Wert, der den Übergang zwischen Annahme- und Verwerfungsbereich angibt, wird kritische Zahl genannt.
  • Die Wahrscheinlichkeit, dass das Testergebnis fälschlicherweise im Verwerfungsbereich liegt, wird Irrtumswahrscheinlichkeit oder Signifikanzniveau [math]\displaystyle{ \alpha }[/math] genannt.

Fehler 1. Art

Ein Fehler 1. Art ([math]\displaystyle{ \alpha-Fehler }[/math]) tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] abgelehnt wird, obwohl sie in Wirklichkeit zutrifft. Die Wahrscheinlichkeit für diesen Fehler entspricht dem Signifikanzniveau [math]\displaystyle{ \alpha }[/math].

Fehler 2. Art

Ein Fehler 2. Art ([math]\displaystyle{ \beta-Fehler }[/math]) tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] beibehalten wird, obwohl sie in Wirklichkeit falsch ist. Die Wahrscheinlichkeit für diesen Fehler wird mit [math]\displaystyle{ \beta }[/math] bezeichnet. Dieser kann bei Signifikanztests nicht berechnen werden, da für die Alternativhypothese keine Wahrscheinlichkeit gegeben ist.

Anwendungen

  • Qualitätskontrollen in der industriellen Fertigung
  • Risikoabschätzung in Versicherungen
  • Analyse von Produktionsprozessen
  • Überprüfung von Hypothesen in betriebswirtschaftlichen Modellen

Beispiele

Qualitätskontrolle mit 20 Teilen (Rechtsseitiger Signifikanztest)

Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von [math]\displaystyle{ n=20 }[/math] Teilen gezogen. Die binomialverteilte Zufallsvariable [math]\displaystyle{ X }[/math] gibt an, wie viele fehlerhafte Teile in der Stichprobe gefunden wurden.

  • Nullhypothese: [math]\displaystyle{ H_0: p = 0,05 }[/math] (Fehlerquote beträgt 5 %).
  • Alternativhypothese: [math]\displaystyle{ H_1: p \gt 0,05 }[/math] (Fehlerquote ist größer als 5 %).

Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.

1. Erwartungswert und Annahmebereich:

Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist

[math]\displaystyle{ \operatorname{E}(X) = n \cdot p_0 = 20 \cdot 0,05 = 1 }[/math].

Der Annahmebereich umfasst alle Werte [math]\displaystyle{ x }[/math], für die [math]\displaystyle{ P(X \ge x) \gt 0,05 }[/math]. Die kleinste Zahl [math]\displaystyle{ x }[/math] mit [math]\displaystyle{ P(X \ge x) \le 0,05 }[/math] ist der kritische Wert. Berechnung:

[math]\displaystyle{ P(X \ge 4) = 1 - P(X \le 3) \approx 0,043 }[/math]

→ Kritischer Wert: [math]\displaystyle{ x_{\text{krit}} = 4 }[/math]

  • Annahmebereich: [math]\displaystyle{ \{0;1;2;3\} }[/math]
  • Verwerfungsbereich: [math]\displaystyle{ \{4;5;\dots;20\} }[/math]

2. Beobachtung: [math]\displaystyle{ X = 2 }[/math], d. h. in der 20-teiligen Stichprobe wurden 2 fehlerhafte Teile gefunden.

3. Entscheidung: Es gilt [math]\displaystyle{ P(X \ge 2) = 0,265 \gt 0,05 }[/math], d. h. die Wahrscheinlichkeit 2 oder mehr fehlerhafte Teile zu finden, ist größer als das Signifikanzniveau [math]\displaystyle{ \alpha=0,05 }[/math]. Liegt eine Fehlerquote von 5 % vor, ist es nicht ungewöhnlich 2 oder mehr fehlerhafte Teile zu finden. [math]\displaystyle{ H_0 }[/math] wird nicht verworfen. Diese Entscheidung wird für alle Werte im Annahmebereich getroffen.

Qualitätskontrolle mit 50 Teilen (Rechtsseitiger Signifikanztest)

Eine Maschine produziert in Serie Teile. Eine Stichprobe von [math]\displaystyle{ n=50 }[/math] Teilen wird gezogen. Die binomialverteilte Zufallsvariable [math]\displaystyle{ X }[/math] gibt an, wie viele fehlerhafte Teile in der Stichprobe gefunden wurden.

  • Nullhypothese: [math]\displaystyle{ H_0: p = 0,02 }[/math] (Fehlerquote beträgt 2 %).
  • Alternativhypothese: [math]\displaystyle{ H_1: p \gt 0,02 }[/math] (Fehlerquote ist größer als 2 %).

Signifikanzniveau: [math]\displaystyle{ \alpha = 0,05 }[/math].

1. Erwartungswert und Annahmebereich:

[math]\displaystyle{ \operatorname{E}(X) = 50 \cdot 0,02 = 1 }[/math]

Berechnung des kritischen Wertes:

[math]\displaystyle{ P(X \ge 3) = 0,047 \le 0,05 }[/math]
[math]\displaystyle{ P(X \ge 2) = 1 - P(X \le 1) \approx 0,264 \gt 0,05 }[/math]

→ Kritischer Wert: [math]\displaystyle{ x_{\text{krit}} = 2 }[/math]

  • Annahmebereich: [math]\displaystyle{ \{0;1;2\} }[/math]
  • Verwerfungsbereich: [math]\displaystyle{ \{3;4,\dots;50\} }[/math]

2. Beobachtung: [math]\displaystyle{ X = 3 }[/math], d. h. in der 50-teiligen Stichprobe wurden 3 fehlerhafte Teile gefunden.

3. Entscheidung: Es gilt [math]\displaystyle{ P(X \ge 3) = 0,047 \lt 0,05 }[/math]. Damit ist das Ergebnis im Verwerfungsbereich. Unter [math]\displaystyle{ H_0 }[/math] wäre es eher ungewöhnlich, 3 oder mehr fehlerhafte Teile zu finden. [math]\displaystyle{ H_0 }[/math] wird verworfen. Diese Entscheidung wird für alle Werte im Verwerfungsbereich getroffen.

Münzwurf-Experiment (Linksseitiger Signifikanztest)

Es wird eine Münze [math]\displaystyle{ n=40 }[/math]-mal geworfen. Die binomialverteilte Zufallsvariable [math]\displaystyle{ X }[/math] gibt an, wie häufig Kopf geworfen wird.

  • Nullhypothese: [math]\displaystyle{ H_0: p = 0,5 }[/math] (Die Wahrscheinlichkeit für Kopf ist 50 %, d. h. die Münze ist fair).
  • Alternativhypothese: [math]\displaystyle{ H_1: p \lt 0,5 }[/math] (Die Münze fällt seltener auf Kopf).

Signifikanzniveau: [math]\displaystyle{ \alpha = 0,05 }[/math].

1. Erwartungswert und Annahmebereich:

[math]\displaystyle{ \operatorname{E}(X) = 40 \cdot 0,5 = 20 }[/math]

Berechnung des kritischen Wertes:

[math]\displaystyle{ P(X \le 14) \approx 0,040 \le 0,05 }[/math]
[math]\displaystyle{ P(X \le 15) \approx 0,081 \gt 0,05 }[/math]

→ Kritischer Wert: [math]\displaystyle{ x_{\text{krit}} = 14 }[/math]

  • Verwerfungsbereich: [math]\displaystyle{ \{0;1;\dots;14\} }[/math]
  • Annahmebereich: [math]\displaystyle{ \{15;16;\dots;40\} }[/math]

2. Beobachtung: [math]\displaystyle{ X = 14 }[/math], d. h. bei 40 Würfen trat 14-mal Kopf auf.

3. Entscheidung: Es gilt [math]\displaystyle{ P(X \le 14) = 0,040 \lt 0,05 }[/math]. Damit ist das Ergebnis im Verwerfungsbereich. Unter [math]\displaystyle{ H_0 }[/math] wäre es ungewöhnlich, höchstens 14-mal Kopf zu beobachten. [math]\displaystyle{ H_0 }[/math] wird verworfen. Diese Entscheidung wird für alle Werte im Verwerfungsbereich getroffen.

Produktionskontrolle mit Glühlampen (Linksseitiger Signifikanztest)

Ein Hersteller überprüft die Lebensdauer von Glühlampen. Es gilt [math]\displaystyle{ n=30 }[/math]. Die binomialverteilte Zufallsvariable [math]\displaystyle{ X }[/math] gibt an, wie viele Lampen in der Stichprobe ausfallen.

  • Nullhypothese: [math]\displaystyle{ H_0: p = 0,1 }[/math] (Die Ausfallrate beträgt 10 %).
  • Alternativhypothese: [math]\displaystyle{ H_1: p \lt 0,1 }[/math] (Die Ausfallrate ist kleiner als 10 %).

Signifikanzniveau: [math]\displaystyle{ \alpha = 0,05 }[/math].

1. Erwartungswert und Annahmebereich:

[math]\displaystyle{ \operatorname{E}(X) = 30 \cdot 0,1 = 3 }[/math]

Berechnung des kritischen Wertes:

[math]\displaystyle{ P(X \le 0) \approx 0,042 \le 0,05 }[/math]
[math]\displaystyle{ P(X \le 1) \approx 0,150 \gt 0,05 }[/math]

→ Kritischer Wert: [math]\displaystyle{ x_{\text{krit}} = 0 }[/math]

  • Verwerfungsbereich: [math]\displaystyle{ \{0\} }[/math]
  • Annahmebereich: [math]\displaystyle{ \{1;2;\dots;30\} }[/math]

2. Beobachtung: [math]\displaystyle{ X = 0 }[/math], d. h. in der 30-teiligen Stichprobe ist keine Lampe ausgefallen.

3. Entscheidung: Es gilt [math]\displaystyle{ P(X \le 0) = 0,042 \lt 0,05 }[/math]. Damit ist das Ergebnis im Verwerfungsbereich. Unter [math]\displaystyle{ H_0 }[/math] wäre es eher ungewöhnlich, dass keine einzige Lampe ausfällt. [math]\displaystyle{ H_0 }[/math] wird verworfen. Diese Entscheidung wird für alle Werte im Verwerfungsbereich getroffen.