Signifikanztest

Aus FLBK-Wiki
Zur Navigation springen Zur Suche springen

Ein Signifikanztest ist ein Werkzeug der Wahrscheinlichkeitsrechnung, mit dem überprüft wird, ob eine getroffene Annahme über eine Zufallsvariable auf Grundlage einer Stichprobe beibehalten oder verworfen werden sollte.

Null- und Gegenhypothese

Für die Durchführung eines Signifikanztests werden zwei Hypothesen formuliert:

  • Die Nullhypothese [math]\displaystyle{ H_0 }[/math]: Sie beschreibt die Ausgangsannahme über die Zufallsvariable und wird solange als gültig betrachtet, bis sie durch den Test widerlegt wird.
  • Die Gegenhypothese [math]\displaystyle{ H_1 }[/math]: Sie stellt die Alternative zu [math]\displaystyle{ H_0 }[/math] dar und wird angenommen, wenn genügend Hinweise vorliegen, dass [math]\displaystyle{ H_0 }[/math] nicht zutrifft.

Definition

Ein Signifikanztest überprüft auf Basis der Wahrscheinlichkeitsverteilung einer Zufallsvariable, ob die Nullhypothese [math]\displaystyle{ H_0 }[/math] auf einem vorgegebenen Signifikanzniveau [math]\displaystyle{ \alpha }[/math] verworfen wird.

  • Wird [math]\displaystyle{ H_0 }[/math] verworfen, spricht man von einem signifikanten Ergebnis.
  • Wird [math]\displaystyle{ H_0 }[/math] nicht verworfen, reichen die vorliegenden Daten nicht aus, um [math]\displaystyle{ H_1 }[/math] zu stützen.

Einseitiger Signifikanztest

Beim einseitigen Signifikanztest wird nur eine Abweichung in eine Richtung untersucht. Die Zufallsvariable [math]\displaystyle{ X }[/math] folgt unter der Nullhypothese einer bekannten Verteilung, z. B. einer Binomialverteilung.

  • Wird eine Abweichung nach oben untersucht, so sprechen wir von einem rechtsseitigen Signifikanztest.
  • Wird eine Abweichung nach unten untersucht, so sprechen wir von einem linksseitigen Signifikanztest.
  • Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] nicht verworfen wird, heißt Annahmebereich.
  • Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] verworfen wird, heißt Verwerfungsbereich.
  • Der Wert, der den Übergang zwischen Annahme- und Verwerfungsbereich angibt, wird kritische Zahl genannt.
  • Die Wahrscheinlichkeit, dass das Testergebnis fälschlicherweise im Verwerfungsbereich liegt, wird Irrtumswahrscheinlichkeit oder Signifikanzniveau [math]\displaystyle{ \alpha }[/math] genannt.

Fehler 1. Art

Ein Fehler 1. Art tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] abgelehnt wird, obwohl sie in Wirklichkeit zutrifft. Die Wahrscheinlichkeit für diesen Fehler entspricht dem Signifikanzniveau [math]\displaystyle{ \alpha }[/math].

Fehler 2. Art

Ein Fehler 2. Art tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] beibehalten wird, obwohl sie in Wirklichkeit falsch ist. Die Wahrscheinlichkeit für diesen Fehler wird mit [math]\displaystyle{ \beta }[/math] bezeichnet.

Beispiele

Qualitätskontrolle mit 20 Teilen

Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von [math]\displaystyle{ n=20 }[/math] Teilen gezogen. Unter der Nullhypothese [math]\displaystyle{ H_0 }[/math] beträgt die Fehlerquote [math]\displaystyle{ p_0 = 0,05 }[/math]. Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine fehlerhafter produziert (einseitiger Test nach oben).

1. Erwartungswert und Annahmebereich:

Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist

[math]\displaystyle{ \operatorname{E}(X) = n \cdot p_0 = 20 \cdot 0,05 = 1 }[/math].

Man rechnet also im Durchschnitt mit 1 fehlerhaften Teil.

2. Beobachtung:

In der Stichprobe werden [math]\displaystyle{ X = 2 }[/math] fehlerhafte Teile gefunden.

3. Wahrscheinlichkeit berechnen:

Die Wahrscheinlichkeit, 2 oder mehr fehlerhafte Teile zu finden, lautet:

[math]\displaystyle{ P(X \ge 2) = 1 - P(X \le 1) }[/math]

Berechne [math]\displaystyle{ P(X \le 1) }[/math]:

Für 0 defekte Teile: [math]\displaystyle{ P(X=0) = \binom{20}{0} \cdot 0,05^0 \cdot 0,95^{20} \approx 0,358 }[/math]

Für 1 defektes Teil: [math]\displaystyle{ P(X=1) = \binom{20}{1} \cdot 0,05^1 \cdot 0,95^{19} \approx 0,377 }[/math]

Damit:

[math]\displaystyle{ P(X \ge 2) = 1 - (0,358 + 0,377) = 0,265 }[/math].

4. Entscheidung:

Da [math]\displaystyle{ 0,265 \gt 0,05 }[/math], liegt das Ergebnis im Annahmebereich.

Die Nullhypothese wird nicht verworfen.

Zwei fehlerhafte Teile sind also unter [math]\displaystyle{ H_0 }[/math] nicht ungewöhnlich und liefern keinen signifikanten Hinweis auf eine höhere Fehlerquote.

Qualitätskontrolle mit 50 Teilen

Eine Stichprobe von [math]\displaystyle{ n=50 }[/math] Teilen wird gezogen. Unter der Nullhypothese [math]\displaystyle{ H_0 }[/math] beträgt die Fehlerquote [math]\displaystyle{ p_0 = 0,02 }[/math]. Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.

1. Erwartungswert und Annahmebereich:

Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist

[math]\displaystyle{ \operatorname{E}(X) = n \cdot p_0 = 50 \cdot 0,02 = 1 }[/math].

Im Durchschnitt wird also mit einem fehlerhaften Teil gerechnet.

2. Beobachtung:

In der Stichprobe werden [math]\displaystyle{ X = 3 }[/math] fehlerhafte Teile gefunden.

3. Wahrscheinlichkeit berechnen:

Die Wahrscheinlichkeit, mindestens 3 fehlerhafte Teile zu finden, lautet:

[math]\displaystyle{ P(X \ge 3) = 1 - P(X \le 2) }[/math]

Berechne [math]\displaystyle{ P(X \le 2) }[/math]:

[math]\displaystyle{ P(X \le 2) = \sum_{x=0}^{2} \binom{50}{x} \cdot 0,02^x \cdot 0,98^{50-x} \approx 0,953 }[/math]

Dann:

[math]\displaystyle{ P(X \ge 3) = 1 - 0,953 = 0,047 }[/math]

4. Entscheidung:

Da [math]\displaystyle{ 0,047 \lt 0,05 }[/math], liegt das Ergebnis im Verwerfungsbereich.

Die Nullhypothese wird verworfen: Es gibt einen signifikanten Hinweis darauf, dass die Fehlerquote der Maschine größer als [math]\displaystyle{ 0,02 }[/math] ist.

Anwendungen

Qualitätskontrollen in der industriellen Fertigung

Risikoabschätzung in Versicherungen

Analyse von Produktionsprozessen

Überprüfung von Hypothesen in betriebswirtschaftlichen Modellen