Signifikanztest
Ein Signifikanztest ist ein Werkzeug der Wahrscheinlichkeitsrechnung, mit dem überprüft wird, ob eine getroffene Annahme über eine Zufallsvariable auf Grundlage einer Stichprobe beibehalten oder verworfen werden sollte.
Null- und Gegenhypothese
Für die Durchführung eines Signifikanztests werden zwei Hypothesen formuliert:
- Die Nullhypothese [math]\displaystyle{ H_0 }[/math]: Sie beschreibt die Ausgangsannahme über die Zufallsvariable und wird solange als gültig betrachtet, bis sie durch den Test widerlegt wird.
- Die Gegenhypothese [math]\displaystyle{ H_1 }[/math]: Sie stellt die Alternative zu [math]\displaystyle{ H_0 }[/math] dar und wird angenommen, wenn genügend Hinweise vorliegen, dass [math]\displaystyle{ H_0 }[/math] nicht zutrifft.
Definition
Ein Signifikanztest überprüft auf Basis der Wahrscheinlichkeitsverteilung einer Zufallsvariable, ob die Nullhypothese [math]\displaystyle{ H_0 }[/math] auf einem vorgegebenen Signifikanzniveau [math]\displaystyle{ \alpha }[/math] verworfen wird.
- Wird [math]\displaystyle{ H_0 }[/math] verworfen, spricht man von einem signifikanten Ergebnis.
- Wird [math]\displaystyle{ H_0 }[/math] nicht verworfen, reichen die vorliegenden Daten nicht aus, um [math]\displaystyle{ H_1 }[/math] zu stützen.
Einseitiger Signifikanztest
Beim einseitigen Signifikanztest wird nur eine Abweichung in eine Richtung untersucht. Die Zufallsvariable [math]\displaystyle{ X }[/math] folgt unter der Nullhypothese einer bekannten Verteilung, z. B. einer Binomialverteilung.
- Wird eine Abweichung nach oben untersucht, so sprechen wir von einem rechtsseitigen Signifikanztest.
- Wird eine Abweichung nach unten untersucht, so sprechen wir von einem linksseitigen Signifikanztest.
- Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] nicht verworfen wird, heißt Annahmebereich.
- Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] verworfen wird, heißt Verwerfungsbereich.
- Der Wert, der den Übergang zwischen Annahme- und Verwerfungsbereich angibt, wird kritische Zahl genannt.
- Die Wahrscheinlichkeit, dass das Testergebnis fälschlicherweise im Verwerfungsbereich liegt, wird Irrtumswahrscheinlichkeit oder Signifikanzniveau [math]\displaystyle{ \alpha }[/math] genannt.
Fehler 1. Art
Ein Fehler 1. Art tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] abgelehnt wird, obwohl sie in Wirklichkeit zutrifft. Die Wahrscheinlichkeit für diesen Fehler entspricht dem Signifikanzniveau [math]\displaystyle{ \alpha }[/math].
Fehler 2. Art
Ein Fehler 2. Art tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] beibehalten wird, obwohl sie in Wirklichkeit falsch ist. Die Wahrscheinlichkeit für diesen Fehler wird mit [math]\displaystyle{ \beta }[/math] bezeichnet.
Beispiele
Qualitätskontrolle mit 20 Teilen
Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von [math]\displaystyle{ n=20 }[/math] Teilen gezogen. Unter der Nullhypothese [math]\displaystyle{ H_0 }[/math] beträgt die Fehlerquote [math]\displaystyle{ p_0 = 0,05 }[/math]. Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine fehlerhafter produziert (einseitiger Test nach oben).
1. Erwartungswert und Annahmebereich:
Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist
- [math]\displaystyle{ \operatorname{E}(X) = n \cdot p_0 = 20 \cdot 0,05 = 1 }[/math].
Man rechnet also im Durchschnitt mit 1 fehlerhaften Teil.
2. Beobachtung:
In der Stichprobe werden [math]\displaystyle{ X = 2 }[/math] fehlerhafte Teile gefunden.
3. Wahrscheinlichkeit berechnen:
Die Wahrscheinlichkeit, 2 oder mehr fehlerhafte Teile zu finden, lautet:
- [math]\displaystyle{ P(X \ge 2) = 1 - P(X \le 1) }[/math]
Berechne [math]\displaystyle{ P(X \le 1) }[/math]:
Für 0 defekte Teile: [math]\displaystyle{ P(X=0) = \binom{20}{0} \cdot 0,05^0 \cdot 0,95^{20} \approx 0,358 }[/math]
Für 1 defektes Teil: [math]\displaystyle{ P(X=1) = \binom{20}{1} \cdot 0,05^1 \cdot 0,95^{19} \approx 0,377 }[/math]
Damit:
- [math]\displaystyle{ P(X \ge 2) = 1 - (0,358 + 0,377) = 0,265 }[/math].
4. Entscheidung:
Da [math]\displaystyle{ 0,265 \gt 0,05 }[/math], liegt das Ergebnis im Annahmebereich.
Die Nullhypothese wird nicht verworfen.
Zwei fehlerhafte Teile sind also unter [math]\displaystyle{ H_0 }[/math] nicht ungewöhnlich und liefern keinen signifikanten Hinweis auf eine höhere Fehlerquote.
Qualitätskontrolle mit 50 Teilen
Eine Stichprobe von [math]\displaystyle{ n=50 }[/math] Teilen wird gezogen. Unter der Nullhypothese [math]\displaystyle{ H_0 }[/math] beträgt die Fehlerquote [math]\displaystyle{ p_0 = 0,02 }[/math]. Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.
1. Erwartungswert und Annahmebereich:
Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist
- [math]\displaystyle{ \operatorname{E}(X) = n \cdot p_0 = 50 \cdot 0,02 = 1 }[/math].
Im Durchschnitt wird also mit einem fehlerhaften Teil gerechnet.
2. Beobachtung:
In der Stichprobe werden [math]\displaystyle{ X = 3 }[/math] fehlerhafte Teile gefunden.
3. Wahrscheinlichkeit berechnen:
Die Wahrscheinlichkeit, mindestens 3 fehlerhafte Teile zu finden, lautet:
- [math]\displaystyle{ P(X \ge 3) = 1 - P(X \le 2) }[/math]
Berechne [math]\displaystyle{ P(X \le 2) }[/math]:
- [math]\displaystyle{ P(X \le 2) = \sum_{x=0}^{2} \binom{50}{x} \cdot 0,02^x \cdot 0,98^{50-x} \approx 0,953 }[/math]
Dann:
- [math]\displaystyle{ P(X \ge 3) = 1 - 0,953 = 0,047 }[/math]
4. Entscheidung:
Da [math]\displaystyle{ 0,047 \lt 0,05 }[/math], liegt das Ergebnis im Verwerfungsbereich.
Die Nullhypothese wird verworfen: Es gibt einen signifikanten Hinweis darauf, dass die Fehlerquote der Maschine größer als [math]\displaystyle{ 0,02 }[/math] ist.
Anwendungen
Qualitätskontrollen in der industriellen Fertigung
Risikoabschätzung in Versicherungen
Analyse von Produktionsprozessen
Überprüfung von Hypothesen in betriebswirtschaftlichen Modellen