Signifikanztest: Unterschied zwischen den Versionen

Aus FLBK-Wiki
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Zeile 31: Zeile 31:


==Beispiele==   
==Beispiele==   
===Qualitätskontrolle mit 20 Teilen=== 
Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von <math>n=20</math> Teilen gezogen. Unter der Nullhypothese <math>H_0</math> beträgt die Fehlerquote <math>p_0 = 0,05</math>. Es soll auf einem Signifikanzniveau von <math>\alpha = 0,05</math> getestet werden, ob die Maschine fehlerhafter produziert (**einseitiger Test nach oben**). 
**1. Erwartungswert und Annahmebereich:** 
Der Erwartungswert unter <math>H_0</math> ist 
:<math>E(X) = n \cdot p_0 = 20 \cdot 0,05 = 1</math>. 
Man rechnet also im Durchschnitt mit 1 fehlerhaften Teil. 
**2. Beobachtung:** 
In der Stichprobe werden <math>X = 2</math> fehlerhafte Teile gefunden. 
**3. Wahrscheinlichkeit berechnen:** 
Die Wahrscheinlichkeit, 2 oder mehr fehlerhafte Teile zu finden, lautet: 
:<math>P(X \ge 2) = 1 - P(X \le 1)</math> 
Berechne <math>P(X \le 1)</math>: 
* Für 0 defekte Teile: <math>P(X=0) = \binom{20}{0} \cdot 0,05^0 \cdot 0,95^{20} \approx 0,358</math> 
* Für 1 defektes Teil: <math>P(X=1) = \binom{20}{1} \cdot 0,05^1 \cdot 0,95^{19} \approx 0,377</math> 
Damit: 
:<math>P(X \ge 2) = 1 - (0,358 + 0,377) = 0,265</math>. 
**4. Entscheidung:** 
Da <math>0,265 > 0,05</math>, liegt das Ergebnis im '''Annahmebereich'''. 
Die Nullhypothese wird **nicht verworfen**. 
Zwei fehlerhafte Teile sind also unter <math>H_0</math> nicht ungewöhnlich und liefern keinen signifikanten Hinweis auf eine höhere Fehlerquote.


===Qualitätskontrolle mit 50 Teilen===   
===Qualitätskontrolle mit 50 Teilen===   
Es wird eine Stichprobe von <math>n=50</math> Teilen aus der Produktion gezogen. Unter der Nullhypothese wird von einer Fehlerquote <math>p_0=0,02</math> ausgegangen. Es wird mit einem Signifikanzniveau von <math>\alpha=0,05</math> getestet, ob die Maschine fehlerhafter produziert.   
Eine Stichprobe von <math>n=50</math> Teilen wird gezogen. Unter der Nullhypothese <math>H_0</math> beträgt die Fehlerquote <math>p_0 = 0,02</math>. Es soll auf einem Signifikanzniveau von <math>\alpha = 0,05</math> getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.   


Es ergibt sich für die Zufallsvariable <math>X</math>, die die Anzahl fehlerhafter Teile angibt:  
**1. Erwartungswert und Annahmebereich:** 
:<math>X \sim B(50; 0,02)</math>   
Der Erwartungswert unter <math>H_0</math> ist  
:<math>E(X) = n \cdot p_0 = 50 \cdot 0,02 = 1</math>
Im Durchschnitt wird also mit einem fehlerhaften Teil gerechnet.  


Wird in der Stichprobe <math>X=3</math> beobachtet, gilt: 
**2. Beobachtung:** 
:<math>P(X \ge 3) = 1 - P(X \le 2) = 1 - \sum_{x=0}^2 \binom{50}{k} 0,02^k (0,98)^{50-k} \approx 0,047</math>  
In der Stichprobe werden <math>X = 3</math> fehlerhafte Teile gefunden.  


Da diese Wahrscheinlichkeit kleiner als <math>\alpha=0,05</math> ist, liegt das Ergebnis im '''Verwerfungsbereich'''. Die Nullhypothese wird verworfen.
**3. Wahrscheinlichkeit berechnen:** 
Die Wahrscheinlichkeit, mindestens 3 fehlerhafte Teile zu finden, lautet: 
:<math>P(X \ge 3) = 1 - P(X \le 2)</math>


===Qualitätskontrolle mit 20 Teilen=== 
Berechne <math>P(X \le 2)</math>
Eine kleinere Stichprobe umfasst <math>n=20</math> Teile. Unter der Nullhypothese beträgt die Fehlerquote <math>p_0=0,05</math>. Es wird mit einem Signifikanzniveau <math>\alpha=0,05</math> getestet.  
:<math>P(X \le 2) = \sum_{x=0}^{2} \binom{50}{x} \cdot 0,02^x \cdot 0,98^{50-x} \approx 0,953</math>   


Es werden <math>X=2</math> fehlerhafte Teile gezählt. Dann gilt:   
Dann:   
:<math>P(X \ge 2) = 1 - P(X \le 1) = 1 - \left[ \binom{20}{0} 0,05^0 (0,95)^{20} + \binom{20}{1} 0,05^1 (0,95)^{19} \right] \approx 0,264</math>   
:<math>P(X \ge 3) = 1 - 0,953 = 0,047</math>   


Da diese Wahrscheinlichkeit größer als <math>\alpha=0,05</math> ist, liegt das Ergebnis im '''Annahmebereich'''. Die Nullhypothese wird nicht verworfen.
**4. Entscheidung:** 
Da <math>0,047 < 0,05</math>, liegt das Ergebnis im '''Verwerfungsbereich'''.
Die Nullhypothese wird **verworfen**: Es gibt einen signifikanten Hinweis darauf, dass die Fehlerquote der Maschine größer als <math>0,02</math> ist.


===Anwendungen===   
===Anwendungen===   

Version vom 29. August 2025, 16:59 Uhr

Ein Signifikanztest ist ein Werkzeug der Wahrscheinlichkeitsrechnung, mit dem überprüft wird, ob eine getroffene Annahme über eine Zufallsvariable auf Grundlage einer Stichprobe beibehalten oder verworfen werden sollte.

Null- und Gegenhypothese

Für die Durchführung eines Signifikanztests werden zwei Hypothesen formuliert:

  • Die Nullhypothese [math]\displaystyle{ H_0 }[/math]: Sie beschreibt die Ausgangsannahme über die Zufallsvariable und wird solange als gültig betrachtet, bis sie durch den Test widerlegt wird.
  • Die Gegenhypothese [math]\displaystyle{ H_1 }[/math]: Sie stellt die Alternative zu [math]\displaystyle{ H_0 }[/math] dar und wird angenommen, wenn genügend Hinweise vorliegen, dass [math]\displaystyle{ H_0 }[/math] nicht zutrifft.

Definition

Ein Signifikanztest überprüft auf Basis der Wahrscheinlichkeitsverteilung einer Zufallsvariable, ob die Nullhypothese [math]\displaystyle{ H_0 }[/math] auf einem vorgegebenen Signifikanzniveau [math]\displaystyle{ \alpha }[/math] verworfen wird.

  • Wird [math]\displaystyle{ H_0 }[/math] verworfen, spricht man von einem signifikanten Ergebnis.
  • Wird [math]\displaystyle{ H_0 }[/math] nicht verworfen, reichen die vorliegenden Daten nicht aus, um [math]\displaystyle{ H_1 }[/math] zu stützen.

Einseitiger Signifikanztest

Beim einseitigen Signifikanztest wird nur eine Abweichung in eine Richtung untersucht. Die Zufallsvariable [math]\displaystyle{ X }[/math] folgt unter der Nullhypothese einer bekannten Verteilung, z. B. einer Binomialverteilung.

  • Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] nicht verworfen wird, heißt Annahmebereich.
  • Der Bereich, in dem [math]\displaystyle{ H_0 }[/math] verworfen wird, heißt Verwerfungsbereich.
  • Der Wert, der den Übergang zwischen Annahme- und Verwerfungsbereich angibt, wird kritische Zahl genannt.
  • Die Wahrscheinlichkeit, dass das Testergebnis fälschlicherweise im Verwerfungsbereich liegt, wird Irrtumswahrscheinlichkeit oder Signifikanzniveau [math]\displaystyle{ \alpha }[/math] genannt.

Fehler 1. Art

Ein Fehler 1. Art tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] abgelehnt wird, obwohl sie in Wirklichkeit zutrifft. Die Wahrscheinlichkeit für diesen Fehler entspricht dem Signifikanzniveau [math]\displaystyle{ \alpha }[/math].

Fehler 2. Art

Ein Fehler 2. Art tritt auf, wenn die Nullhypothese [math]\displaystyle{ H_0 }[/math] beibehalten wird, obwohl sie in Wirklichkeit falsch ist. Die Wahrscheinlichkeit für diesen Fehler wird mit [math]\displaystyle{ \beta }[/math] bezeichnet.

Beispiele

Qualitätskontrolle mit 20 Teilen

Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von [math]\displaystyle{ n=20 }[/math] Teilen gezogen. Unter der Nullhypothese [math]\displaystyle{ H_0 }[/math] beträgt die Fehlerquote [math]\displaystyle{ p_0 = 0,05 }[/math]. Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine fehlerhafter produziert (**einseitiger Test nach oben**).

    • 1. Erwartungswert und Annahmebereich:**

Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist

[math]\displaystyle{ E(X) = n \cdot p_0 = 20 \cdot 0,05 = 1 }[/math].

Man rechnet also im Durchschnitt mit 1 fehlerhaften Teil.

    • 2. Beobachtung:**

In der Stichprobe werden [math]\displaystyle{ X = 2 }[/math] fehlerhafte Teile gefunden.

    • 3. Wahrscheinlichkeit berechnen:**

Die Wahrscheinlichkeit, 2 oder mehr fehlerhafte Teile zu finden, lautet:

[math]\displaystyle{ P(X \ge 2) = 1 - P(X \le 1) }[/math]

Berechne [math]\displaystyle{ P(X \le 1) }[/math]:

  • Für 0 defekte Teile: [math]\displaystyle{ P(X=0) = \binom{20}{0} \cdot 0,05^0 \cdot 0,95^{20} \approx 0,358 }[/math]
  • Für 1 defektes Teil: [math]\displaystyle{ P(X=1) = \binom{20}{1} \cdot 0,05^1 \cdot 0,95^{19} \approx 0,377 }[/math]

Damit:

[math]\displaystyle{ P(X \ge 2) = 1 - (0,358 + 0,377) = 0,265 }[/math].
    • 4. Entscheidung:**

Da [math]\displaystyle{ 0,265 \gt 0,05 }[/math], liegt das Ergebnis im Annahmebereich. Die Nullhypothese wird **nicht verworfen**. Zwei fehlerhafte Teile sind also unter [math]\displaystyle{ H_0 }[/math] nicht ungewöhnlich und liefern keinen signifikanten Hinweis auf eine höhere Fehlerquote.

Qualitätskontrolle mit 50 Teilen

Eine Stichprobe von [math]\displaystyle{ n=50 }[/math] Teilen wird gezogen. Unter der Nullhypothese [math]\displaystyle{ H_0 }[/math] beträgt die Fehlerquote [math]\displaystyle{ p_0 = 0,02 }[/math]. Es soll auf einem Signifikanzniveau von [math]\displaystyle{ \alpha = 0,05 }[/math] getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.

    • 1. Erwartungswert und Annahmebereich:**

Der Erwartungswert unter [math]\displaystyle{ H_0 }[/math] ist

[math]\displaystyle{ E(X) = n \cdot p_0 = 50 \cdot 0,02 = 1 }[/math].

Im Durchschnitt wird also mit einem fehlerhaften Teil gerechnet.

    • 2. Beobachtung:**

In der Stichprobe werden [math]\displaystyle{ X = 3 }[/math] fehlerhafte Teile gefunden.

    • 3. Wahrscheinlichkeit berechnen:**

Die Wahrscheinlichkeit, mindestens 3 fehlerhafte Teile zu finden, lautet:

[math]\displaystyle{ P(X \ge 3) = 1 - P(X \le 2) }[/math]

Berechne [math]\displaystyle{ P(X \le 2) }[/math]:

[math]\displaystyle{ P(X \le 2) = \sum_{x=0}^{2} \binom{50}{x} \cdot 0,02^x \cdot 0,98^{50-x} \approx 0,953 }[/math]

Dann:

[math]\displaystyle{ P(X \ge 3) = 1 - 0,953 = 0,047 }[/math]
    • 4. Entscheidung:**

Da [math]\displaystyle{ 0,047 \lt 0,05 }[/math], liegt das Ergebnis im Verwerfungsbereich. Die Nullhypothese wird **verworfen**: Es gibt einen signifikanten Hinweis darauf, dass die Fehlerquote der Maschine größer als [math]\displaystyle{ 0,02 }[/math] ist.

Anwendungen

  • Qualitätskontrollen in der industriellen Fertigung
  • Risikoabschätzung in Versicherungen
  • Analyse von Produktionsprozessen
  • Überprüfung von Hypothesen in betriebswirtschaftlichen Modellen