Signifikanztest: Unterschied zwischen den Versionen

Keine Bearbeitungszusammenfassung
 
(38 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
Ein '''Signifikanztest''' ist ein Werkzeug der [[Wahrscheinlichkeitsrechnung]], mit dem überprüft wird, ob eine getroffene Annahme über eine [[Zufallsvariable]] auf Grundlage einer [[Stichprobe]] beibehalten oder verworfen werden sollte.
Ein '''Signifikanztest''' ist ein Werkzeug der Wahrscheinlichkeitsrechnung, mit dem überprüft wird, ob eine getroffene Annahme über eine [[Zufallsvariable]] auf Grundlage einer [[Häufigkeit#Statistische_Begriffe|Stichprobe]] beibehalten oder verworfen werden sollte.


==Null- und Gegenhypothese==   
==Null- und Gegenhypothese==   
Für die Durchführung eines Signifikanztests werden zwei Hypothesen formuliert:
Für die Durchführung eines Signifikanztests werden zwei Hypothesen formuliert:


* Die '''Nullhypothese''' <math>H_0</math>: Sie beschreibt die Ausgangsannahme über die Zufallsvariable und wird solange als gültig betrachtet, bis sie durch den Test widerlegt wird.
* Die '''Nullhypothese''' <math>H_0</math>: Sie beschreibt die Ausgangsannahme über die [[Zufallsvariable]] und wird solange als gültig betrachtet, bis sie durch den Test widerlegt wird.
* Die '''Gegenhypothese''' <math>H_1</math>: Sie stellt die Alternative zu <math>H_0</math> dar und wird angenommen, wenn genügend Hinweise vorliegen, dass <math>H_0</math> nicht zutrifft.
* Die '''Gegenhypothese''' oder '''Alternativhypothese''' <math>H_1</math>: Sie stellt die Alternative zu <math>H_0</math> dar und wird angenommen, wenn genügend Hinweise vorliegen, dass <math>H_0</math> nicht zutrifft.


==Definition==   
==Definition==   
Ein '''Signifikanztest''' überprüft auf Basis der Wahrscheinlichkeitsverteilung einer Zufallsvariable, ob die Nullhypothese <math>H_0</math> auf einem vorgegebenen '''Signifikanzniveau''' <math>\alpha</math> verworfen wird.   
Ein '''Signifikanztest''' überprüft auf Basis der Wahrscheinlichkeitsverteilung einer [[Zufallsvariable]], ob die Nullhypothese <math>H_0</math> auf einem vorgegebenen '''Signifikanzniveau''' <math>\alpha</math> verworfen wird.   


* Wird <math>H_0</math> verworfen, spricht man von einem '''signifikanten Ergebnis'''.   
* Wird <math>H_0</math> verworfen, spricht man von einem '''signifikanten Ergebnis'''.   
Zeile 17: Zeile 17:
Die Zufallsvariable <math>X</math> folgt unter der Nullhypothese einer bekannten Verteilung, z. B. einer [[Binomialverteilung]].   
Die Zufallsvariable <math>X</math> folgt unter der Nullhypothese einer bekannten Verteilung, z. B. einer [[Binomialverteilung]].   


* Wird eine Abweichung nach oben untersucht, so sprechen wir von einem '''rechtsseitigen Signifikanztest'''.
* Wird eine Abweichung nach unten untersucht, so sprechen wir von einem '''linksseitigen Signifikanztest'''.
* Der Bereich, in dem <math>H_0</math> nicht verworfen wird, heißt '''Annahmebereich'''.   
* Der Bereich, in dem <math>H_0</math> nicht verworfen wird, heißt '''Annahmebereich'''.   
* Der Bereich, in dem <math>H_0</math> verworfen wird, heißt '''Verwerfungsbereich'''.   
* Der Bereich, in dem <math>H_0</math> verworfen wird, heißt '''Verwerfungsbereich'''.   
* Der Wert, der den Übergang zwischen Annahme- und Verwerfungsbereich angibt, wird '''kritische Zahl''' genannt.   
* Der Wert, der den Übergang zwischen Annahme- und Verwerfungsbereich angibt und im Annahmebereich liegt, wird '''kritische Zahl''' genannt.   
* Die Wahrscheinlichkeit, dass das Testergebnis fälschlicherweise im Verwerfungsbereich liegt, wird '''Irrtumswahrscheinlichkeit''' oder '''Signifikanzniveau''' <math>\alpha</math> genannt.
* Die Wahrscheinlichkeit, dass das Testergebnis fälschlicherweise im Verwerfungsbereich liegt, wird '''Irrtumswahrscheinlichkeit''' oder '''Signifikanzniveau''' <math>\alpha</math> genannt.


==Fehler 1. Art==   
==Fehler 1. Art==   
Ein '''Fehler 1. Art''' tritt auf, wenn die Nullhypothese <math>H_0</math> abgelehnt wird, obwohl sie in Wirklichkeit zutrifft.   
Ein '''Fehler 1. Art (<math>\alpha-Fehler</math>)''' tritt auf, wenn die Nullhypothese <math>H_0</math> abgelehnt wird, obwohl sie in Wirklichkeit zutrifft.   
Die Wahrscheinlichkeit für diesen Fehler entspricht dem Signifikanzniveau <math>\alpha</math>.
Die Wahrscheinlichkeit für diesen Fehler entspricht dem Signifikanzniveau <math>\alpha</math>.


==Fehler 2. Art==   
==Fehler 2. Art==   
Ein '''Fehler 2. Art''' tritt auf, wenn die Nullhypothese <math>H_0</math> beibehalten wird, obwohl sie in Wirklichkeit falsch ist.   
Ein '''Fehler 2. Art (<math>\beta-Fehler</math>)''' tritt auf, wenn die Nullhypothese <math>H_0</math> beibehalten wird, obwohl sie in Wirklichkeit falsch ist.   
Die Wahrscheinlichkeit für diesen Fehler wird mit <math>\beta</math> bezeichnet.
Die Wahrscheinlichkeit für diesen Fehler wird mit <math>\beta</math> bezeichnet. Dieser kann bei Signifikanztests nicht berechnen werden, da für die Alternativhypothese keine Wahrscheinlichkeit gegeben ist.


==Beispiele==
== Anwendungen ==


===Qualitätskontrolle mit 20 Teilen=== 
*Qualitätskontrollen in der industriellen Fertigung
Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von <math>n=20</math> Teilen gezogen. Unter der Nullhypothese <math>H_0</math> beträgt die Fehlerquote <math>p_0 = 0,05</math>. Es soll auf einem Signifikanzniveau von <math>\alpha = 0,05</math> getestet werden, ob die Maschine fehlerhafter produziert (**einseitiger Test nach oben**). 
*Risikoabschätzung in Versicherungen
*Analyse von Produktionsprozessen
*Überprüfung von Hypothesen in betriebswirtschaftlichen Modellen


**1. Erwartungswert und Annahmebereich:** 
== Beispiele ==
Der Erwartungswert unter <math>H_0</math> ist 
:<math>E(X) = n \cdot p_0 = 20 \cdot 0,05 = 1</math>. 
Man rechnet also im Durchschnitt mit 1 fehlerhaften Teil. 


**2. Beobachtung:** 
=== Qualitätskontrolle mit 20 Teilen (Rechtsseitiger Signifikanztest)===
In der Stichprobe werden <math>X = 2</math> fehlerhafte Teile gefunden.   
Eine Maschine produziert in Serie Teile. Es wird eine Stichprobe von <math>n=20</math> Teilen gezogen. Die binomialverteilte Zufallsvariable <math>X</math> gibt an, wie viele fehlerhafte Teile in der Stichprobe gefunden wurden.
* Nullhypothese: <math>H_0: p = 0,05</math> (Fehlerquote beträgt 5 %). 
* Alternativhypothese: <math>H_1: p > 0,05</math> (Fehlerquote ist größer als 5 %).   


**3. Wahrscheinlichkeit berechnen:** 
Es soll auf einem Signifikanzniveau von <math>\alpha = 0,05</math> getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.
Die Wahrscheinlichkeit, 2 oder mehr fehlerhafte Teile zu finden, lautet: 
:<math>P(X \ge 2) = 1 - P(X \le 1)</math>


Berechne <math>P(X \le 1)</math>:
'''1. Erwartungswert und Annahmebereich:'''
* Für 0 defekte Teile: <math>P(X=0) = \binom{20}{0} \cdot 0,05^0 \cdot 0,95^{20} \approx 0,358</math> 
* Für 1 defektes Teil: <math>P(X=1) = \binom{20}{1} \cdot 0,05^1 \cdot 0,95^{19} \approx 0,377</math> 


Damit: 
Der Erwartungswert unter <math>H_0</math> ist
:<math>P(X \ge 2) = 1 - (0,358 + 0,377) = 0,265</math>.   
:<math>\operatorname{E}(X) = n \cdot p_0 = 20 \cdot 0,05 = 1</math>.   


**4. Entscheidung:**  
Der Annahmebereich umfasst alle Werte <math>k</math>, für die <math>P(X \ge k) > 0,05</math>.   
Da <math>0,265 > 0,05</math>, liegt das Ergebnis im '''Annahmebereich'''.   
Die kleinste Zahl <math>k</math> mit <math>P(X > k) \le 0,05</math> ist der kritische Wert.   
Die Nullhypothese wird **nicht verworfen**.  
Berechnung:  
Zwei fehlerhafte Teile sind also unter <math>H_0</math> nicht ungewöhnlich und liefern keinen signifikanten Hinweis auf eine höhere Fehlerquote.
:<math>P(X > 3) = 1 - P(X \le 3) \approx 0,043</math>


===Qualitätskontrolle mit 50 Teilen=== 
→ Kritischer Wert: <math>x_{\text{krit}} = 3</math>
Eine Stichprobe von <math>n=50</math> Teilen wird gezogen. Unter der Nullhypothese <math>H_0</math> beträgt die Fehlerquote <math>p_0 = 0,02</math>. Es soll auf einem Signifikanzniveau von <math>\alpha = 0,05</math> getestet werden, ob die Maschine zu viele fehlerhafte Teile produziert.  
* Annahmebereich: <math>\{0;1;2;3\}</math>
* Verwerfungsbereich: <math>\{4;5;\dots;20\}</math>   


**1. Erwartungswert und Annahmebereich:**  
'''2. Beobachtung:'''  
Der Erwartungswert unter <math>H_0</math> ist 
<math>X = 2</math>, d. h. in der 20-teiligen Stichprobe wurden 2 fehlerhafte Teile gefunden.  
:<math>E(X) = n \cdot p_0 = 50 \cdot 0,02 = 1</math>.
Im Durchschnitt wird also mit einem fehlerhaften Teil gerechnet.


**2. Beobachtung:**  
'''3. Entscheidung:'''  
In der Stichprobe werden <math>X = 3</math> fehlerhafte Teile gefunden.
Es gilt <math>P(X \ge 2) = 0,265 > 0,05</math>, d. h. die Wahrscheinlichkeit 2 oder mehr fehlerhafte Teile zu finden, ist größer als das Signifikanzniveau <math>\alpha=0,05</math>. Liegt eine Fehlerquote von 5 % vor, ist es nicht ungewöhnlich 2 oder mehr fehlerhafte Teile zu finden. <math>H_0</math> wird nicht verworfen. Diese Entscheidung wird für alle Werte im Annahmebereich getroffen.


**3. Wahrscheinlichkeit berechnen:** 
=== Qualitätskontrolle mit 50 Teilen (Rechtsseitiger Signifikanztest)===
Die Wahrscheinlichkeit, mindestens 3 fehlerhafte Teile zu finden, lautet:  
Eine Maschine produziert in Serie Teile. Eine Stichprobe von <math>n=50</math> Teilen wird gezogen. Die binomialverteilte Zufallsvariable <math>X</math> gibt an, wie viele fehlerhafte Teile in der Stichprobe gefunden wurden.  
:<math>P(X \ge 3) = 1 - P(X \le 2)</math>   
* Nullhypothese: <math>H_0: p = 0,02</math> (Fehlerquote beträgt 2 %)
* Alternativhypothese: <math>H_1: p > 0,02</math> (Fehlerquote ist größer als 2 %).  


Berechne <math>P(X \le 2)</math>: 
Signifikanzniveau: <math>\alpha = 0,05</math>.
:<math>P(X \le 2) = \sum_{x=0}^{2} \binom{50}{x} \cdot 0,02^x \cdot 0,98^{50-x} \approx 0,953</math>


Dann:
'''1. Erwartungswert und Annahmebereich:'''
:<math>P(X \ge 3) = 1 - 0,953 = 0,047</math> 


**4. Entscheidung:** 
<math>\operatorname{E}(X) = 50 \cdot 0,02 = 1</math>   
Da <math>0,047 < 0,05</math>, liegt das Ergebnis im '''Verwerfungsbereich'''.  
Die Nullhypothese wird **verworfen**: Es gibt einen signifikanten Hinweis darauf, dass die Fehlerquote der Maschine größer als <math>0,02</math> ist.


===Anwendungen===  
Berechnung des kritischen Wertes:  
* Qualitätskontrollen in der industriellen Fertigung  
:<math>P(X \ge 3) = 0,047 \le 0,05</math>  
* Risikoabschätzung in Versicherungen 
:<math>P(X \ge 2) = 1 - P(X \le 1) \approx 0,264 > 0,05</math>  
* Analyse von Produktionsprozessen 
* Überprüfung von Hypothesen in betriebswirtschaftlichen Modellen  


[[Kategorie:Wahrscheinlichkeitsrechnung]]
→ Kritischer Wert: <math>x_{\text{krit}} = 2</math> 
* Annahmebereich: <math>\{0;1;2\}</math> 
* Verwerfungsbereich: <math>\{3;4,\dots;50\}</math> 
 
'''2. Beobachtung:''' 
<math>X = 3</math>, d. h. in der 50-teiligen Stichprobe wurden 3 fehlerhafte Teile gefunden. 
 
'''3. Entscheidung:''' 
Es gilt <math>P(X \ge 3) = 0,047 < 0,05</math>. Damit ist das Ergebnis im Verwerfungsbereich. Unter <math>H_0</math> wäre es eher ungewöhnlich, 3 oder mehr fehlerhafte Teile zu finden. <math>H_0</math> wird verworfen. Diese Entscheidung wird für alle Werte im Verwerfungsbereich getroffen.
 
=== Münzwurf-Experiment (Linksseitiger Signifikanztest)===
Es wird eine Münze <math>n=40</math>-mal geworfen. Die binomialverteilte Zufallsvariable <math>X</math> gibt an, wie häufig Kopf geworfen wird.
* Nullhypothese: <math>H_0: p = 0,5</math> (Die Wahrscheinlichkeit für Kopf ist 50 %, d. h. die Münze ist fair). 
* Alternativhypothese: <math>H_1: p < 0,5</math> (Die Münze fällt seltener auf Kopf). 
 
Signifikanzniveau: <math>\alpha = 0,05</math>.
 
'''1. Erwartungswert und Annahmebereich:'''
 
<math>\operatorname{E}(X) = 40 \cdot 0,5 = 20</math> 
 
Berechnung des kritischen Wertes: 
:<math>P(X \le 14) \approx 0,040 \le 0,05</math> 
:<math>P(X \le 15) \approx 0,081 > 0,05</math> 
 
→ Kritischer Wert: <math>x_{\text{krit}} = 15</math> 
* Verwerfungsbereich: <math>\{0;1;\dots;14\}</math> 
* Annahmebereich: <math>\{15;16;\dots;40\}</math> 
 
'''2. Beobachtung:''' 
<math>X = 14</math>, d. h. bei 40 Würfen trat 14-mal Kopf auf. 
 
'''3. Entscheidung:''' 
Es gilt <math>P(X \le 14) = 0,040 < 0,05</math>. Damit ist das Ergebnis im Verwerfungsbereich. Unter <math>H_0</math> wäre es ungewöhnlich, höchstens 14-mal Kopf zu beobachten. <math>H_0</math> wird verworfen. Diese Entscheidung wird für alle Werte im Verwerfungsbereich getroffen.
 
=== Produktionskontrolle mit Glühlampen (Linksseitiger Signifikanztest)===
Ein Hersteller überprüft die Lebensdauer von Glühlampen. Es gilt <math>n=30</math>. Die binomialverteilte Zufallsvariable <math>X</math> gibt an, wie viele Lampen in der Stichprobe ausfallen. 
* Nullhypothese: <math>H_0: p = 0,1</math> (Die Ausfallrate beträgt 10 %). 
* Alternativhypothese: <math>H_1: p < 0,1</math> (Die Ausfallrate ist kleiner als 10 %). 
 
Signifikanzniveau: <math>\alpha = 0,05</math>.
 
'''1. Erwartungswert und Annahmebereich:'''
 
<math>\operatorname{E}(X) = 30 \cdot 0,1 = 3</math> 
 
Berechnung des kritischen Wertes: 
:<math>P(X \le 0) \approx 0,042 \le 0,05</math> 
:<math>P(X \le 1) \approx 0,150 > 0,05</math> 
 
→ Kritischer Wert: <math>x_{\text{krit}} = 1</math> 
* Verwerfungsbereich: <math>\{0\}</math> 
* Annahmebereich: <math>\{1;2;\dots;30\}</math> 
 
'''2. Beobachtung:''' 
<math>X = 0</math>, d. h. in der 30-teiligen Stichprobe ist keine Lampe ausgefallen. 
 
'''3. Entscheidung:''' 
Es gilt <math>P(X \le 0) = 0,042 < 0,05</math>. Damit ist das Ergebnis im Verwerfungsbereich. Unter <math>H_0</math> wäre es eher ungewöhnlich, dass keine einzige Lampe ausfällt. <math>H_0</math> wird verworfen. Diese Entscheidung wird für alle Werte im Verwerfungsbereich getroffen. 
 
[[Kategorie:Wahrscheinlichkeitsrechnung]]
[[Kategorie:AHR_WuV_Mathe_GK]]
[[Kategorie:AHR_WuV_Mathe_GK]]