Ich habe folgendes Problem:
Der folgende Text soll eine Ausarbeitung zur Vorlesung "Qualitätsmanagement
I" werden, eine Anleitung zur Durchführung des F-Tests. Beim Schreiben
ergaben sich einige Probleme, die wohl daher rühren, dass der Prof in der
Vorlesung ausgiebig über neue technische Entwicklungen in der Welt und die
politische Situation Deutschlands berichtete anstatt sich zu Statistik zu
äußern.
a) Ich suche nach einer geeigneten Definition der Begriffe Prüfgröße z und
Schwellenwert Z. Sie liegen mir zwar auf der Zunge, aberirgendwie kann ich
es nicht ausdrücken.
b)Falls ihr Verbesserungsvorschläge habt oder eklatante Fehler entdeckt,
teilt sie mir bitte mit. (auch Ausdrucksweise, unzulässige Zitatangaben,...)
Jetzt der Text (ich bitte um Nachsicht, falls Formel-Editor-Ausführungen
nicht dargestellt sind):
1. Einleitung:
Mit dem F-Test kann man prüfen, ob zwei Normalverteilungen, deren
Mittelwerte nicht bekannt zu sein brauchen, gleiche Varianzen haben.
In der industriellen Produktion (auch im Alltag) tritt dieses Problem auf
und verdient deshalb durchaus Beachtung.
Die Varianz ist oft ein Maß für die Gleichmäßigkeit einer Produktion und die
Qualität von Maschinen. So lassen sich zum Beispiel Maschinen durch die
Varianz der auf ihnen gefertigten Produkte unterscheiden. Auch bei
Naturprodukten (Obst) kann die Gleichmäßigkeit der Größe (aus Gründen der
Verpackung) wesentlicher sein als ein hohes Gewicht.
(vgl. Erwin Kreyszig,
Statistische Methoden und ihre Anwendungen,
7. Auflage, 1984, S.218)
2. Erklärung wichtiger Begriffe und Symbole:
Normalverteilung: "Die Normalverteilung (engl.: normal distribution)
ist ein Verteilungsmodell für »kontinuierliche Zufallsvariablen«. Sie wurde
ursprünglich von Carl Friedrich Gauß (1777-1855) zur Beschreibung von
Meßfehlern entwickelt: die sogenannte Gaußsche Fehlerkurve. Die
Normalverteilung unterstellt eine symmetrische Verteilungsform in Form einer
Glocke, bei der sich die Werte der Zufallsvariablen in der Mitte der
Verteilung konzentrieren und mit größerem Abstand zur Mitte immer seltener
auftreten. Die Normalverteilung ist das wichtigste Verteilungsmodell der
Statistik und wird für unterschiedlichste Zwecke verwendet: u.a. als
deskriptives Modell zur Beschreibung empirischer Variablen, als
Stichprobenverteilung des arithmetischen Mittels oder als Näherungslösung
für viele andere Verteilungsmodelle."
(Internet,URL: http://medialine.focus.de, 2003)
Mittelwert : Der Mittelwert einer Stichprobe x1,.....,xn ist definiert als
das arithmetische Mittelwert der Stichprobenwerte und wird mit bezeichnet.
Es ist also:
(Kreyszig, S.36)
Varianz s2: Die Varianz ist ein Maß für die Größe der Abweichung von
einem Mittelwert.
(Duden, das Fremdwörterbuch, 2003)
(Null-)Hypothese H0: Unter einer Hypothese versteht man in der Statistik
eine Annahme über die Verteilung einer Zufallsvariablen, z.B. die Annahme,
dass die betreffende Verteilung einen Mittelwert hat, usw. (Kreyszig,
S.203)
Von einer Nullhypothese wird gesprochen, wenn mindestens zwei Verteilungen
derselben Grundgesamtheit entnommen wurden.
Signifikanz / signifikante Abweichung: Signifikante Abweichungen sind
Abweichungen von der zuvor aufgestellten Hypothese, die nicht mehr zu
zufallsbedingten unvermeidlichen Abweichungen zählen (können).
Grundgesamtheit : Die Grundgesamtheit besteht aus einer Gesamtmenge
aller möglichen Messwerte, deren weitere Teilung nicht mehr sinnvoll ist.
Stichprobe : Die Stichprobe wird der Grundgesamtheit entnommen und
spiegelt einen "Ausschnitt" . Die Anzahl der Stichprobe heisst Umfang.
Schwellenwert Z:
Prüfgröße z:
3. Durchführung des F-Tests "Vergleich zweier Varianzen einer
Normalverteilung":
1. Die Hypothesen H0 (Nullhypothese) und H1(Gegenhypothese) werden
formuliert. Zur Formulierung der Nullhypothese werden die Varianzen der zu
den Stichproben 1 und 2 gehörenden Grundgesamtheiten gleich gesetzt. Bei der
der Gegenhypothese werden sie "Größer", "Kleiner" oder "Ungleich" gesetzt.
2. Man gibt an, ob die Meßstichproben auf Zufälligkeit, Normalverteilung
oder auf Ausreißer überprüft werden.
(vgl. Bernd John,
Statistische Methoden und ihre Anwendungen)
3. Berechnung der Prüfgröße z: Die Prüfgröße z ist der Quotient der
Stichprobenvarianzen s1 und s2. Die Berechnung wird für jede aufgestellte
Gegenhypothese durchgeführt.
Formel für die Prüfgröße z:
4. Nun muss der Schwellenwert Z gesucht werden. Dieser wird auch für jede
aufgestellte Gegenhypothese gesucht. Dafür wird die Signifikanzzahl a (z.B.
1%, 2%, 5%) benötigt; sie wurde vorher festgelegt. Es gilt F=1-a. Für eine
bestimmte Anzahl von entnommenen Proben gilt: f1=n1-1 bzw. f2=n2-1, wobei
n1 und n2 die Stichprobengrößen darstellen. Mit den sich daraus ergebenden
Freiheitsgraden f1 und f2 lässt sich der Schwellenwert in einer dafür
vorgesehenen Tabelle ablesen.(z.B. F= 95%)
Formeln für die Schwellenwert suche: F=1-a
f1=n1-1 bzw. f2=n2-1
5. Zu letzt wird der Quotient der Varianzen (Prüfgröße z) mit dem der
Tabelle entnommenen Schwellenwert Z verglichen. Ist z £ Z, so wird die
Hypothese angenommen, ist z > Z, so wird sie verworfen. Letztes bedeutet,
dass sich die Varianzen der Normalverteilungen signifikant unterscheiden.
4. Beispiel
Die folgende Geschichte und die Messungen entstammen der Phantasie der
Autoren.
Zwei Studenten arbeiten während der Semesterferien in einem
Maschinenbauunternehmen. Beide arbeiten an einer Bohrmaschine, der eine in
der Früh-, der andere in der Spätschicht. Es wurden mit zwei verschiedenen
Bohrern mit gleichem Nenndurchmesser (=8mm) jeweils 16 Löcher gebohrt. Wegen
Auftragseinbußen soll in den kommenden Semesterferien nur der "bessere"
wieder eingestellt werden. Besteht ein signifikanter Unterschied
hinsichtlich der Varianz der Bohrungsdurchmesser, die die beiden Studenten
gefertigt haben?
Bohrungsdurchmesser [mm] Student A
Bohrungsdurchmesser [mm] Student B
8,023
8,002
8,011
7,993
8,036
8,005
7,990
8,047
8,009
8,063
8,023
7,985
7,991
8,011
8,103
8,201
8,095
7,994
8,010
8,147
8,070
8,052
7,983
8,035
7,952
8,046
8,005
8,015
8,160
7,998
8,125
8,195
Mittelwert xA [mm]
Mittelwert xB [mm]
8,037
8,049
Varianz sA² [mm²]
Varianz sB² [mm²]
0,003316783
0,004935963
1. Hypothesen:
Nullhypothese H0: sA² = sB²
Gegenhypothese H1: sA² ¹ sB²
2. Eine Normalverteilung wird angenommen.
3. Berechnung der Prüfgröße z:
4. Aufsuchen des Schwellwertes Z: a = 5 % gewählt; n1 = n2 = 16
F = 1 - a = 1 - 5 % = 95 %
f1 = n1 - 1 = 16 - 1 = 15
bzw. f2 = n2 - 1 = 16 - 1 = 15
Der Schwellenwert wurde durch die Freiheitsgrade (f1 und f2) aus der Tabelle
Tafel 9a (Erwin Kreyszig, Statistische Methoden und ihre Anwendungen,7.
Auflage, 1984, S.436) entnommen. Z = 2,4
5. Vergleichen des Schwellwertes Z mit der Prüfgröße z:
Da Z > z ausfiel, wird H0 bestätigt. Damit liefert der Test keine
Entscheidung für oder gegen die Wiedereinstellung einer der beiden
Studenten. Beide Messstichproben können aus Grundgesamtheiten entommen
worden sein, deren Streuungen sA² und sB² als gleich angesehen werden
können. Der ausgeführte Vergleich der beiden Stichprobenvarianzen konnte
diese Aussage nicht entkräften.
Gruß
Jan
Mir sind ein paar Sachen aufgefallen:
> Von einer Nullhypothese wird gesprochen, wenn mindestens zwei Verteilungen
> derselben Grundgesamtheit entnommen wurden.
???
Die Nullhypothese ist die Hypothese, die du überprüfen oder widerlegen
willst. In deinem Beispiel willst du überprüfen, ob zwei stichproben
dieselbe Varianz haben. Da ist H0: sigma1 = sigma2.
Die Nullhypothese kann aber auch z.B. aus früheren Daten (z.b.: 30% der
Wähler wählen eine bestimmte Partei), aus Angaben des Produzenten (z.B.
höchstens 5% eines Artikels sind Ausschuss) usw. stammen.
>
> Signifikanz / signifikante Abweichung: Signifikante Abweichungen sind
> Abweichungen von der zuvor aufgestellten Hypothese, die nicht mehr zu
> zufallsbedingten unvermeidlichen Abweichungen zählen (können).
>
Nein! Die Abweichungen KÖNNEN schon zufallsbedingt sein, aber es ist sehr
unwahrscheinlich!
Wenn du auf einem Signifikanzniveau von 5% testest, heißt "signifikant": die
Wahrscheinlichketi, dass die Abweichungen durch Zufall zustandegekommen
sind, berägt weniger als 5%.
>
> Schwellenwert Z:
Der "kritische Wert" der Prüfgröße, ab dem die Nullhypothese verworfen wird.
> Prüfgröße z:
Die Größe, die untersucht werden soll (was sonst?)
>
>
> 3. Durchführung des F-Tests "Vergleich zweier Varianzen einer
> Normalverteilung":
>
>
>
> 1. Die Hypothesen H0 (Nullhypothese) und H1(Gegenhypothese) werden
> formuliert. Zur Formulierung der Nullhypothese werden die Varianzen der zu
> den Stichproben 1 und 2 gehörenden Grundgesamtheiten gleich gesetzt. Bei
der
> der Gegenhypothese werden sie "Größer", "Kleiner" oder "Ungleich" gesetzt.
Da könntest du noch erwähnen, dass das davon abhängt, ob du links-, rechts-
oder beidseitig testen willst. Wenn du nur wissen willst, ob zwei Varianzen
gleich sind, wirst du zweiseitig testen. Wenn du aber z.B. den Verdacht
hast, dass eine Maschine ungenauer arbeitet als früher, wirst du
rechtsseitig testen: H0: sigma2 = sigma1 gegen H1: sigma2 > sigma1.
Ich hoffe, ich konnte dir helfen (bin kein Fachmann, aber ich beschäftige
mich momentan etwas mit statistik).
Grüße
Jutta