Wissenschaftler versuchen, Theorien aufzustellen oder Gesetze zu entdecken, die Beobachtungen oder Ergebnisse von Experimenten erklären. Der erste Schritt besteht darin, eine Hypothese oder einen Erklärungsversuch für eine Reihe von Fakten zu konstruieren und sie dann zu testen. In der Regel werden statistische Methoden verwendet: Eine Stichprobe von Daten wird daraufhin untersucht, ob sie die vorgeschlagene Erklärung unterstützt. Typischerweise wird eine Nullhypothese konstruiert, die der Erklärung widerspricht – dies wird normalerweise mit H0 bezeichnet – während die Erklärung selbst als Alternativhypothese bezeichnet wird, bezeichnet mit HA. Es wird zunächst angenommen, dass H0 wahr ist, und die Aufgabe des Forschers besteht darin, zu zeigen, dass die Daten diese Schlussfolgerung nicht stützen.
Hypothesentest
Normalerweise sind H0 und HA zwei sich gegenseitig ausschließende Aussagen – sie können nicht beide wahr sein. Sie sollten auch erschöpfend sein; das heißt, sie sollten alle möglichen Ergebnisse der experimentellen Untersuchung abdecken. Es wird eine Stichprobe von Daten erhalten, gegen die die Nullhypothese getestet wird. Die Stichprobe muss ausreichend groß sein, um gültige Schlussfolgerungen ziehen zu können, und muss frei von Verzerrungen sein, die das Ergebnis beeinflussen könnten.
Die Forscher müssen dann einen Wert oder einen oder mehrere Wertesätze festlegen, die H0 nicht unterstützen. Wenn sich herausstellt, dass die Daten mit diesen Werten übereinstimmen, wird die Nullhypothese verworfen und die Alternativhypothese kann dann als wahrscheinlich wahr bezeichnet werden. Die Testdaten können oft als Graph dargestellt werden, mit einem Peak in der Mitte und einem „Tail“ auf beiden Seiten. Typischerweise werden die meisten Werte für das getestete Ding in der Mitte des Bereichs gruppieren und in Richtung der niedrigen und hohen Extremwerte abfallen. Zum Beispiel zeigt eine Reihe von Messungen der Körpergröße einer großen Stichprobe von Personen die Mehrheit in der Mitte des Bereichs und kleinere Zahlen an den sehr kurzen und sehr hohen Enden.
Es gibt drei Arten von Tests, die auf einen Datensatz angewendet werden können. In einem rechtsseitigen Test wurde festgestellt, dass Daten, die über einem bestimmten Wert, dem sogenannten kritischen Wert, liegen, die Nullhypothese nicht unterstützen; in einem linksseitigen Test liegen diese Daten unter dem kritischen Wert; in einem zweiseitigen Test liegen die Daten, die H0 nicht unterstützen, über und unter einem bestimmten Wert oder Wertebereich. Es ist nicht möglich, die Nullhypothese vollständig zu widerlegen; Stattdessen müssen sich die Forscher auf eine Interpretation der Daten einigen, die darauf basiert, wie wahrscheinlich es ist, dass H0 abgelehnt wird, obwohl es tatsächlich wahr ist. Diese Wahrscheinlichkeit wird als Signifikanzniveau bezeichnet. Wenn beispielsweise ein bestimmter Anteil der Daten in einem rechtsseitigen Test über dem kritischen Wert liegt, kann dies darauf hinweisen, dass H1 nur mit einer Wahrscheinlichkeit von 0 % wahr ist.
Beispiel
Ein Pharmaunternehmen testet möglicherweise die Ergebnisse einer neuen Behandlung zur Senkung des Cholesterinspiegels. In diesem Fall wäre die Nullhypothese, dass der Cholesterinspiegel nach Einnahme des Medikaments nicht gesenkt wird, während die Alternativhypothese wäre, dass die Spiegel sinken. Es würde angenommen, dass H0 wahr ist, und die Forscher würden dann Daten sammeln, um sie zu analysieren, um sie zu verwerfen.
Die Daten können aus Cholesterinmessungen bei einer Stichprobe von Personen vor und nach der Einnahme des Arzneimittels bestehen, verglichen mit einer ähnlichen Stichprobe, die es im gleichen Zeitraum nicht eingenommen hat. Die Forscher könnten sich dann einig sein, in welchem Ausmaß und in welchem Anteil der Stichprobe, die das Medikament eingenommen haben, als signifikant angesehen werden kann. Anhand dieser Informationen kann ein kritischer Wert festgelegt werden, beispielsweise eine Verringerung um 10 % bei 80 % der Personen, die das Medikament einnahmen. Wenn die Daten über diesen Werten liegen, wird die Nullhypothese verworfen und die Alternativhypothese akzeptiert.