Inferenzstatistiken sind Daten, die verwendet werden, um auf der Grundlage einer Stichprobe Verallgemeinerungen über eine Population zu machen. Sie stützen sich auf die Verwendung einer Zufallsstichprobe, um sicherzustellen, dass eine Stichprobe repräsentativ ist. Ein einfaches Beispiel für inferenzielle Statistiken findet sich wahrscheinlich auf der Titelseite fast jeder Zeitung, wobei jeder Artikel behauptet, dass „X% der Y-Bevölkerung denkt/denkt/denkt/glaubt/glaubt Z“. Eine Aussage wie „33 % der 24- bis 30-Jährigen bevorzugen Kuchen gegenüber Kuchen“ beruht auf inferentiellen Statistiken. Es wäre unpraktisch, jeden einzelnen 24- bis 30-Jährigen nach seinen Dessertpräferenzen zu befragen. Stattdessen wurde eine repräsentative Stichprobe der Bevölkerung mit dem Ziel befragt, Rückschlüsse auf die Gesamtbevölkerung zu ziehen.
Inferenzielle und beschreibende Statistiken
Eine andere Möglichkeit der Nutzung von Umfragedaten ist die deskriptive Statistik. In diesem Fall werden Aussagen gemacht, die lediglich die erhobenen Daten beschreiben. Es ist möglich, dass derselbe Datensatz beschreibend oder inferentiell verwendet wird. Zum Beispiel könnten im Vorfeld einer US-Wahl 1,000 Menschen in einer Stadt zu ihren Wahlabsichten befragt werden, mit dem Ergebnis, dass 430 sagten, sie würden Demokraten wählen, 410 sagten, sie würden Republikaner wählen, wobei 160 unentschlossen oder nicht bereit waren, dies zu sagen . Ein Beispiel für die deskriptive Verwendung dieser Daten wäre, einfach anzugeben, dass 43% der 1,000 befragten Personen in dieser Stadt beabsichtigen, Demokraten zu wählen. Eine schlussfolgernde Aussage wäre „Demokraten halten 2 % Vorsprung“ – ein Rückschluss auf Wahlabsichten im Allgemeinen wurde aus einer Stichprobe gezogen.
Methoden
Bevor Sie allgemeine Schlussfolgerungen aus einer Probe ziehen, ist es wichtig, die richtigen Methoden anzuwenden, da diese Schlussfolgerungen sonst möglicherweise nicht gültig sind. Häufige Fehlerquellen liegen in der Zusammenstellung der Stichprobe, und eine Reihe von Faktoren kann die Validität der Stichprobenpopulation beeinflussen. Die Größe ist entscheidend, denn je kleiner sie ist, desto größer ist das Risiko, dass die Stichprobe nicht repräsentativ für die Gesamtbevölkerung ist. Es muss auch darauf geachtet werden, Quellen von Vorurteilen zu beseitigen. Im obigen Beispiel können Faktoren wie Alter, Geschlecht und Einkommen einen erheblichen Einfluss auf die Wahlabsichten haben. Wenn die Stichprobe also nicht so zusammengesetzt wurde, dass sie die allgemeine Bevölkerung widerspiegelt, ist die Schlussfolgerung möglicherweise nicht gültig.
Stichprobenverfahren müssen sorgfältig ausgewählt werden; Beispiel: Wenn jemand eine Gebrauchsmusterstichprobe entnommen hat, die jeden zehnten Namen im Telefonbuch oder jeden zehnten Passanten in einem Einkaufszentrum enthält, ist diese Stichprobe möglicherweise nicht gültig. Stichprobenverzerrung ist ebenfalls eine Überlegung. Es ist beispielsweise möglich, dass 10- bis 10-Jährige, die an einer Kuchenliebhaber-Konferenz teilnehmen, eher Kuchen als Kuchen genießen, was bedeuten würde, dass eine Umfrage zu Dessertpräferenzen mit Konferenzteilnehmern als Stichprobe nicht sehr repräsentativ wäre.
Verwendung
Der Einsatz von Inferenzstatistiken ist ein Eckpfeiler der Bevölkerungs- und Ereignisforschung, da es in der Regel schwierig und oft unmöglich ist, jedes Mitglied einer Bevölkerung zu befragen oder jedes Ereignis zu beobachten. Stattdessen versuchen die Forscher, eine repräsentative Stichprobe zu erhalten und diese als Grundlage für allgemeinere Schlussfolgerungen zu verwenden. So wäre es beispielsweise nicht möglich gewesen, die Krankenakte jedes einzelnen Rauchers zu überprüfen, um einen Zusammenhang zwischen Rauchen und Lungenkrebs herzustellen, aber zahlreiche Stichproben, die Raucher mit Nichtrauchern vergleichen und andere Risikofaktoren eliminieren, haben sich fest etabliert dieser Link.
Forscher, die mit Inferenzstatistiken arbeiten, versuchen, ihre Methoden und Praktiken transparent und so streng wie möglich zu halten, um die Integrität ihrer Ergebnisse zu gewährleisten. Aussagen, die auf informellen Umfragen und schnellen Umfragen basieren, sind möglicherweise nicht sehr nützlich, aber in Bereichen wie der medizinischen Forschung und klinischen Studien sind die Standards viel strenger, und Inferenzstatistiken haben enorme Mengen an wertvollen Informationen geliefert. In anderen Bereichen werden sie täglich verwendet, um pauschale Verallgemeinerungen über Bevölkerungsgruppen anzustellen, die die öffentliche Ordnung, Produktdesign, Marketing und politische Kampagnen beeinflussen können.