? Inferenzstatistik ist der Prozess der Abschätzung einer Variable in einer Population auf bekannten Daten aus einer kleineren Stichprobe dieser Grundgesamtheit. Um eine genaue Schätzungen gemacht werden , der Mittelwert und die Verteilung der Probe sollte so nah wie möglich an die Bevölkerung von dem sie genommen werden. Es gibt mehrere Schritte, die Sie in diese Richtung nehmen können . Anleitung
1
Verwenden Sie eine große Stichprobenumfang wie Zeit und Geld erlauben . Wenn Sie einen kleineren Stichprobenumfang zu verwenden, ist es wahrscheinlicher, dass Ihre Probe wird Cluster um einen Mittelwert , der nicht vertreten ist Ihre Bevölkerung. Umgekehrt , desto größer ist Ihre Probe ist , desto größer ist die Wahrscheinlichkeit, dass es statistisch passen die Bevölkerung .
2
Verwenden Zufallsstichprobe. Idealerweise sollte jede Datenpunkt in der Bevölkerung die gleiche Chance haben , am Ende in Ihrer Probe . Ist dies nicht der Fall ist, wird Ihre Schätzungen vorgespannt werden . Zum Beispiel, wenn Sie das durchschnittliche Nettovermögen der Menschen in Ihrem Land schätzen , und Sie wollen nur sammeln Beispieldaten aus der reichste Stadt , wird Ihre Probe wahrscheinlich überschätzen die Bevölkerung bedeuten .
3
entfernen Ausreißer . Ein Ausreißer ist ein Datenpunkt, der weit entfernt liegt von der Haupt- Cluster. Obwohl sie legitim Datenpunkte aus Ihrer Probe stellen , möchten Sie vielleicht , um sie in einigen Fällen zu entfernen, zum Beispiel wenn Ihr Stichprobengröße ist ziemlich klein , oder wenn Sie aus irgendeinem Grund den Mittelwert anstelle eines anderen Lagemaß verwenden müssen wie der Median . Zum Beispiel, wenn Ihr Nettovermögen Umfrage umfasste 10 Personen - 9 Mittelschicht, und Bill Gates - Ihre Schätzung des durchschnittlichen Gehalt ist wahrscheinlich aufgeblasen werden , so dass Sie vielleicht diese durch Entfernen der Ausreißer begegnen
.