Clustering -Analyse ist ein statistisches Verfahren verwendet werden, um Fälle, in Kategorien, so dass die Fälle in jeder Kategorie einander ähnlich und unterscheidet sich von den Fällen, in anderen Kategorien sind zu vereinbaren. Jede Kategorie ist ein Cluster . Sozialwissenschaftler verwenden SPSS ( Statistical Package für Sozialwissenschaften ) , um Cluster- Analysen durchzuführen . In K -Means Clustering der Forscher bezeichnet die Anzahl der Cluster gewünscht. K ist die Anzahl der Cluster Forscher zeigen sie wollen. K -Means Clustering ermöglicht es Forschern, Cluster sehr große Datenmengen . Anleitung
Analysieren von Daten
1
Klicke auf "Analyze" an der Spitze der th SPSS Bildschirm . Wählen Sie " Klassifizieren " aus dem Drop -Down-Menü und "K -Means Cluster . "
2
Wählen Sie eine Stichprobe von Fällen . Im Dialogfeld auf "Variablen" klicken , und markieren Sie die Variablen , die Sie in der ersten K -Means -Analyse verwenden . Klicken Sie auf den Pfeil nach links , um die Variablen in das Feld zu bewegen. Stellen Sie die Anzahl der Cluster , in der Regel 5 in einer durchschnittlichen Größe Datensatz im Feld "Anzahl der Cluster . " Die Anzahl der Cluster muss mehr als zwei und nicht mehr als die Anzahl der Fälle. Klicken Sie auf " durchlaufen und klassifizieren " im Dialogfeld Cluster -Zentren zu erhalten. Klicken Sie auf "Schreiben Finale."
3
umfassen die gesamte Daten -Datei für den letzten K -Means -Analyse. Klicken Sie auf "Analyze " an der Spitze der SPSS -Bildschirm. Wählen Sie " Klassifizieren " aus dem Drop -Down-Menü und "K -Means Cluster . " Im Dialogfenster wählen Sie "Variablen" und markieren Sie die Variablen, die Sie verwenden möchten. Klicken Sie auf den Pfeil nach links. Stellen Sie die Anzahl der Cluster bei 5 in der Box " Anzahl der Cluster . " Klicken Sie auf " Klassifizieren " in der Dialogbox. Wählen Sie " Initial lesen ", um die Cluster- Zentren aus der Probe in Schritt 2 erhalten . Klicken Sie auf "Speichern". Klicken Sie auf " Cluster -Mitgliedschaft. " Klicken Sie auf "Weiter".
Den Output
4
Bewertung die erste Tabelle in der Ausgabe , beschriftet Lesen "Final Cluster Centers . " Die Spitze der Tabelle hat die Zahlen 1 bis 5 über sie , was jeder der 5 Clustern. Die linke Spalte ist die " REGR Faktor score" ( Regression Faktor Punktzahl oder wie gut die einzelnen Variablen prognostiziert die score) für jede der Analysen . Wenn Sie die Zeile neben Punktzahl 1 zur Analyse 1 nach rechts folgen, wird es Ihnen der Faktor Punktzahl für jeden Cluster .
5
Lesen Sie in der nächsten Tabelle in der Ausgabe mit der Überschrift " Anzahl der Fälle in jeder Cluster . " Der Kasten auf der linken Seite sind die Cluster -Nummer, 1 bis 5 . Folgen Sie dem Cluster Zahl rechts und Sie werden die Zahl der Fälle in diesem Cluster zu finden.
6
Blick auf die letzten Tabelle in der Ausgabe " Cluster -Mitgliedschaft ", die zeigt, welche Fälle sind in jedem Cluster. Die Fälle werden in der linken Spalte aufgelistet und die Cluster-Nummer ist in der Spalte ganz rechts gefunden.