Description
Dieses Buch fhrt ein in die grundlegenden Anstze des Clusterns, Segmentierens und der Faktorextraktion. Kapitel 1 fhrt ein in die Clusteranalyse. Nach einem intuitiven Beispiel anhand des Clusterns von Muscheln am Strand, und dem zugrundeliegenden, oft unausgesprochenen Cluster-Prinzipien werden u.a. die hierarchische, partitionierende und das TwoStep-Verfahren vorgestellt. Bei der hierarchischen Clusteranalyse (CLUSTER) werden die diversen Mae (z.B. quadrierte euklidische Distanz, Pearson-Korrelation, Chi-Ma etc.) und die jeweiligen Algorithmen (Density, Linkage, Ward etc.) einschl. ihrer Bias (z.B. Ausreier, Chaining) erlutert. Anhand zahlreicher Beispiele wird erlutert, wie Intervalldaten, Hufigkeiten, Kategorialdaten, sowie gemischte Daten geclustert werden. Bei der partitionierenden Clusterzentrenanalyse (k-means, QUICK CLUSTER) lernen Sie Teststatistiken zur Bestimmung der optimalen Clusterzahl kennen (z.B. Eta, F-max; nicht im original SPSS Leistungsumfang enthalten), sowie die ausgewhlte Clusterlsung auf Interpretierbarkeit, Stabilitt und Validitt zu prfen. Bei der Two-Step Clusteranalyse (TWOSTEP CLUSTER) lernen Sie die Clusterung von gemischten Daten anhand eines Scoring-Algorithmus kennen Darber hinaus lernen Sie Kriterien fr die Beurteilung einer guten Clusterlsung kennen, wie auch alternative grafische und logische Anstze zur Clusterung von auch Daten im String-Format. Kapitel 2 fhrt ein in die Gruppe der Faktorenanalyse mit SPSS. Die Faktorenanalyse (factor analysis, FA) ist ein Sammelbegriff fr verschiedene Verfahren, die es ermglichen, aus einer groen Zahl von Variablen eine mglichst geringe Anzahl von (nicht beobachteten) ‘Faktoren’ zu erhalten (‘extrahieren’). Die Faktorenanalyse geht nicht von unabhngigen oder abhngigen Variablen aus, sondern behandelt alle Analysevariablen unabhngig von einem Kausalittsstatus. Dieser Kurs fhrt in das Grundprinzip und Varianten der Faktorenanalyse (z.B. Alpha, Hauptfaktoren, Hauptkomponenten), die wichtigsten Extraktions-, wie auch Rotationsmethoden (z.B. orthogonal vs. oblique) und ihre Funktion. Vorgestellt werden Kriterien zur Bestimmung, Interpretation und Benennung der Faktoren. Dieser Kurs stellt ausschlielich die Variante der explorativen Faktorenanalyse (EFA) vor (R-Typ). Abschliessend werden eine Faktorenanalyse fr Flle (Q-Typ Faktorenanalyse vorgestellt, sowie eine Matrix-Variante, die dann zum Einsatz kommen kann, wenn die korrelationsanalytischen Voraussetzungen der Faktorenanalyse nicht erfllt sind. Die berprfung der Voraussetzungen und die Interpretation der Statistiken werden an zahlreichen Beispielen gebt. Kapitel 3 stellt die Diskriminanzanalyse (DA, syn.: DFA, Diskriminanzfunktionsanalyse) vor. Das zentrale Ziel dieses Ansatzes ist, die beste Trennung (Diskriminanz) zwischen den Zugehrigkeiten einer abhngigen Gruppenvariable fr mehrere unabhngige Einflussvariablen zu finden. In anderen Worten, die Diskriminanzanalyse liefert die Antwort auf die Frage: Welche Kombination von Einflussvariablen erlaubt eine maximal trennende Aufteilung der Flle in die bekannten Ausprgungen einer Gruppe? Weitere, damit in Zusammenhang stehende Fragen knnen sein: Auf welche Weise werden die Flle klassiert, wie genau werden die Flle klassiert (erkennbar an der Anzahl der Fehlklassifikationen), und wie sind die schlussendlich entstehenden Klassifizierungen zu interpretieren? Es werden u.a. diverse Methoden der Variablenselektion (direkt, schrittweise), sowie auch die Berechnung und Interpretation multipler schrittweiser Diskriminanzanalysen mit mehreren ermittelten Funktionen vorgestellt (einschliesslich Lambda, Box-Test, Kreuzvalidierung (Interpretation von Kovarianz-Matrizen), das Identifizieren von Multikollinearitt, sowie Gebietskarten (Territorien). Weitere Kapitel stellen Mglichkeiten des Clusterns und Segmentierens (u.a. mit CLEMENTINE, Entscheidungsbume und ausgewhlte Cluster-Knoten. In einem abschlieenden Kapitel sind ausgewhlte Formeln der wichtigsten behandelten Verfahren zusammengestellt. Zahlreiche Rechenbeispiele werden von der Fragestellung, der Anforderung der einzelnen Statistiken (per Maus, per Syntax) bis hin zur Interpretation der SPSS- und CLEMENTINE Ausgaben systematisch durchgespielt. Auch auf mgliche Fallstricke und hufig begangene Fehler wird eingegangen. Separate Abschnitte stellen die diversen Voraussetzungen fr die Durchfhrung der jeweiligen Analyse, sowie Anstze zu ihrer berprfung zusammen. Dieses Buch ist angenehm verstndlich und anwendungsorientiert geschrieben, ohne jedoch die Komplexitt und damit erforderliche Tiefe bei der Vorstellung der Verfahren zu vernachlssigen. Dieses Buch ist fr Einsteiger, Studierende, sowie fortgeschrittene Wissenschaftler in den Wirtschafts-, Bio-, und Sozialwissenschaften gleichermaen geeignet.