Klassenbildung bei metrischen Daten

Klassenbildungen sind notwendig, wenn man viele Merkmale mit sehr vielen Ausprägungen hat und eine Häufigkeitstabelle zu unübersichtlich wird.

Das Ziel einer Klassenbildung ist, das man Ausprägungen in Klassen sortiert, um somit die Variable anschaulicher und übersichtlicher zu machen. Der Vorteil einer Klassenbildung ist natürlich die Übersichtlichkeit und es gibt Auswertungsmöglichkeiten zur besseren Veranschaulichung. Der Nachteil ist allerdings, dass durch die Klassierung immer Informationen für einzelne Fälle verloren gehen.

Regeln für Klassenbildung (quantitativ):

  • Klassen überschneidungsfrei: von…bis unter…, über… bis einschließlich…, von…bis… (nicht bei stetigen Merkmalen)
  • Geschlossene Randklassen
  • Empfehlungen für die Anzahl der Klassen: 5-8 bei zu 100 Ausprägungen, 8-11 bei 100-1.000 Ausprägungen, 11-15 bei 1.000 bis 10.000 und 15-20 bei mehr als 10.000 Merkmalsausprägungen

Es gibt drei Prinzipien, Klassen zu bilden.

Prinzip 1: Konstante Klassenbreite:

  • eine Häufigkeitstabelle erstellen (am besten in SPSS oder eine andere Statistik-Software)
  • Spannweite errechen (Maximum-Minimum)
  • Klassenbreite errechnen = Spannweite/Klassenzahl => Ergebnis sollte aufgerunden werden
  • Klassenbreite sukzessiv abtragen und Klassengrenzen bestimmen
  • Häufigkeiten zu den einzelnen Klassen bestimmen

Prinzip 2: Konstante Häufigkeiten

  • Ideale Klassenhäufigkeit berechnen = Gesamtzahl/Klassenzahl
  • Ausprägungen zusammenfassen bis ideale Klassenhäufigkeit ungefähr erreicht ist
  • Klassengrenzen ablesen

Prinzip 2 kann angewendet werden, wenn bei Prinzip 1 ein Großteil der Merkmalsträger in wenige Klassen fallen.

Prinzip 3: Grafische Klassenbildung anhand einer Summenhäufigkeitskurve

  • eine Summenhäufigkeitskurve erstellen anhand von SPSS
  • anhand eines Lineals die Klassen an der Grafik abstecken, sodass am wenigsten mit Informationsverlust zurechnen ist (sobald Punkte nicht an der Geraden liegen, neue Klasse abstecken)
  • der Vorteil: diese Klassenbildung behält die meisten Informationen

Um am besten die geeignetste Variante herauszubekommen, guckt man sich die Häufigkeitstabelle an und macht eine Summenhäufigkeitskurve bzw. über SPSS kann man sich unter visuelle Klassierung die Klassen anzeigen lassen.

Sobald die Klassen mit sehr unterschiedlichen Häufigkeiten abgebildet werden, würde man eher auf eine grafische Darstellung gehen, als konstante Klassenbreite oder Häufigkeiten.

Klassenbildung bei metrischen Daten

Beitragsnavigation


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert