Tafel

An dieser Stelle zeige ich euch eine kleine Zusammenstellung von Häufigkeiten, Lage- und Streuungsparameter..

Es wird nach einem einfachen Schema vorgegangen. Die wichtigsten Kennzahlen der Häufigekeiten, sowie der Lageparameter & Streuungsparameter bauen sich wie folgt auf:.

Häufigkeiten

  • absolute Häufigkeit = ist die Anzahl der Merkmalsträger (Fall/Datensatz)  mit einer bestimmten Ausprägung (Variable).
  • Summe der absoluten Häufigkeiten ist die Gesamtzahl der betrachteten Merkmalsträger.
  • relative Häufigkeit = absolute Häufigkeit/Gesamtzahl * 100%
  • Somit ergibt die Summe aller r elativen Häufigkeiten 100% ;)
  • Kummulierte abolute Häufig keit ist die Summe der absoluten Häufigkeiten.
  • Sowie die kummulierte relative Häufigkeit die Summe der relativen Häufigkeiten ist.

Lage- und Streuungsparameter

  • Lage heißt, wo liegen die Daten.
  • Streuung heißt, wie streuen die Daten.

Lageparameter

  • Median = Zentralwert ME
  • unteres Quartil = 25%
  • oberes Quarile = 75%

Arithmetisches Mittel (AM)

ist der Durchschnitt aller Beobachtungen und ist ein Lageparameter.

  • AM = Summe der Merkmalsausprägungen/ Anzahl der Merkmalsträger
  • allerdings auf Ausreißer empfindlich
  • Voraussetzungen: Summenbildung , Kardinalskala; Ordinalskala, Datenbereinigung-da empfindlich auf Ausreißer

Streuungsparameter

Im Überblick = die 5 Zahlen Statistik

  • Minimum
  • Unteres Quartil (Q 25)
  • Median
  • Oberes Quartil (Q 75)
  • Maxium

Die Spannweite – Aussage über den Bereich, über den sich die Merkmalsträger verteilen- berechnet sich durch Maximum minus Minimum.

ACHTUNG: bei Extremwerten oder Ausreißern ist der Wert nicht mehr aussagekräftig.

Der Quartilsabstand (QA) – Aussage über den Bereich, indem die Hälfte der Merkmalsträger mit mittleren Wert liegt – berechnet sich Q75 minus Q25.

Der QA ist gegenüber der Spannweite unempfindlich bei Ausreißern oder Extremwerten.

Berechnung der Extremwerte und Ausreißer

Extremwerte nach unten =  <_Q25 – 3*QA

Extermwerte nach oben = >_Q75 + 3*QA

Ausreißer nach unten = <_Q25 – 1.5*QA

Ausreißer nach oben = >_Q75 + 1.5*QA

Ausreißerbereininung

Es gibt eigentlich nur drei Möglichkeiten, wie man Ausreiße behandeln sollte:

  • ERSETZEN mit dem Maximum
  • STREICHEN
  • STEHEN LASSEN

Varianz und Standardabweichung

Die Varianz sowie die Standardabweichung gehören zu den Streuungsparametern wie die Spannweite und QA.

Sie beschreiben die Streuung der Ausprägungen um das Arithmetische Mittel.

>>Das ist wie ein Bienenschwarm, welches sich um ein Stück Obst streitet. Die Streuung der Bienen um das Stück Obst zeigt, wie dicht die Bienen aneinanderliegen oder auseinander liegen.<<

Die Varianz ist die Standardabweichung zum Quadrat, also ² => Summe der Quardrierten Differenzen

=>Summe (Ausprägung – AM / Anzahl der Merkmalsträger)

Eigenschaften der Varianz: ist ein wichtiges Streuungsmaß und misst die durchschnittliche quadratische Abweichung vom AM.

Es ist empfindlich auf Ausreißer, daher wird eine Datenbereinung vorab empfohlen. Zudem ist die Interpretation schwierig, da die Dimension in ² ist.

Standardabweichung ist somit die Wurzel aus der Varianz. Das Streuungsmaß ist natürlich auch Ausreißer empfindlich.

Der Varianzkoeffizient (VK) ist das Verhältnis von Standardabweichung zum AM. Voraussetzung AM darf nicht Null sein

VK = Standardabweichung / AM

Kurz zusammengefasst:

In der Statistik gibt es Kennzahlen, die zum einen die Häufigkeiten der Merkmalsträger mit ihren Ausprägungen zeigen, sowie die Lage und Streuung der Ausprägungen, die für Interpretationszwecken sehr wichtig sein können.

Wenn ihr Anregungen, Fragen oder ich was vergessen haben sollte, schreibt mir. Ich freue mich drauf.

Eure MissBusiness ;)

Häufigkeiten, Lage- und Streuungsparameter

Beitragsnavigation


Ein Gedanke zu „Häufigkeiten, Lage- und Streuungsparameter

Kommentar verfassen