Druckversion: | Nach dem Drucken: | und zurück zum Dokument |
Sollte das Drucken mit diesem Schaltknopf nicht funktionieren, nutzen Sie bitte die Druckfunktion in Ihrem Browser: Menü Datei -> Drucken
ViLeS 1 > IV Streuungsmaße > IV -1 Lagetypische Streuungsmaße > Konzepte und Definitionen |
Zu den lagetypischen Streuungsmaßen zählen die Spannweite und die Quartils- bzw. Semiquartilsabstände. Wie bereits bei den lagetypischen Mittelwerten gehen in ihre Bestimmung nicht alle beobachteten Werte ein sondern nur lagespezifisch bestimmte Werte. Ferner ist zu beachten, dass auch die lagetypischen Streuungsmaße aus Differenzen von Merkmalswerten ermittelt werden. Dies bedeutet, dass sie eigentlich nur für metrisch-skalierte, u.U. noch für ordinal-skalierte Variable geeignet sind.
Die Spannweite ist der Abstand zwischen dem
niedrigsten und dem höchsten beobachteten Wert. Eine empirisch
sinnvolle Aussage der Spannweite ist hier nur möglich, wenn metrische
Daten vorliegen. Für ordinale Daten würde sich - bei Ausschöpfung der Skalenbreite - die Berechnung aus Skalierung und nicht aus den Beobachtungen ergeben:
Abbildung 4-2: Ermittlung der Spannweite
Die Spannweite sollte nur zusammen mit anderen Streuungsmaßen verwendet werden, da sie - wie in der Graphik sichtbar - auf Ausreißer besonders sensibel reagiert. |
Der Quartilsabstand basiert auf einer geordneten und in Segmente (Quartile) geteilte Reihe der Beobachtungen. Der Median teilt die Reihe in zwei gleich große Teile, die Quartile vierteln sie. Der Quartilsabstand QA ist definiert als Abstand zwischen dem ersten Quartil und dem dritten Quartil Er gibt die Breite des Bereichs an, in dem die mittleren 50% der Beobachtungen anzutreffen sind.
Der Semiquartilsabstand SQA gibt den durchschnittlichen Abstand zwischen dem Median und den beiden Quartilen undan.
Die Quartilsabstände setzen eine geordnete Reihe, mindesten also ordinales Skalenniveau voraus. Für eine derartige geordnete Reihe werden die einzelnen Quartile wie folgt bestimmt:
Am einfachsten ergeben sich die Quartile aus den kumulierten Prozenten einer Häufigkeitstabelle. Sie liegen dann bei den Merkmalswerten, bei denen die 25 Prozentgrenze bzw. die 75 Prozentgrenze erreicht oder gerade überschritten wird (vgl. Tabelle 4-1).
Tabelle 4-1: Häufigkeitsverteilung des Merkmals "Partizipationsprofil"
Aus der Tabelle ergibt sich somit: Q 1 = 4 und Q 3 = 17 .
Zwischen Q 1 = 4 und Q 3 = 17 liegen 50 % der Beobachtungen.
Die graphische Ermittlung der Quartile basiert analog zur tabellarischen auf der Graphik der kumulierten Prozenten einer Häufigkeitstabelle in einem Summenpolygon.
Abbildung 4-3: Summenpolygon der Wartezeiten in einer Arztpraxis
Bei N = 10 ist N/4 = 2,5 und 3N/4 = 7,5. Die Lote für diese Werte vom Summenpolygon auf die X-Achse markieren dann die Quartile 1 und 3. Die roten Linien kennzeichnen die Ermittlung des Medians.
Das 1. Quartil Q1 ist der Wert, bei dem 25% der Beobachtungen erreicht werden (75% der Beobachtungen liegen darüber).
Bei einer geraden Anzahl von Beobachtungen gilt:
Q 1 = N/4 ,
Bei einer ungeraden Anzahl von Beobachtungen gilt:
.
Zur genaueren Bestimmung wird angenommen, dass das Quartil genau zwischen den beiden Werten liegt:
Das 2. Quartil Q2 ist der Wert, der 50% der Beobachtungen unter und über sich aufweist. Er entspricht somit dem Median:
Das 3. Quartil Q3 ist der Wert, bei dem 75% der Beobachtungen erreicht werden (25% der Beobachtungen liegen darüber).
Bei einer geraden Anzahl von Beobachtungen gilt:
Q 3 = 3N/4 ,
Bei einer ungeraden Anzahl von Beobachtungen gilt:
.
Zur genaueren Bestimmung wird angenommen, dass das Quartil genau zwischen den beiden Werten liegt:
Für klassiertes Datenmaterial verwendet man die feinberechneten Quartile Q1 und Q3 . Ihre Formeln ergeben sich analog zur Formel für den feinberechneten Median aus dem Strahlensatz (vgl. dazu Abb. 4-3 und Kap.III-2)
Feinberechnung des ersten Quartils
Zuerst ist die Klasse des ersten Quartils zu
bestimmen. Es ist die Klasse, in der
der beobachteten Häufigkeiten erreicht bzw. überschritten
werden. Der genaue Wert ergibt sich wie folgt:
Feinberechnung des dritten Quartils
Hier ist ebenfalls zuerst die Klasse des dritten Quartils zu bestimmen. Es ist die Klasse, in der der beobachteten Häufigkeiten erreicht bzw. überschritten werden. Der genaue Wert ergibt sich wieder analog:
Die Symbole gelten ebenfalls analog der Formel zur Feinberechnung des Medians (vgl. Litz, S.81 f u S.97):
Daraus folgen:
Der Quartilsabstand: QA = Q 3 - Q 1
und:
der Semiquartilsabstand: SQA = QA/2
Ein weitere Maß der Streuung, die Kelly-Range umfasst die mittleren 80% der Beobachtungen. Die Formel dazu findet sich in den weiteren Materialien)
letzte Änderung am 28.2.2020 um 7:49 Uhr.
Adresse dieser Seite (evtl. in mehrere Zeilen zerteilt)
http://viles.uni-oldenburg.de/navtest/viles1/kapitel04_Streuungsma~~sze/modul01_Lagetypische~~lStreuungsma~~sze/ebene01_Konzepte~~lund~~lDefinitionen/04__01__01
__01.php3