Streuung um den Mittelwert
In den folgenden Säulendiagrammen ist die Notenverteilung zweier Schülergruppen (Mädchen, Jungen) dargestellt, deren Mittelwert gleich ist.

Notenverteilung Mädchen

Notenverteilung Jungen
Bei den Mädchen liegen die Noten alle sehr nahe am Mittelwert.
Sie streuen wenig um den Mittelwert.
Bei den Jungen sind die Abweichungen vom Mittelwert sehr groß.
Sie streuen stark um den Mittelwert.
Die Statistik bietet Möglichkeiten, die Streuung näher zu untersuchen.
Die Spannweite
Berechnet man den Unterschied zwischen dem größten und kleinsten Beobachtungswert, so erhält man die Spannweite.
Sie ist ein Maß für die Breite des Streubereichs einer Häufigkeitsverteilung.
|
Spannweite
|
|
| |
Beispiel:
|
| |
|
Der Quartilsabstand
Zur Erinnerung:
Der Median teilt einen nach Größe sortierten Datensatz in der Mitte.
Das bedeutet, links und rechts vom Median liegen gleich viele Beobachtungswerte.
Unterteilt man die linke und die rechte Hälfte nach gleicher Vorschrift, wie man den Median bestimmt, so erhält man vier gleich große Bereiche, die durch drei Quartile
aufgeteilt werden.
| |
Beispiel:
|
| |
Die Liste enthält von 13 Schülern die Körpergröße.
Die Merkmalsausprägungen (Beobachtungswerte) wurden nach der Größe geordnet.

|
|
Quartile
|
Etwa 25% aller geordneten Beobachtungswerte sind kleiner als das 1. Quartil.
Etwa 50% aller geordneten Beobachtungswerte sind kleiner als das 2. Quartil.
Etwa 75% aller geordneten Beobachtungswerte sind kleiner als das 3. Quartil.
|
Wie leicht zu erkennen ist, liegen zwischen dem 1. und 3. Quartiel 50% aller Beobachtungswerte.
Dieser Bereich wird auch Quartilsabstand genannt.
|
Quartilsabstand
|
|
Weitere Auswertung des Beispiels:
|
Vergleich zwischen Quartilsabstand und Spannweite
|
| Quartilsabstand |
Spannweite |
Von Ausreißern unabhängig.
Gibt die Breite des mittleren Bereichs an,in dem ca. 50% aller Werte liegen.
|
Vom kleinsten und größten Wert abhängig.
Gibt die Gesamtbreite an in dem alle Werte liegen.
|
| |
Beispiel:
|
| |
Ein Landwirt misst im Monat April jeweils mittags um 12 Uhr die Außentemperatur und trägt sie in eine Tabelle ein.
Berechnen Sie den Mittelwert, die Spannweite und den Median.
Berechnen Sie das 1. und 3. Quartil und den Quartilsabstand.

|
Die Ergebnisse lassen sich in einem Boxplot - Diagramm darstellen:
Varianz und Standardabweichung
Wir betrachten noch mal die Notenverteilung von Mädchen und Jungen aus dem vorigen Beispiel.

Der Mittelwert ist in beiden Fällen gleich, die Streuung um diesen ist unterschiedlich.
|
Abweichung
|
|
In der beschreibenden Statistik berechnet man das arithmetische Mittel der Abweichungsquadrate und nennt dieses die Varianz.
| |
Berechnung der Varianz einer Datenreihe
|
| |
|
| |
|
| |
Für unser Beispiel gilt:
|
Viele Daten sind mit Einheiten behaftet, z.B. Meter (m) oder kg.
Die Einheit für die Varianz wäre in diesen Fällen m2 bzw. (kg)2.
Um wieder auf die ursprüngliche Einheit zu kommen, zieht man die Wurzel aus
der Varianz.
Dieser Wert wird Standardabweichung genannt.
|
Standardabweichung
|
|
Zur praktischen Berechnung fertigt man wie oben gezeigt eine entsprechende Tabelle an.
Sie dient auch zur Kontrolle der Daten.
Die Summe der Abweichungen muss Null ergeben.
| |
Bemerkungen zur Varianz:
|
| |
|
Berechnung der Standardabweichung aus einer Häufigkeitstabelle.
Hier geht man ähnlich vor wie bei der Mittelwertbildung.
Zur Erinnerung:
| |
Berechnung der Varianz einer Häufigkeitstabelle
|
| |
|
| |
Beispiel:
|
| |

Berechnung der Gesamtzahl aller Schüler aus den absoluten Häufigkeiten ni:

Berechnung der Varianz über die absolute Häufigkeit:
|
| |
Beispiel:
|
| |

Berechnung der Varianz über die relative Häufigkeit:
|
Das Beispiel zeigt, dass es sich mit den relativen Häufigkeiten leichter rechnen lässt.
Berechnung der Standardabweichung aus einer klassierten Häufigkeitstabelle.
Zur Erinnerung:
| |
Berechnung der Varianz einer klassierten Häufigkeitstabelle
|
| |
|
| |
Beispiel:
|
| |
Bestimmen Sie aus der klassierten Häufigkeitstabelle für die Körpergröße die Standardabweichung.

Berechnung über die absolute Häufigkeit:

Berechnung über die relative Häufigkeit:
|
Auch hier lässt sich das Problem einfacher über die relative Häufigkeit lösen.
Die Standardabweichung ist ein Maß dafür, wie hoch die Aussagekraft des Mittelwertes ist.
Eine kleine Standardabweichung bedeutet, alle Beobachtungswerte liegen nahe am
Mittelwert.
Eine große Standardabweichung bedeutet, die Beobachtungswerte sind weit um den Mittelwert gestreut.
|