Einfach, Einfacher, Ordnungsstatistik
| Back to OverviewKlassifikation
Anstatt stochastischen Konvergenzen wollen wir uns lieber mit den wirklich schweren Themen befassen. Klassifikation von Daten / Merkmalen.
Wir teilen sie einmal auf in:
- Diskret
- Stetig
und in:
- Nominal: Das Merkmal z.B. Farbe, kann nicht geordnet werden, es kann nur unterschieden werden.
- Ordinal: Das Merkmal z.B. Schulnoten kann verglichen werden, es kann also eine Ordnung hergestellt werden.
- Metrisch
- Kardinal: Das Merkmal ist vielfaches einer Grundeinheit. z.B. Fußballfelder bei Galileo (nicht immer aber anschaulich)
- Intervall: Nullpunkt willkürlich, z.B. Temperatur
- Ratio: Nullpunkt festgelegt, z.B. Länge, Kelvin
Statistik
Wir kriegen Werte gegeben...
Ordnungsstatistik
Eine Ordnungsstatistik sind Werte, die nach Größe sortiert wurden. Z.B. . Hierzu ist die Ordnungsstatistik: .
So können wir den Median einfach bestimmen:
- n ungerade:
- n gerade: (bei metrisch skalierten Daten einfach die Mitte nehmen)
Histogramm und Gruppen
Klassifiziere die Werte in Gruppen: . Die Gruppen sind disjunkt. z.B. Wir haben Noten gegeben Dann nimmt man die Gruppen und die beiden Randgruppen mit.
Dann gibt es die relative Häufigkeiten: für Gruppe ist die relative Häufigkeit , für Gruppe und für Gruppe .
Ein Histogramm ist dann einfach ein Balkendiagramm mit Höhe und Breite . Die Breite ist natürlich die Breite der Gruppe.
Wir können auch hier eine Häufigkeitsdichte oder Dichteschätzer Funktion notiert erstellen:
Der Erwartungswert ist dann ja einfach Mittelwert und Varianz kann mit Verschiebungssatz leichter sein.
Quantile
Das -Quantil ist der Wert mit .
- ganzzahlig: Jede Zahl aus
- sonst:
Qua r tile sind die Quantile:
Boxplot
Aus Mittelwert / Erwartungswert, Median, Quartile, , macht man dann Grafik: