Kenngrößen und Beschreibung von Verteilungen in R
In dieser Übungsaufgabe verwenden Sie nochmals die Ergebnisse eine Mobilitätsbefragung, die Prof. Iris Mühlenbruch mit Studierenden an der Hochschule Bochum durchgeführt hat. Verwenden Sie hierzu die Datei 03-kenngroessen-aufgaben.zip.
Lagemaße
Bestimmen Sie die gängigen Lage- und Streumaße für die Fahrzeiten.
Histogramm
Plotten Sie ein Histogramm der Fahrzeiten und stellen Sie die Werte \(\overline{x} - \tilde{s}\), \(\overline{x}\) sowie \(\overline{x} + \tilde{s}\) mit farbigen vertikalen Linien dar.
Verteilungsfunktion
Stellen Sie die empirische Verteilungsfunktion der Fahrzeiten zusammen mit horizontalen sowie vertikalen Linien für die Quartile und den Median dar.
Boxplot
Erstellen Sie jeweils einen Boxplot für
- alle Fahrzeiten,
- Fahrzeiten getrennt nach Fachbereichen sowie
- Fahrzeiten getrennt nach Verkehrsmitteln.
Verwenden Sie im dritten Plot das Argument varwidth = TRUE.
Lorenzkurve
Stellen Sie die Lorenzkurve zu den Fahrzeiten dar und bestimmen Sie den zugehörigen Gini-Koeffizienten. Spielt es hier eine große Rolle ob man \(G\) oder \(G^*\) betrachtet?
Tipp: Die Funktion lc_to_tibble(), die der das Ergebnis von Lc in einen Dataframe konvertiert werden kann wird zu Beginn von kenngroessen-aufgaben.qmd definiert und kann somit verwendet werden (so wie in den Folien zur Vorlesung).
Wiederverwendung
Zitat
@misc{arnold2025,
author = {Arnold, Lukas and Arnold, Simone and Bagemihl, Florian and
Baitsch, Matthias and Fehr, Marc and Hollmann, Franca and Poetzsch,
Maik and Seipel, Sebastian},
title = {Bausteine Computergestützter Datenanalyse: Werkzeugbausteine
R},
date = {2025},
url = {https://github.com/bausteine-der-datenanalyse/bcd-bausteine-r},
langid = {de}
}