Bausteine Computergestützter Datenanalyse
Methodenbaustein Einlesen strukturierter Datensätze
Bausteine Computergestützter Datenanalyse von Lukas Arnold, Simone Arnold, Florian Bagemihl, Matthias Baitsch, Marc Fehr, Maik Poetzsch und Sebastian Seipel. Methodenbaustein Einlesen strukturierter Datensätze von Maik Poetzsch ist lizensiert unter CC BY 4.0. Das Werk ist abrufbar auf GitHub. Ausgenommen von der Lizenz sind alle Logos Dritter und anders gekennzeichneten Inhalte. 2025
Zitiervorschlag
Arnold, Lukas, Simone Arnold, Florian Bagemihl, Matthias Baitsch, Marc Fehr, Maik Poetzsch, und Sebastian Seipel. 2025. „Bausteine Computergestützter Datenanalyse. Methodenbaustein Einlesen strukturierter Datensätze”. https://github.com/bausteine-der-datenanalyse/m-einlesen-strukturierter-datensaetzee.
BibTeX-Vorlage
@misc{BCD-m-esd-2025,
title={Bausteine Computergestützter Datenanalyse. Methodenbaustein Einlesen strukturierter Datensätze.},
author={Arnold, Lukas and Arnold, Simone and Bagemihl, Florian and Baitsch, Matthias and Fehr, Marc and Poetzsch, Maik and Seipel, Sebastian},
year={2025},
url={https://github.com/bausteine-der-datenanalyse/m-einlesen-strukturierter-datensaetze}}
Voraussetzungen
Die Bearbeitungszeit dieses Bausteins beträgt circa Platzhalter. Für die Bearbeitung dieses Bausteins werden folgende Bausteine vorausgesetzt und die genannten Bibliotheken verwendet:
Bausteine:
- Werkzeugbausteine Python, NumPy, Pandas
Module:
Modul os
Module NumPy, numpy.ma
Modul Pandas
openpyxl
pip install openpyxl
xlrd
pip install xlrd
pytables
pip install tables
Modul h5py
pip install h5py
Modul netCDF4
pip install netCDF4
Modul Matplotlib
Modul re (optional)
Module datetime, time, pytz, zoneinfo (optional)
Im Baustein werden folgende Daten verwendet:
Zahnwachstum bei Meerschweinchen CSV-Datei
Strommarktdaten der Bundesnetzagentur hier verfügbar und der Austrian Power Grid AG (APG) hier verfügbar
Industriestrompreise in den Mitgliedsländern der Internationalen Energieagentur XLS-Datei
Kursdaten des amerikanischen Aktienindexes S&P500 (XLS-Datei).
US State Facts and Figures, die in R abgerufen werden können.
DSB Unfallatlas der statistischen Ämter des Bundes und der Länder
Europäische Gaspreise von Eurostat XLSX-Datei
Baugenehmigungen, verfügbar beim Statistischen Bundesamt
Eisdicke in der Arktis und Antarktis kostenlose Registrierung bei NASA Earth erforderlich
Blitzdichte kostenlose Registrierung bei NASA Earth erforderlich
Querverweis auf:
w-Python
w-NumPy
w-Pandas
w-rechtliche Grundlagen Datenmanagement
Lernziele
In diesem Baustein lernen Sie …
Datensätze unterschiedlicher Struktur und Formate einzulesen, zu bearbeiten und zu speichern.
den Unterschied zwischen identifizierenden und gemessenen Variablen kennen sowie Datensätze ins long- und wide-Format zu konvertieren.
das System tidy data kennen.
typische Probleme beim Einlesen von Datensätzen und Strategien zu deren Lösung kennen.