Bausteine Computergestützter Datenanalyse

Autor:innen

Lukas Arnold

Simone Arnold

Florian Bagemihl

Matthias Baitsch

Marc Fehr

Maik Poetzsch

Sebastian Seipel

Veröffentlichungsdatum

5. September 2025

Methodenbaustein Einlesen strukturierter Datensätze

Symbol des Lizenzhinweises Creative Commons BY

Bausteine Computergestützter Datenanalyse von Lukas Arnold, Simone Arnold, Florian Bagemihl, Matthias Baitsch, Marc Fehr, Maik Poetzsch und Sebastian Seipel. Methodenbaustein Einlesen strukturierter Datensätze von Maik Poetzsch ist lizensiert unter CC BY 4.0. Das Werk ist abrufbar auf GitHub. Ausgenommen von der Lizenz sind alle Logos Dritter und anders gekennzeichneten Inhalte. 2025

Zitiervorschlag

Arnold, Lukas, Simone Arnold, Florian Bagemihl, Matthias Baitsch, Marc Fehr, Maik Poetzsch, und Sebastian Seipel. 2025. „Bausteine Computergestützter Datenanalyse. Methodenbaustein Einlesen strukturierter Datensätze”. https://github.com/bausteine-der-datenanalyse/m-einlesen-strukturierter-datensaetzee.

BibTeX-Vorlage

@misc{BCD-m-esd-2025,
 title={Bausteine Computergestützter Datenanalyse. Methodenbaustein Einlesen strukturierter Datensätze.},
 author={Arnold, Lukas and Arnold, Simone and Bagemihl, Florian and Baitsch, Matthias and Fehr, Marc and Poetzsch, Maik and Seipel, Sebastian},
 year={2025},
 url={https://github.com/bausteine-der-datenanalyse/m-einlesen-strukturierter-datensaetze}} 

Voraussetzungen

Die Bearbeitungszeit dieses Bausteins beträgt circa Platzhalter. Für die Bearbeitung dieses Bausteins werden folgende Bausteine vorausgesetzt und die genannten Bibliotheken verwendet:

Bausteine:

  • Werkzeugbausteine Python, NumPy, Pandas

Module:

  • Modul os

  • Module NumPy, numpy.ma

  • Modul Pandas

    • openpyxl pip install openpyxl

    • xlrd pip install xlrd

    • pytables pip install tables

  • Modul h5py pip install h5py

  • Modul netCDF4 pip install netCDF4

  • Modul Matplotlib

  • Modul re (optional)

  • Module datetime, time, pytz, zoneinfo (optional)

Im Baustein werden folgende Daten verwendet:

Querverweis auf:

  • w-Python

  • w-NumPy

  • w-Pandas

  • w-rechtliche Grundlagen Datenmanagement

Lernziele

In diesem Baustein lernen Sie …

  • Datensätze unterschiedlicher Struktur und Formate einzulesen, zu bearbeiten und zu speichern.

  • den Unterschied zwischen identifizierenden und gemessenen Variablen kennen sowie Datensätze ins long- und wide-Format zu konvertieren.

  • das System tidy data kennen.

  • typische Probleme beim Einlesen von Datensätzen und Strategien zu deren Lösung kennen.