Statistik mit R und Quarto

Erste Schritte in RStudio

Beispiele zum Einstieg: Niederschläge in ausgewählten deutschen Städten

Beispiel 1: Mittlerer jährlicher Niederschlag an verschiedenen Stationen in Deutschland

`summarise()` has grouped output by 'Station'. You can override using the
`.groups` argument.

Beispiel 2: Monatlicher Niederschlag im Jahresverlauf (alle Stationen)

`summarise()` has grouped output by 'Station', 'Jahr'. You can override using
the `.groups` argument.

Beispiel 3: Monatlicher Niederschlag im Jahresverlauf je Station

Von den Daten zu den Folien

Tageswerte der Niederschläge an den verschiedenen Stationen vom Deutschen Wetterdienst

Wie entstehen daraus die Folien?

  1. Daten aus CVS-Datei einlesen
  2. Jahres- und Monatswerte ermitteln
  3. Grafiken erstellen
  4. Daraus zusammen mit Text das HTML-Dokument erzeugen

Und wie funktioniert das?

  1. Wir schreiben Text und R-Anweisungen in Quarto-Markdown-Datei
  2. Quarto erstellt daraus das HTML-Dokument

Was wir uns hierzu anschauen werden

  1. Statistische Grundlagen
  2. Daten visualisieren mit ggplot2
  3. Daten einlesen und aufbereiten
  4. Basics der Programmiersprache R
  5. Arbeiten mit der Programmierumgebung RStudio

Was ist R und was ist RStudio?

R und RStudio

Programmiersprache R

  • Programmiersprache für Statistik und Datenvisualisierung
  • Frei verfügbar, erste Version 1993 veröffentlicht
  • Keine Angst: Das wird keine Informatikvorlesung

Arbeitsumgebung RStudio

  • Grafische Oberfläche zur Datenanalyse mit R
  • Wir verwenden Quarto-Markdown für die Erstellung von Dokumenten

Die Oberfläche von RStudio

  1. Editor: Hier geben Sie ihren Text und Programmcode ein
  2. Umgebung (u.A.): Aktuell definierte Variablen
  3. Konsole (u.A.): Hier können Sie direkt R-Befehle eingeben
  4. Hilfe (u.A.): Hilfe zu Funktionen (nicht immer einfach zu verstehen)

Quarto-Markdown in RStudio

Reproduzierbare Statistik

Traditionelle Arbeitsweise (zum Beispiel mit Word)

  • Statistische Untersuchungen mit speziellem Programm
  • Ergebnisse und Grafiken von Hand in Dokument übernehmen
  • Vorteile: Einfach, gewohnte Arbeitsweise
  • Nachteile: Fehler in Berechnung - Zurück auf Start! Weg von den Daten zum Dokument nicht reproduzierbar

Arbeiten mit Quarto

  • Quarto-Markdown-Dokument fasst Text und Berechnungen zusammen
  • Daraus wird PDF/HTML/Word/PPT erzeugt (ähnlich wie mit LaTeX)
  • Vorteile: Änderungen einfach, Methoden nachvollziehbar, reproduzierbar
  • Nachteile: Ungewohnte Arbeitsweise, Lernkurve

Möglichkeiten mit Quarto

Ein einfaches Beispiel

  • links: Eingabe in Quarto Markdown

  • rechts: Ausgabe in html

  • Quelle

Quarto konvertiert Quarto-Markdown

Quarto-Markdown-Dokumente

Ein Quarto-Markdown-Dokument

  • ist eine reine Textdatei mit der Erweiterung .qmd
  • beginnt mit ein paar Grundeinstellungen (oben nicht dargestellt)
  • danach kommen
    • Blöcke mit R-Code, die so genannten ‘Chunks’
    • Text in spezieller Markdown-Schreibweise

Quarto-Markdown in RStudio

  • RStudio fügt Elemente in Quarto-Markdown-Datei ein
  • Berechnungsergebnisse und Grafiken (oben nicht dargestellt)