Daten in Tabellenformaten sind weit verbreitet. Oft werden diese so eingegeben und formatiert, dass sie für das menschliche Auge einfach zu lesen sind. Um mit tabellarischen Daten jedoch einfache und korrekte Analysen und Visualisierungen durchzuführen oder sie mittels Programmiersprachen wie R oder Python weiterzuverarbeiten, sollte der Datensatz vorher bereinigt und nach den Prinzipien von Tidy Data organisiert werden.
Konkret werden folgende Themen behandelt und anhand von Beispieldaten aus den Bibliotheks- und Informationswissenschaften geübt:
- Best Practices für die Dateneingabe und -formatierung
- Vermeidung gängiger Formatierungsfehler
- Umgang mit Datumsangaben in Spreadsheets
- Grundlagen der Qualitätskontrolle und Datenmanipulation in Tabellen
- Datenexport aus Tabellen
- Abgleich mit externen Quellen, z.B. Normdateien
Der Workshop orientiert sich an den Curricula von The Carpentries.
- Trainer:innen: Claudia Engelhardt (TU Dresden/Center for Interdisciplinary Digital Sciences)
- Format: Workshop (Präsenz, online)
- Zielgruppen: Studierende (B.A., M.A.), Forschende
- Sprachen: Deutsch, Englisch