Datenvorverarbeitung (Data Preparation and Data Wrangling) - Modul 1

Studienziel

Die Teilnehmerinnen und Teilnehmer lernen die Tools und Methoden zur Erarbeitung auswertungsbereiter Datensätze aus unterschiedlichsten Quellen / Vorsystemen kennen (SQL sowie R, Python oder PowerQuery). 

Abschluss

Hochschulzertifikat der Beuth Hochschule für Technik Berlin
(bei Absolvierung der modulbegleitenden Aufgaben und der Modulprüfung; 5 Creditpoints nach ECTS);
ansonsten Teilnahmebescheinigung

Lehrinhalte

  • Datenakquise (Erhebung, Transaktionsdaten, Public Data)
  • Data Assessment (inhaltliche Eignung, Validierung, Entity Resolution)
  • Vorverarbeitung von Variablen und Datensätzen: Aggregation, Gruppierung, Transformation, Filterung, Teilmengen: Spalten und Zeilen
  • unstrukturierte Daten und Skriptsprachen
  • Datenbankgrundlagen und SQL

Lehr- und Lernmethoden

Problem based learning; Vorträge, problemorientierte Übungen und Aufgaben

Durchführung

Dauer: 8 Wochen 
Beginn: Oktober 2019
Anmeldung: jederzeit zum nächsten Beginn
Präsenztermine: 11./12. Oktober 2019 und 06./07. Dezember 2019

Nutzungsentgelt

(vorbehaltlich Kuratoriumsbeschluss)

1.999,- Euro 

Zugangsvoraussetzungen

  • Abschluss eines Hochschulstudiums oder eines vergleichbaren Studiums an einer Berufsakademie (BA)
  • mindestens ein Jahr für die Weiterbildung geeignete Berufserfahrung
  • Besondere Vorkenntnisse im Programmieren mit R und Python sind nicht erforderlich, jedoch die Bereitschaft, sich in diese Programme einzuarbeiten.
  • Interesse an der Teilnahme durch berufliche Erfahrungen in einem der Themenfelder (Vorverarbeitung, Datenanalyse, Ergebniskommunikation).

Detaillierte Informationen

Aufbau und Ablauf des Fernstudienkurses

weiter zu Modul 2: Quantitative Methoden und Data Mining