Quantitative Methoden und Data Mining - Modul 2

Studienziele

Die Teilnehmer*innen wenden die Methoden der deskriptiven Statistik wie der Stochastik an. Sie besitzen einen Überblick über Zufallsvariablen sowie grundlegende Verteilungen, sie verstehen die Konzepte der bedingten Wahrscheinlichkeit und wenden das Theorem von Bayes auf praktische Fragestellungen an. Die Teilnehmer*innen erarbeiten Datenmodelle und beurteilen Spalten/Attribute/Features vor dem Hintergrund der jeweiligen Fragestellung

Die Teilnehmer*innen kennen den Unterschied zwischen überwachtem und unüberwachtem Lernen und wenden Verfahren aus dem Data Mining (Assoziation, Klassifikation, Clusterung) an. Die Teilnehmer*innen haben ein Grundverständnis über die Funktion neuronaler Netze. Sie sind über die aktuelle gesellschaftliche Diskussion etwa über algorithmische Verzerrung (Algorithmic Bias) und Ethik in Zusammenhang mit maschinellem Lernen informiert.

Technologisch steht R im Mittelpunkt. Bei den Data Mining Verfahren werden die Lösungen parallel mit R und einem Business Intelligence System (SQL Server) gezeigt.

Lehrinhalte

Daten, Merkmale und Variablen
Deskriptive Statistik:
-    Datenorganisation und Häufigkeitsverteilungen
-    Lage, Streuung, Form, Symmetrie,         Konzentration
-    Gliederungs-, Beziehungs-, Mess- und Indexzahlen
-    Kontingenz- und Korrelation
-    Regression
Wahrscheinlichkeitsrechnung:
-   Grundlagen und Axiome, Zählregeln
-   Zufallsvariablen und Verteilungen
-   Grenzwertsätze, Bayes Regel
Datentransformation
- Normalisierung und Skalierung
- Tukey’s Ladder of Powers
Feature Selection / Engineering
Data Mining:
- Assoziationsanalysen und
Interessantheitsmaße
- Klassifikation und Modellbewertung
Entscheidungsbäume
Leistungsbewertung,
Konfusionsmatrix, ROC-Analyse
Clusteranalysen, Ähnlichkeits- und Distanzmaße
Machine Learning und Neuronale Netze

Lehr- und Lernmethoden

Problem based learning; Vorträge, problemorientierte Übungen und Aufgaben

Abschluss

Hochschulzertifikat der Berliner Hochschule für Technik
(bei Absolvierung der modulbegleitenden Aufgaben und der Modulprüfung; 5 Creditpoints nach ECTS);
ansonsten Teilnahmebescheinigung

Durchführung

Dauer: 8 Wochen
Beginn: Januar 2023
Anmeldung: jederzeit zum nächsten Beginn
Präsenztermine: Anfang Januar und Anfang März 2024 (jeweils Fr/Sa)

Nutzungsentgelt

1.999,- Euro

Zugangsvoraussetzungen

Abschluss eines Hochschulstudiums oder eines vergleichbaren Studiums an einer Berufsakademie (BA)
mindestens ein Jahr für die Weiterbildung geeignete Berufserfahrung
Besondere Vorkenntnisse im Programmieren mit R und Python sind nicht erforderlich, jedoch die Bereitschaft, sich in diese Programme einzuarbeiten.
Interesse an der Teilnahme durch berufliche Erfahrungen in einem der Themenfelder (Vorverarbeitung, Datenanalyse, Ergebniskommunikation).

Detaillierte Informationen

Aufbau und Ablauf des Fernstudienkurses

weiter zu Modul 3: Darstellung der Analyseergebnisse (Storytelling)