Beschreibung einzelner Lerneinheiten (ECTS-Lehrveranstaltungsbeschreibungen) pro Semester

Studiengang: Master Nachhaltige Energiesysteme
Studiengangsart: FH-Masterstudiengang
Berufsbegleitend
Sommersemester 2021

Titel der Lehrveranstaltung / des Moduls Data Science
Kennzahl der Lehrveranstaltung / des Moduls 072722020301
Unterrichtssprache Deutsch
Art der Lehrveranstaltung (Pflichtfach, Wahlfach) Pflichtfach
Semester in dem die Lehrveranstaltung angeboten wird Sommersemester 2021
Semesterwochenstunden 2
Studienjahr 2021
Niveau der Lehrveranstaltung / des Moduls laut Lehrplan 2. Zyklus (Master)
Anzahl der zugewiesenen ECTS-Credits 3
Name des/der Vortragenden Elias EDER, Klaus RHEINBERGER


Voraussetzungen und Begleitbedingungen

Keine


Lehrinhalte

Die Lehrveranstaltung vermittelt die klassichen Tools der Datenanalyse. Es werden die statistischen und methodischen Grundlagen erläutert, sowie die Tools in einer Programmierumgebung an Beispielen angewandt.

  • Datenstrukturen: Samples, Features, Target
  • Statistische Grundlagen: (Co-)Varianz, Korrelation, statistischer Zusammenhang vs. Kausalität
  • Cross Validation: Lern- und Testdatensätze, Fit und Prognose
  • Supervised Learning: Regression vs. Klassifikation, k-Nearest Neighbors, Lineare und Logistische Regression, Linear Support Vector Machines, (Ensembles von) Decision Trees
  • Unsupervised Learning: Clustering, Principal Component Analysis
  • Tools: Datentransformationen, Dummies, Feature Selection, Regularisierung, Grid Search

Lernergebnisse

Die Studierenden erwerben grundlegende Kenntnisse und Anwendungskompetenz in den klassischen Tools der Datenanalyse. Die Studierenden

  • können zwischen statistischem Zusammenhang und Kausalität unterscheiden.
  • sind in der Lage Zusammenhänge in Daten zu finden, grafisch darzustellen, quantitativ zu bewerten. Sie können Fits und Prognosen auf Basis verschiedener Modelle erstellen.
  • verstehen die lineare Regression und sind fähig mehrdimensionale Regressionen durchzuführen und die Ergebnisse korrekt zu interpretieren.
  • verstehen weitere klassische Tools wie k-Nearest Neighbors, Clustering und Decision Trees. Sie können diese anwenden und deren Ergebnisse interpretieren.
  • können mittels Cross Validation die Güte und Robustheit ihrer Modellaussagen bewerten.

Geplante Lernaktivitäten und Lehrmethoden
  • Vorlesungen
  • Programmierübungen, Programmierprojekte
  • Coaching

Prüfungsmethode und Beurteilungskriterien
  • Abgabe bzw. Präsentation des Programmierprojekts
  • mündliche Abschlussprüfung

Kommentar

Keiner


Empfohlene Fachliteratur und andere Lernressourcen
  • Guido, Sarah; Müller, Andreas C. (2016): Introduction to Machine Learning with Python: A Guide for Data Scientists. Sebastopol, CA: O’Reilly UK Ltd.
  • VanderPlas, Jake (2016): Python Data Science Handbook: Essential Tools for working with Data. Sebastopol, CA: O’Reilly UK Ltd.
  • Géron, Aurélien (2019): Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2nd ed. O’Reilly UK Ltd.
  • McKinney, Wes (2017): Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. 2nd edition. Sebastopol, California: O’Reilly UK Ltd.
  • Provost, Foster; Fawcett, Tom (2013): Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly and Associates.

Art der Vermittlung

Präsenzveranstaltung. Die Studierenden werden vor Beginn der Lehrveranstaltung über die Anwesenheitsvorgaben der Lehrbeauftragten informiert.