Beschreibung einzelner Lerneinheiten (ECTS-Lehrveranstaltungsbeschreibungen) pro Semester

Data Science

Studiengang Nachhaltige Energiesysteme
Fachbereich Technik
Studiengangsart Master
Berufsbegleitend
Sommersemester 2023
Titel der Lehrveranstaltung / des Moduls Data Science
Kennzahl der Lehrveranstaltung / des Moduls 072722020301
Unterrichtssprache Deutsch
Art der Lehrveranstaltung (Pflichtfach, Wahlfach) Pflichtfach
Semesterwochenstunden 2
Studienjahr 2023
Niveau der Lehrveranstaltung / des Moduls laut Lehrplan
Anzahl der zugewiesenen ECTS-Credits 3
Name des/der Vortragenden Elias EDER, Nico MANGENG, Klaus RHEINBERGER
Voraussetzungen und Begleitbedingungen

Keine

Lehrinhalte

Die Lehrveranstaltung vermittelt die klassichen Tools der Datenanalyse. Es werden die statistischen und methodischen Grundlagen erläutert, sowie die Tools in einer Programmierumgebung an Beispielen angewandt.

  • Datenstrukturen: Samples, Features, Target
  • Statistische Grundlagen: (Co-)Varianz, Korrelation, statistischer Zusammenhang vs. Kausalität
  • Cross Validation: Lern- und Testdatensätze, Fit und Prognose
  • Supervised Learning: Regression vs. Klassifikation, k-Nearest Neighbors, Lineare und Logistische Regression, Linear Support Vector Machines, (Ensembles von) Decision Trees
  • Unsupervised Learning: Clustering, Scaling
  • Tools: Datentransformationen, Dummies, Feature Selection, Regularisierung, Grid Search
Lernergebnisse

Die Studierenden erwerben grundlegende Kenntnisse und Anwendungskompetenz in den klassischen Tools der Datenanalyse. Die Studierenden

  • können zwischen statistischem Zusammenhang und Kausalität unterscheiden.
  • sind in der Lage Zusammenhänge in Daten zu finden, grafisch darzustellen, quantitativ zu bewerten. Sie können Fits und Prognosen auf Basis verschiedener Modelle erstellen.
  • verstehen die lineare Regression und sind fähig mehrdimensionale Regressionen durchzuführen und die Ergebnisse korrekt zu interpretieren.
  • verstehen weitere klassische Tools wie k-Nearest Neighbors, Clustering und Decision Trees. Sie können diese anwenden und deren Ergebnisse interpretieren.
  • können mittels Cross Validation die Güte und Robustheit ihrer Modellaussagen bewerten.
Geplante Lernaktivitäten und Lehrmethoden
  • Vorlesungen
  • Programmierübungen, Programmierprojekte
  • Coaching
Prüfungsmethode und Beurteilungskriterien
  • Abgabe bzw. Präsentation des Programmierprojekts (30%)
  • Mündliche Abschlussprüfung und Projekt (70%)

Für eine positive Gesamtnote müssen in jedem Prüfungsteil mindestens 50% der Punkte erzielt werden.

Kommentar

Keiner

Empfohlene Fachliteratur und andere Lernressourcen
  • Guido, Sarah; Müller, Andreas C. (2016): Introduction to Machine Learning with Python: A Guide for Data Scientists. Sebastopol, CA: O’Reilly UK Ltd.
  • VanderPlas, Jake (2016): Python Data Science Handbook: Essential Tools for working with Data. Sebastopol, CA: O’Reilly UK Ltd.
  • Géron, Aurélien (2019): Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2nd ed. O’Reilly UK Ltd.
  • McKinney, Wes (2017): Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. 2nd edition. Sebastopol, California: O’Reilly UK Ltd.
  • Provost, Foster; Fawcett, Tom (2013): Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly and Associates.
Art der Vermittlung (Präsenzveranstaltungen, Fernstudium usw.)

Präsenzveranstaltung. Die Studierenden werden vor Beginn der Lehrveranstaltung über die Anwesenheitsvorgaben der Lehrbeauftragten informiert.