Data Science
Studiengang | Nachhaltige Energiesysteme |
Fachbereich | Technik |
Studiengangsart | Master Berufsbegleitend Sommersemester 2023 |
Titel der Lehrveranstaltung / des Moduls | Data Science |
Kennzahl der Lehrveranstaltung / des Moduls | 072722020301 |
Unterrichtssprache | Deutsch |
Art der Lehrveranstaltung (Pflichtfach, Wahlfach) | Pflichtfach |
Semesterwochenstunden | 2 |
Studienjahr | 2023 |
Niveau der Lehrveranstaltung / des Moduls laut Lehrplan | |
Anzahl der zugewiesenen ECTS-Credits | 3 |
Name des/der Vortragenden | Elias EDER, Nico MANGENG, Klaus RHEINBERGER |
Keine
Die Lehrveranstaltung vermittelt die klassichen Tools der Datenanalyse. Es werden die statistischen und methodischen Grundlagen erläutert, sowie die Tools in einer Programmierumgebung an Beispielen angewandt.
- Datenstrukturen: Samples, Features, Target
- Statistische Grundlagen: (Co-)Varianz, Korrelation, statistischer Zusammenhang vs. Kausalität
- Cross Validation: Lern- und Testdatensätze, Fit und Prognose
- Supervised Learning: Regression vs. Klassifikation, k-Nearest Neighbors, Lineare und Logistische Regression, Linear Support Vector Machines, (Ensembles von) Decision Trees
- Unsupervised Learning: Clustering, Scaling
- Tools: Datentransformationen, Dummies, Feature Selection, Regularisierung, Grid Search
Die Studierenden erwerben grundlegende Kenntnisse und Anwendungskompetenz in den klassischen Tools der Datenanalyse. Die Studierenden
- können zwischen statistischem Zusammenhang und Kausalität unterscheiden.
- sind in der Lage Zusammenhänge in Daten zu finden, grafisch darzustellen, quantitativ zu bewerten. Sie können Fits und Prognosen auf Basis verschiedener Modelle erstellen.
- verstehen die lineare Regression und sind fähig mehrdimensionale Regressionen durchzuführen und die Ergebnisse korrekt zu interpretieren.
- verstehen weitere klassische Tools wie k-Nearest Neighbors, Clustering und Decision Trees. Sie können diese anwenden und deren Ergebnisse interpretieren.
- können mittels Cross Validation die Güte und Robustheit ihrer Modellaussagen bewerten.
- Vorlesungen
- Programmierübungen, Programmierprojekte
- Coaching
- Abgabe bzw. Präsentation des Programmierprojekts (30%)
- Mündliche Abschlussprüfung und Projekt (70%)
Für eine positive Gesamtnote müssen in jedem Prüfungsteil mindestens 50% der Punkte erzielt werden.
Keiner
- Guido, Sarah; Müller, Andreas C. (2016): Introduction to Machine Learning with Python: A Guide for Data Scientists. Sebastopol, CA: O’Reilly UK Ltd.
- VanderPlas, Jake (2016): Python Data Science Handbook: Essential Tools for working with Data. Sebastopol, CA: O’Reilly UK Ltd.
- Géron, Aurélien (2019): Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2nd ed. O’Reilly UK Ltd.
- McKinney, Wes (2017): Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. 2nd edition. Sebastopol, California: O’Reilly UK Ltd.
- Provost, Foster; Fawcett, Tom (2013): Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly and Associates.
Präsenzveranstaltung. Die Studierenden werden vor Beginn der Lehrveranstaltung über die Anwesenheitsvorgaben der Lehrbeauftragten informiert.