Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Data Science mit Python

Dozent: Dr. Patrick Schäfer

Diese Vorlesung gibt eine Einführung in den Bereich der Data Science, also der Extraktion von Wissen aus strukturierten oder unstrukturierten Daten. Der Kurs thematisiert dabei die typischen Aspekte des Data-Science-Projektzyklus wie Data Mining, Vorverarbeitung, Erzeugung von (statistischen) Merkmalen, explorative Datenanalyse, und maschinelles Lernen.

In der begleitenden Übun­g werden praktische Erfahrungen mit Fallstudien unter Verwendung von Standardbibliotheken im Python-Ökosystem wie Pandas, NumPy, Seaborn, Matplotlib oder Scikit-Learn gesammelt.

Termin

Für die Teilnahme an der Vorlesung müssen sie sich für den Kurs über Agnes anmelden. Das Moodle Passwort wird dann über Agnes kommuniziert.

Die Einführungsveranstaltung findet am Freitag, den 24.10.25, statt.

Freitag 11:00 - 13:00 RUD 25, 3.001

Voraussetzungen

Rudimentäre Programmierkenntnisse in einer beliebigen Sprache werden vorausgesetzt. Kenntnisse in Python sind von Vorteil. Eine Kurzeinführung in Python wird vorlesungsbegleitend gegeben. 

Prüfungen und Anrechenbarkeit

Die Vorlesung wird mit einer Klausur abgeschlossen.

Das Modul ist anrechenbar für

  • Monobachelor Informatik, 5 SP
  • Kombinationsbachelor, 5 SP
  • INFORMIT, 5 SP

Literatur und weiterführende Links

  • Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython by Wes McKinney (Kostenfrei über die HU-Bibliothek als Download)
  • Data Science from Scratch - First Principles with Python by Joel Grus (Kostenfrei über die HU-Bibliothek als Download)
  • Schnellstart Python Ein Einstieg ins Programmieren für MINT-Studierende (Kostenfrei über die HU-Bibliothek als Download)

    Themen und Folien

    Folien sind in Moodle jeweils spätestens nach der Vorlesung als PDF verfügbar. Änderungen möglich. All slides are English, but the course will be held in German.