Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Masterseminar: Algorithmen und Methoden der Zeitreihenanalyse - Detailseite

Dr. Patrick Schäfer

Die Erde wird in periodischen Abständen von Satelliten beobachtet, die hochaufgelöste Bildern in mehreren Spektren (Infra-Rot, Ultra Violett, sichtbares Licht) aufnehmen. Diese Bilder können unter anderem zur Landnutzungsklassifikation eingesetzt werden, bei der einzelnen Pixeln (automatisiert) eine Klasse zugeordnet wird, um Trends wie Urbanisierung, Entwaldung oder Wüstenbildung frühzeitig zu erkennen. Für die Lösung dieses Problems existiert eine Vielzahl verschiedener Ansätze. In diesem Seminar werden Gruppen von Studierenden jeweils einen Ansatz in Vortrag und Ausarbeitung darstellen, sowie ihn auf eine Menge vorgegebener Klassifizierungsprobleme auf echten Satellitenbildern anwenden. Der Schwerpunkt liegt auf zeitreihenbasierten Verfahren und Maschinellen Lernmethoden. Das Seminar hat das übergeordnete Ziel, die Eigenheiten der verschiedenen Verfahren kennenzulernen und vergleichen zu können.

Wettbeweb

Grundlage des Seminars ist ein Wettbewerb. Ihr werdet einen Datensatz mit  Satellitendaten erhalten. Gruppen von Studierenden werden jeweils ihre Lösungen in Vortrag und Ausarbeitung darstellen, sowie diesen auf dem Datensatz anwenden.

Der Wettbewerb findet in zwei Phasen statt:

  • Phase 1 bis 30. November: Ihr erhaltet eine Teilmenge der Satellitendaten. Die Zwischenpräsentation eurer Lösung findet im Dezember (siehe unten) statt.
  • Phase 2 bis 31. Januar: Ihr erhaltet den kompletten Datensatz. Die finale Präsentation eurer Lösung findet im Februar (siehe unten) statt.

In Phase 1 sollt ihr eine vorab gewähltes Zeitreihen-Klassifikationsverfahren evaluieren und eure Lösungen, sowie deren wissenschaftlichen Ansatz, vorstellen. Diese Lösungen werden allen Teilnehmern zur Verfügung gestellt.

In Phase 2 könnt ihr aus allen vorhandenen Lösungen die vielversprechendste oder eure eigene weiterentwickelt. Eure finale Lösung, und deren wissenschaftlicher Ansatz, wird im Juli vorgestellt.

Es wird die Möglichkeit bestehen, aufbauend auf dem Seminar, eine Abschlussarbeit an unserem Lehrstuhl zu dem Thema zu bearbeiten.

Termine

Das Seminar findet im wesentlichen als Blockseminar statt. Vorab gibt es einen Einführungstermin. Für die Themen werden Teams von zwei Studierenden gebildet. Am Freitag, den 28.10.2022 findet die Einführungsveranstaltung in RUD 26 1.305  13-15 Uhr statt, die für alle Teilnehmenden verpflichtend ist. Dort wird der Seminarablauf erläutert und die Themen vergeben.

  • Einführungsveranstaltung: Freitag, 28.10.2022, 13-15 Uhr, ESZ Raum 1'305
  • Zwischenpräsentation: Freitag, 09. oder 16. Dezember, ab 10 Uhr
  • Abschlusspräsentation: Freitag, 03. oder 10. Februar, ab 10 Uhr

Einführende Literatur

  • Gómez, Cristina, Joanne C. White, and Michael A. Wulder. "Optical remotely sensed time series data for land cover classification: A review." ISPRS Journal of Photogrammetry and Remote Sensing 116 (2016): 55-72. PAPER
  • Bagnall, Anthony, et al. "The great time series classification bake off: a review and experimental evaluation of recent algorithmic advances." Data Mining and Knowledge Discovery 31.3 (2017): 606-660. Paper
  • Fawaz, Hassan Ismail, et al. "Deep learning for time series classification: a review." arXiv preprint arXiv:1809.04356 (2018). Paper
  • TiSeLaC: Time Series Land Cover Classification Challenge
  • AALTD'16 Challenge on multivariate time series data
  • https://scholar.google.de for searching scientific papers
  • https://sktime.org a Python library dedicated to time series (classifiers)
  • http://timeseriesclassification.com a website dedicated to univariate time series classifiers

Voraussetzungen

  • Gute Kenntnisse in Algorithmen und Datenstrukturen (z.B. gleichnamige Vorlesung)
  • Kenntnisse in Statistik und/oder Machine Learning (oder die Bereitschaft sich einzuarbeiten)

Anmeldung

Die Teilnehmerzahl ist begrenzt, die Anmeldung erfolgt über AGNES.

Anforderungen

Im Oktober gibt es 1 Vorlesung zu einführenden Themen (Time Series; Deep Learning; Land Cover Classification; Scientific writing/presentations).

  • Jede Gruppe muss am Ende von Phase 1 einen ca. 5-15 minütigen Vortrag über ihre Lösung halten
  • Jede Gruppe muss am Ende von Phase 2 einen ca. 15-30 minütigen Vortrag über ihre Lösung halten.
  • Vorher finden Treffen mit dem/der Betreuer(in) statt, zur Vorbesprechung des Themas und zur Besprechung der Folien.
  • Abschließend muss zu jedem Thema eine ca. 20 seitige Seminararbeit verfasst werden.

Schein und Anrechenbarkeit

Das Seminar ist anrechenbar für

  • Diplom Informatik
  • Master Informatik
  • Master Wirtschaftsinformatik

Voraussetzungen für den Schein sind:

  • der Besuch der Einführungsveranstaltungen zur Themenvergabe,
  • die regelmäßige Kommunikation mit dem Betreuer,
  • eine Kurzpräsentation des Themas (etwa in der Mitte des Semesters),
  • das Halten eines wissenschaftlichen Vortrags im Blockseminar am Ende des Semesters,
  • die Teilnahme am Wettbewerb inkl. Präsentation der Ergebnisse, und
  • das Erstellen einer schriftlichen Ausarbeitung (Seminararbeit).

Vorlagen