Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Institut für Informatik

Verteidigung Masterarbeit Robea Araujo von Borries

  • Wann 12.12.2017 von 11:00 bis 12:30
  • Wo Rudower Chaussee 25, Haus IV, Raum 210
  • iCal

Frau Robea Araujo von Borries verteidigt ihre Masterarbeit mit dem Titel "Erweiterung des Kostenschätzers von Apache Flink um die Berechnung der Laufzeit von Anfragen"


 

Abstract:

Im Rahmen von Geofernerkundungsprojekten werden seit über 40 Jahren kontinuierlich Satellitendaten zur Beobachtung der Erdoberfläche gesammelt. GeoMultiSens (GMS) ist ein Forschungsprojekt, das die Herausforderungen bei der effizienten Verarbeitung massiver Fernerkundungsdaten adressiert. Das Ziel des Projekts ist es, die Daten verschiedener Satellitensysteme zu homogenisieren und mithilfe von Algorithmen der Geoinformatik zu analysieren. Für die effiziente Verarbeitung von Satellitenaufnahmen im Petabyte-Bereich dient Apache Flink als verteiltes Datenverarbeitungssystem. Dazu werden die Algorithmen zur Analyse der Fernerkundungsdaten in parallele Datenflussprogramme überführt.
Das Ziel der Masterarbeit war es, ein theoretisches Modell für die Vorhersage der Laufzeit einer Analyseanfrage zu entwickeln. Der Rahmen ist auf eine GMS Analyse beschränkt, die eine Klassifizierung der Satellitenaufnahmen für die Landnutzungsanalyse vornimmt. Der Prozess der Anfrageoptimierung, insbesondere der Kostenschätzer in Flink wurde um die Berechnung der voraussichtlichen Laufzeit erweitert. Das Kostenmodell in Flink basiert auf drei Kostenmaßen: die Anzahl der Festplatten- und Netzwerkzugriffe, sowie die CPU Auslastung. Anhand dieser Kostenmaße und den Eigenschaften der Ausführungsumgebung wird für die GMS Anfrage die voraussichtliche Laufzeit geschätzt.

 

Interessenten sind herzlich eingeladen.