Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Forschungsseminar

Arbeitsgruppe Wissensmanagement in der Bioinformatik

Neue Entwicklungen im Datenbankbereich und in der Bioinformatik

Prof. Ulf Leser

  • wann/wo? siehe Vortragsliste

Dieses Seminar wird von den Mitgliedern der Arbeitsgruppe als Forum der Diskussion und des Austauschs genutzt. Studierende und Gäste sind herzlich eingeladen.

Folgende Vorträge sind bisher vorgesehen:

 

Termin & Ort Thema Vortragende(r)
Friday, 14.10.21, 14 pm (online) Anwendung von Ensembles auf die Zeitreihenklassifikatoren WEASEL und BOSS Florian Heinrichs
Friday, 14.01.22, 9 am s.t. (online) Analyse von Zeitreihen Klassifikatoren mit timeXplain Birk Leppich

 

Zusammenfassungen

Anwendung von Ensembles auf die Zeitreihenklassifikatoren WEASEL und BOSS (Florian Heinrichs)

Einer von vielen Aspekten der Zeitreihen-Analyse ist die Klassifikation, durch die wichtige Erkenntnisse gewonnen werden können. Man kann Klassifikations-Algorithmen nach der verwendeten Repräsentation von Zeitreihen unterscheiden. BOSS und WEASEL sind sogenannte Wörterbuch-Klassifikatoren. Sie repräsentieren Zeitreihen als Histogramme von Wörtern und treffen ihre Vorhersagen anhand dieser Histogramme. Das Ziel der Bachelorarbeit war es, den Einfluss von Ensemble-Methoden auf BOSS und WEASEL zu untersuchen. Dafür habe ich neben der Testaccuracy auch den Bias, die Varianz und die Laufzeit beobachtet. Ich habe mehrere einzelne Instanzen des BOSS- oder WEASEL-Modells mit zufälligen Parametern trainiert und diese in einem Ensemble verknüpft. Die verwendeten Methoden sind Bagging, Boosting und Stacking. Zusätzlich habe ich die Idee des Proximity Forest mit dem Ansatz von BOSS kombiniert. Jedoch konnte nur Bagging auf BOSS eine geringe Verbesserung der Genauigkeit erzielen. Alle anderen Variationen von Modell und Ensemble erreichten schlechtere Ergebnisse als das entsprechende Ausgangsmodell.

Analyse von Zeitreihen Klassifikatoren mit timeXplain (Birk Leppich)

In der Zeitreihen-Klassifikation existieren eine große Anzahl an verschiedenen Ans ̈atzen, dessen moderne Verfahren erstaunlich genaue Vorhersagen auf verschiedenste Datensätze berechnen. Modell-unabhängige Erklärverfahren wie SHAP versuchen die Ergebnisse der mitunter als Black-Box betrachteten Modelle zu erklären und darzustellen. TimeXplain basiert auf diesem Ansatz und ist in der Lage für Zeitreihenmodelle Erklärungen der Vorhersage zu berechnen und diese visuell darzustellen. In einer Studie, welche acht dokumentierte Datensätze verwendet, wird untersucht wie akkurat und detailliert die Aussagen von timeXplain für verschiedene Verfahren sind. Es wird eine eigene Interpretation basierend auf der vorhandenen Literatur sowie dazugehörigen Quellen für jeden Datensatz aufgestellt und mit timeXplains Erklärungen verglichen. Des Weiteren werden Lernverfahren verschiedener Ansätze untersucht, indem eine große Anzahl von errechneten Erklärungen miteinander verglichen wird. Es werden Ähnlichkeiten und Unterschieden im Bezug timeXplains Interpretation zwischen Verfahren innerhalb und außerhalb der dazugehörigen Kategorie aufgedeckt.

 

Kontakt: Patrick Schäfer; patrick.schaefer(at)hu-berlin.de