Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Übung zu Text Analytics

Philippe Thomas

Veranstaltung

Diese Übung begleitet die Vorlesung Text Analytics

Erster Übungstermin ist der 19.10.2012. Dieser Termin ist Pflicht für alle Teilnehmer. Unentschuldigtes Nichterscheinen hat den Ausschluss von der Übung zur Folge.

Ablauf

In der Übung werden verschiedene Aufgaben im Bereich des Information Retrieval bzw. des Text Minings zu lösen sein. Dazu werden wir oftmals öffentlich verfügbare Tools (UIMA, OpenNLP etc.) benutzten und auf verschiedenen, teilweise recht großen Textsammlungen (Medline, Genia etc.) arbeiten. Die Arbeit erfolgt in Gruppen a zwei Studierenden. Jede Gruppe muss alle Aufgaben erfolgreich bearbeitet haben (> 50% aller Punkte). Die Aufgaben werden an einem Übungstermin ausgegeben, und die Lösungen müssen meist zwei Wochen später von einem der Gruppenmitglieder im Rahmen eines kurzen Vortrags dargestellt werden. In dem Vortrag geht es vor allem darum, gesammelte Erfahrungen an die gesamte Zuhörerschaft zu kommunizieren.

Wettbewerb (freiwillig)

Die Übung wird auch als Wettbewerb gestaltet. Das heißt, dass manche der Aufgaben verschieden gut gelöst werden können (schnellere Implementierung, bessere Qualität des Mining etc.). Die drei besten Gruppen erhalten Punkte, und am Ende wird ein Gesamtsieger gekürt. Die Teilnahme an dem Wettbewerb ist freiwillig.

Die einzelnen Aufgaben und Termine

Diese Liste wird ständig aktualisiert. Folien zu den Aufgaben und notwendige Daten werden hier veröffentlicht.