Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Semesterprojekt: Entwicklung einer semantischen Suchmaschine für klinische Studien

Mario Sänger

Klinische Studien bilden die Voraussetzung für die behördliche Zulassung von Medikamenten, Impfstoffen und anderer medizinischer Interventionsformen. Die Studien werden in der Regel von den Zulassungsbehörden in Registern erfasst und allgemeine Informationen (bspw. Welche Erkrankung und welches Medikament wird untersucht?) für die Öffentlichkeit zugänglich gemacht. Wesentliche Teile dieser Informationen liegen jedoch nur in textueller, nicht-strukturierter Form vor, wodurch ein effizienter Zugriff erschwert wird.

In diesem Semesterprojekt soll mittels agiler Softwareentwicklungsmethoden ein Prototyp für eine semantische Suchmaschine für klinische Studien entwickelt werden. Dieser Prototyp soll es medizinischen Expert*innen erlauben, Studien anhand bestimmter Erkrankungen, Medikamente, genetischer Veränderungen und anderer biomedizinischer Konzepte zu finden. Ferner sollen die gefundenen Studien in geeigneter Weise visualisiert werden. Im Rahmen des Projekts werden Methoden des Maschinellen Lernens und Text Minings (z.B. `Information Retrieval´, `Named-entity Recognition´ bzw. `Relation Extraction´) auf dem neuesten Stand der Wissenschaft und Technik benutzt.

Die Bewerbung für den Kurs erfolgt über Agnes. Agnes vergibt die begrenzten Plätze für das Semesterprojekt automatisch.

Der Einführungstermin findet am Donnerstag, den 21. Oktober 2021 von 13:00 bis 17:00 Uhr in RUD 25, 4.112, statt. Hier wir das Semesterprojekt vorgestellt und eine Einführung in den Themenbereich des Semesterprojekts gegeben. Im Anschluss werden (Scrum) Teams von Studierenden gebildet. Für die Teilnahme am Kurs ist die vollständige Anwesenheit an diesem ersten Termin erforderlich.

Voraussetzungen

Voraussetzung für den Besuch sind gute Programmierkenntnisse in einer Hochsprache (Python, Java, C++). Interesse an der automatischen Textverarbeitung und biomedizinischen Fragestellungen.