Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Datenintegration am Beispiel der Bioinformatik

Seminar, WS 2002/2003
Prof. Ulf Leser

Inhalt    Ziel    Anrechenbarkeit    Teilnehmerzahl    Termin    Ort    Teilnahmevoraussetzungen    Scheinvoraussetzungen     Kontakt    Themen & Termine    Literatur    Verwandte Veranstaltungen   

Inhalt

Die Integration von Daten über verschiedene Datenquellen, Organisationen oder Applikationen hinweg ist eines der Top-Themen der Informatik. Seine schon immer große Bedeutung hat mit der weltweiten Verfügbarkeit von Daten über das Internet und der zunehmenden Vernetzung von Organisationen und Firmen in einer globalisierten Welt noch weiter an Bedeutung gewonnen. Aus einer technischen Perspektive stehen aktuelle Trends der Softwareindustrie wie Enterprise Application Integration (EAI) oder Customer Relationship Management (CRM) in erster Linie für Wege, mit Integrationsproblemen umzugehen. Das Seminar bietet eine Übersicht über Lösungsansätze für die vielfältigen Fragestellungen der Datenintegration, wie z.B. Data Warehouses, förderierte Datenbanken, Datenbankmiddleware, Verwendung von Ontologien, Standardisierungsbestrebungen (XML), etc.

Um den Praxisbezug zu vergrößern, werden konkrete Systeme oder Prototypen aus einem Bereich behandelt, der besonders von Datenintegration abhängt: die Bioinformatik. Die Erfolge der molekularbiologischen Forschung über die letzten Jahre haben sich unter anderem in der Verfügbarkeit einer unübersehbaren Zahl von verschiedenen Datenbanken und -sammlungen niedergeschlagen. Viele Fragen eines Molekularbiologen lassen sich aber nicht durch Anfragen an eine einzelne Datenbanken beantworten, sondern verlangen die Kombination von Daten aus mehreren Quellen - was heutzutage praktisch immer in Handarbeit endet.

Das Seminar verlangt keine Vorkenntnisse in Bioinformatik.

Ziel

Ziel des Seminars ist es, einen Überblick über die Möglichkeiten zur Integration, die Schwierigkeiten bei der Integration und die besonderen Anforderungen der Bioinformatik an die Integration von Daten zu gewinnen. Des weiteren soll vermittelt werden, in wie weit bestehende Systeme die Anforderungen aus der molekularbiologischen Forschung abdecken - und abdecken können.

Anrechenbarkeit

Seminar, 2 SWS
Praktische Informatik

Teilnehmerzahl

Maximal 24.

Sollten sich weniger als 8 Studenten anmelden, wird das Seminar voraussichtlich als Blockseminar am Semesterende gehalten. Der Termin wird dann noch festgelegt.

Sollten sich mehr als 24 Studenten anmelden, wird unter den am ersten Termin erschienen Studenten gelost. Per eMail angemeldete Studenten (siehe unten) werden nach der Reihenfolge der Anmeldung akzeptiert.

Termin

Mittwochs, 15.00 - 17.00 Uhr
Erster Termin ist der 16.10.2002
Die Themenvergabe erfolgt am ersten oder zweiten Termin.

Ort

RUD 25, 4.111

Anmeldung

Per eMail an: leser@ informatik.hu-berlin.de

Sollten weniger als 20 Anmeldungen vorliegen, ist eine Anmeldung noch bis zum 30.10.2002 möglich.

Voraussetzungen für die Teilnahme

  • Abgeschlossenes Grundstudium
  • Kenntnisse in Datenbanken
  • Kenntnisse in verteilten Informationsystemen (Internet, WWW, etc.)
  • Lesen englischer Texte
  • Grundkenntnisse in Bioinformatik sind günstig, aber nicht zwingend erforderlich

Voraussetzungen für den Scheinerwerb

  • Ca. 45min Vortrag über das abgesprochene Thema (Folien müssen eine Woche vor dem Vortragstermin dem Dozenten vorgelegt und mit ihm abgesprochen werden. Ausnahme: Erster Vortrag)
  • Erstellung einer Seminararbeit im Umfang von 10-20 Seiten (Fertigstellung spätestens zwei Wochen nach Vortrag. Ausnahme: Letzter Vortrag)
  • Regelmäßige Teilnahme

Kontakt

Ulf Leser
Gebäude IV, Raum 104
Tel: 2093 3902
EMail: leser@informatik.hu-berlin.de

Sprechstunde: Nach Vereinbarung, vorzugsweise Dienstag oder Mittwoch.

Zusammenhang zu anderen Lehrveranstaltungen

VL "Methoden der Integration heterogener Datenbestände" (Eckstein)
Diese Vorlesung beschäftigt sich mit den Grundlagen der Informationsintegration. Schwerpunkte sind allgemeine Integrationsarchitekturen, Schemaintegration, die verschiedenen Arten von Heterogenität, semantische Integretät in föderierten Datenbanken, etc. Das Seminar "Datenintegration" zielt wesentlich stärker auf existierende Systeme zur Datenintegration, betont die Anfragebearbeitung im Unterschied zur Schemaintegration und geht auf konkrete Probleme in einer speziellen Domäne ein (Bioinformatik).
VL "Bioinformatik" (Freytag)
Diese Vorlesung behandelt die Bioinformatik als Ganzes - Datenbanken, Algorithmen, Verfahren, etc.. Die spezielle Fragestellung der Integration molekularbiologischer Datenbanken wird nur kurz behandelt.
SE "Webgestützte Systeme in der Bioinformatik" (Freytag)
Entfällt.
VL "Spezielle Algorithmen in der Bioinformatik" (Gröpl)
Diese Vorlesung behandelt Algorithmen, die zur Analyse molekularbiologischen Daten verwendet werden. Das Seminar "Datenintegration" behandelt dagegen die notwendigen Schritte, um solche Daten zu verwalten und zu finden.