Datenintegration am Beispiel der Bioinformatik
Prof. Ulf Leser
Inhalt Ziel Anrechenbarkeit Teilnehmerzahl Termin Ort Teilnahmevoraussetzungen Scheinvoraussetzungen Kontakt Themen & Termine Literatur Verwandte Veranstaltungen
Inhalt
Die Integration von Daten über verschiedene Datenquellen, Organisationen oder Applikationen hinweg ist eines der Top-Themen der Informatik. Seine schon immer große Bedeutung hat mit der weltweiten Verfügbarkeit von Daten über das Internet und der zunehmenden Vernetzung von Organisationen und Firmen in einer globalisierten Welt noch weiter an Bedeutung gewonnen. Aus einer technischen Perspektive stehen aktuelle Trends der Softwareindustrie wie Enterprise Application Integration (EAI) oder Customer Relationship Management (CRM) in erster Linie für Wege, mit Integrationsproblemen umzugehen. Das Seminar bietet eine Übersicht über Lösungsansätze für die vielfältigen Fragestellungen der Datenintegration, wie z.B. Data Warehouses, förderierte Datenbanken, Datenbankmiddleware, Verwendung von Ontologien, Standardisierungsbestrebungen (XML), etc.
Um den Praxisbezug zu vergrößern, werden konkrete Systeme oder Prototypen aus einem Bereich behandelt, der besonders von Datenintegration abhängt: die Bioinformatik. Die Erfolge der molekularbiologischen Forschung über die letzten Jahre haben sich unter anderem in der Verfügbarkeit einer unübersehbaren Zahl von verschiedenen Datenbanken und -sammlungen niedergeschlagen. Viele Fragen eines Molekularbiologen lassen sich aber nicht durch Anfragen an eine einzelne Datenbanken beantworten, sondern verlangen die Kombination von Daten aus mehreren Quellen - was heutzutage praktisch immer in Handarbeit endet.
Das Seminar verlangt keine Vorkenntnisse in Bioinformatik.
Ziel
Ziel des Seminars ist es, einen Überblick über die Möglichkeiten zur Integration, die Schwierigkeiten bei der Integration und die besonderen Anforderungen der Bioinformatik an die Integration von Daten zu gewinnen. Des weiteren soll vermittelt werden, in wie weit bestehende Systeme die Anforderungen aus der molekularbiologischen Forschung abdecken - und abdecken können.
Anrechenbarkeit
Seminar, 2 SWS
Praktische Informatik
Teilnehmerzahl
Maximal 24.
Sollten sich weniger als 8 Studenten anmelden, wird das Seminar voraussichtlich als Blockseminar am Semesterende gehalten. Der Termin wird dann noch festgelegt.
Sollten sich mehr als 24 Studenten anmelden, wird unter den am ersten Termin erschienen Studenten gelost. Per eMail angemeldete Studenten (siehe unten) werden nach der Reihenfolge der Anmeldung akzeptiert.
Termin
Mittwochs, 15.00 - 17.00 Uhr
Erster Termin ist der 16.10.2002
Die Themenvergabe erfolgt am ersten oder zweiten Termin.
Ort
RUD 25, 4.111
Anmeldung
Per eMail an: leser@ informatik.hu-berlin.de
Sollten weniger als 20 Anmeldungen vorliegen, ist eine Anmeldung noch bis zum 30.10.2002 möglich.
Voraussetzungen für die Teilnahme
- Abgeschlossenes Grundstudium
- Kenntnisse in Datenbanken
- Kenntnisse in verteilten Informationsystemen (Internet, WWW, etc.)
- Lesen englischer Texte
- Grundkenntnisse in Bioinformatik sind günstig, aber nicht zwingend erforderlich
Voraussetzungen für den Scheinerwerb
- Ca. 45min Vortrag über das abgesprochene Thema (Folien müssen eine Woche vor dem Vortragstermin dem Dozenten vorgelegt und mit ihm abgesprochen werden. Ausnahme: Erster Vortrag)
- Erstellung einer Seminararbeit im Umfang von 10-20 Seiten (Fertigstellung spätestens zwei Wochen nach Vortrag. Ausnahme: Letzter Vortrag)
- Regelmäßige Teilnahme
Kontakt
Ulf Leser
Gebäude IV, Raum 104
Tel: 2093 3902
EMail: leser@informatik.hu-berlin.de
Sprechstunde: Nach Vereinbarung, vorzugsweise Dienstag oder Mittwoch.
Zusammenhang zu anderen Lehrveranstaltungen
- VL "Methoden der Integration heterogener Datenbestände" (Eckstein)
- Diese Vorlesung beschäftigt sich mit den Grundlagen der Informationsintegration. Schwerpunkte sind allgemeine Integrationsarchitekturen, Schemaintegration, die verschiedenen Arten von Heterogenität, semantische Integretät in föderierten Datenbanken, etc. Das Seminar "Datenintegration" zielt wesentlich stärker auf existierende Systeme zur Datenintegration, betont die Anfragebearbeitung im Unterschied zur Schemaintegration und geht auf konkrete Probleme in einer speziellen Domäne ein (Bioinformatik).
- VL "Bioinformatik" (Freytag)
- Diese Vorlesung behandelt die Bioinformatik als Ganzes - Datenbanken, Algorithmen, Verfahren, etc.. Die spezielle Fragestellung der Integration molekularbiologischer Datenbanken wird nur kurz behandelt.
- SE "Webgestützte Systeme in der Bioinformatik" (Freytag)
- Entfällt.
- VL "Spezielle Algorithmen in der Bioinformatik" (Gröpl)
- Diese Vorlesung behandelt Algorithmen, die zur Analyse molekularbiologischen Daten verwendet werden. Das Seminar "Datenintegration" behandelt dagegen die notwendigen Schritte, um solche Daten zu verwalten und zu finden.