Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Forschungsseminar SoSe04

Forschungsseminar
"Neue Entwicklungen in der Bioinformatik und Informationsintegration"

- Freitag, 28. Mai 2004, 11.15 Uhr. RUD 25, Raum IV.111 -


Techniken des Data Merging in Integrationssystemen

Jens Bleiholder
Arbeitsgruppe Informationsintegration, HU Berlin

Im Rahmen des HumMer-Systems zur Integration heterogener Informationsquellen wird semantische Heterogenität auf Datenebene betrachtet. Unterschiedliche Informationsquellen können sowohl sich ergänzende als auch widersprüchliche Daten über gleiche Objekte enthalten. Wie solche Konflikte in Daten automatisch und sinnvoll aufgelöst werden können, ist eine noch nicht zufriedenstellend beantwortete Fragestellung. Der Beitrag gibt einen Überblick über bereits existierende Verfahren des data merging, wie sie in ausgewählten integrierenden Informationssystemen (z.B. TSIMMIS) angewandt werden. Desweiteren werden Techniken zur Integration genannt, die auf relationaler Algebra basieren. Zuletzt wird die Architektur des integrierenden Informationssystems HumMer (Humboldt Merger) vorgestellt. Dabei wird auf den Entwurf und die Realisierung der Data Merging Komponente näher eingegangen.