Arbeitsgruppe Informationsintegration

Informationsintegration (Halbkurs im WS 04/05)

Felix Naumann

Vorlesung
Dienstags 9-11 in RUD 26, Raum 1.303 (Beginn 9:30 Uhr)
Donnerstags 9-11 in RUD 26, Raum 1.303 (Beginn 9:30 Uhr)

Praktikum
Donnerstags 11-13 in RUD 26, Raum 1.303

Inhalt:
Informationsintegration ist das Verschmelzen heterogener Informationen verschiedener Quellen zu einem homogenen Gesamtbild. Diese Vorlesung ist eine Einführung in dieses hochaktuelle Thema. Neben den Grundlagen der Informationsintegration, z.B. verteilten Datenbankarchitekturen und integrierende Anfragesprachen, lernen Sie Techniken der materialisierten und virtuellen Integration und deren Optimierung kennen. Darüber hinaus werden Spezialthemen, etwa Anfragebearbeitung, Ontologien, das Verborgene Web und Methoden des Data Cleansing, behandelt.
Im zugehörigen Praktikum werden Sie die Probleme der Integration heterogener Systeme gleichsam am eigenen Leib erfahren, indem Sie in Gruppenarbeit heterogene Schemata zusammenführen und mit anderen Gruppen kooperieren bzw. konkurrieren.

Voraussetzungen zur Teilnahme:


Termin


Thema

Folien

Stud. Aus-
arbeitungen

DI
19.10.2004
01. Einführung in die Informationsintegration
pdf

DO
21.10.2004
02. Szenarien der Informationsintegration
pdf

DI
26.10.2004
03. Verteilung und Autonomie
pdf

DO
28.10.2004
04. Heterogenität
pdf v2

DI
02.11.2004
05. Materialisierte und virtuelle Integration pdf

DO
04.11.2004
06. Klassifikation integrierter Informationssysteme und 5-Schichten Architektur pdf

DI
09.11.2004 07. Global-as-View und Lokal-as-View Modellierung pdf

DO
11.11.2004 08. Global-as-View Anfragebearbeitung pdf

DI
16.11.2004 09. Verteilte Datenbanken und Multidatenbanksysteme
(17.11. Abgabe: Schemaintegration)
keine
Folien

DO
18.11.2004 10. SchemaSQL
pdf
Folien & Text
DI
23.11.2004 11. Verteilte Anfragebearbeitung pdf v2

DO
25.11.2004 12. Dynamische Programmierung in verteilten Datenbanken
pdf
Folien & Text
DI
30.11.2004 13. Top-N Anfragen
(1.12. Abgabe: JSP Seiten)
pdf v2

DO
02.12.2004 14. Top-N Anfragen
s.o.
Folien & Text
DI
07.12.2004 15. Mediator/Wrapper-Architektur
(8.12. Abgabe: Anfrageoptimierung)
pdf (1.7MB)

DO
09.12.2004 16. Peer-Data-Management Systeme (PDMS) s.o.

DI
14.12.2004 17. Informationsqualität
pdf
DO
16.12.2004 18. ETL & Data Lineage
(17.12. Abgabe: Web-Shop)
s.u.

Weihnachtsferien
DI
04.01.2005 19. Datenfusion - Union & Co.
pdf
Folien & Text
DO
06.01.2005 20. Duplikaterkennung pdf

DI
11.01.2005 21. ETL & Data Lineage
(12.1. Abgabe: Duplikaterkennung)
pdf v4 Folien & Text
DO
13.01.2005      Fortsetzung Data Lineage

DI
18.01.2005 22. Containment & Local-as-View Anfragebearbeitung pdf
DO
20.01.2005 23. Bucket Algorithmus pdf v2

DI
25.01.2005 24. Schema Mapping
(26.1. Abgabe: Web Services)
pdf v2

DO
27.01.2005 25. Schema Mapping s.o.

DI
01.02.2005 26. Schema Matching pdf v2 Folien & Text
DO
03.02.2005 27. Hidden Web
pdf (1,3MB)
Folien & Text
DI
08.02.2005      Fortsetzung Hidden Web
(9.2. Abgabe: Web Service Interaktion)
s.o.

DO
10.02.2005 28. Semantic Web

pdf (2,6MB)
Kurzfassung
Folien & Text


29. Data Streams (fällt aus) pdf Folien & Text
DI
15.02.2005 30. Forschungsprojekte  - TSIMMIS, Garlic, Revere, etc.
(16.2. Abgabe: Stable Marriage)
pdf (1.3MB)
Folien & Text
DO
17.02.2005 31. Abschlußvorlesung mit Vorträgen der Studierenden




Einführende Literatur:

Leider gibt es kein einheitliches Lehrbuch.

Ausführliche Literaturliste

Wichtig: Es werden nur jeweils Ausschnitte der jeweiligen Artikel in der Vorlesung angesprochen.