Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Willkommen bei SOAMED

Forschungsprogramm

Das Forschungsprogramm von SOAMED fokussiert sich auch in seiner zweiten Phase auf grundlegende Probleme der Modellierung, Entwicklung, Integration, des Betriebs und der Analyse service-orientierter Softwaresysteme in medizinischen Anwendungsgebieten. Dabei schärfen wir die konkreten Forschungsfragen unter Berücksichtigung aktueller Entwicklungen, der Erfahrungen aus der ersten SOAMEDPhase und der Impulse durch die neuen Antragsteller/-innen. Dies betrifft insbesondere die im Folgenden angeführten drei Punkte.

Kontroll- versus Datenfluss

In den letzten Jahren ist das enorme Wachstum typischer Datenmengen, die für Analysezwecke genutzt werden, in den Fokus sowohl von Forschern als auch von kommerziellen und öffentlichen Organisationen getreten. Immer stärker zeichnen sich die weitreichenden Möglichkeiten ab, durch systematische, intelligente, zeitnahe und flexible Analyse sehr großer Datenmengen wissenschaftlich wertvolle Ergebnisse abzuleiten [HTT09]. Dieser Trend, plakativ unter Stichwörtern wie „Big Data“ oder „Data driven science“ zusammengefasst, kann nicht, wie in der Presse oft getan, auf kommerzielle Anwendungen im Umfeld des Web beschränkt werden (Google, Facebook, Twitter etc.); stattdessen bilden heute Verfahren, die große, heterogene, und sich dynamisch verändernde Datenmengen skalierbar analysieren können, einen fächerübergreifenden Forschungsschwerpunkt (siehe z.B. aktuelle BMBF-Ausschreibungen zu Big Data). Auch in der Medizin gibt es vielfältige Anwendungen, von der Genomforschung über translationale Themen bis zur Krankheitsprävention [Mar13]

Diese Entwicklung reflektiert das Forschungsprogramm von SOAMED-2 in vielfältiger Weise. Zum einen werden die bisherigen Forschungsbereiche um den Bereich „Datenanalyseprozesse“ erweitert. Zum anderen spielen Fragen der Datenanalyse, inklusive der dazu notwendigen Modellierung, Integration, Schutz etc., auch in den vier anderen Bereichen eine wichtigere Rolle. Während sich SOAMED-1 auf Prozessintegration konzentriert hat, adressieren wir in der zweiten Phase verstärkt auch Probleme der Daten- und Informationsintegration. Zudem wird der Bereich der Modellierung von Services, der bisher stark auf Synchronisationsprobleme zugeschnitten war, um Fragen der (semantischen) Datenmodellierung erweitert. Wir tragen dieser Entwicklung insbesondere auch Rechnung durch die Aufnahme von Prof. Kao, einem Experten für verteilte Computer- und Softwarearchitekturen, von Prof. Giese, dessen Forschung unter anderem auf die integrierte Modellierung von Verhalten und Daten ausgerichtet ist, und Prof. Gövercin, der an mehreren sehr Daten- und Analyseintensiven medizinischen Verbundprojekten prominent beteiligt ist.

Von der Serviceorchestrierung zur Prozessintegration

In den letzten Jahren ist ein starker Trend in Forschung und Anwendung von Geschäftsprozessmanagement zu beobachten, nicht mehr den einzelnen Prozess in den Vordergrund des Interesses zu stellen sondern die Beziehung zwischen mehreren Prozessen [DW11]. Die aktuelle Forschung nähert sich dieser Fragestellung insbesondere durch Arbeiten zur Analyse des Verhaltens interagierender, formal modellierter Prozesse. Dabei wird von konkreten Daten sowie von den Organisationen weitgehend abstrahiert [AW13]. 

In SOAMED-2 werden wir verstärkt Fragen der Interaktion komplexer, organisationsübergreifender Prozesse adressieren. Im Unterschied zu SOAMED-1 wenden wir uns von der Analyse eher flacher Strukturen (Services werden zu Prozessen komponiert) hin zu tief geschachtelten Architekturen (Prozesse bestehen aus Services und anderen Prozessen). Dies führt in SOAMED-2 nicht zu einem eigenständigen Bereich im Forschungsprogramm, sondern reflektiert sich in den Themen der anderen Forschungsbereiche. Die Erforschung gestaffelter und inter-organisationeller Prozesse ist gerade im Kontext des Gesundheitswesens notwendig, weil Organisationen untereinander Daten austauschen, die selber (Zwischen-)Ergebnis lokaler Prozesse sind und deren Weiterverarbeitung von den Prozessen der anderen Organisationen abhängen. Interagierende Prozesse spielen gerade auch in der Neurologie mit ihren oft sehr komplexen Behandlungsabläufen, die viele und häufig wechselnde Akteure umfassen, eine wichtige Rolle, was einer der Gründe war, Prof. Meyer als Antragsteller in SOAMED-2 aufzunehmen. Auf der Informatikseite tragen wir dieser Entwicklung durch die Aufnahme von Prof. Giese, dessen Forschung explizit die Modellierung von „Systemen von Systemen“ adressiert, Rechnung.

SOA und Privacy

Der Schutz personenbezogener Daten lag schon in SOAMED-1 im Zentrum einer Reihe von Dissertationsthemen. Die Erfahrungen aus SOAMED-1 sowie die öffentlichen Diskurse der letzten Jahre (siehe z.B. die vielfältigen Diskussionen um den Schutz der Privatsphäre in sozialen Netzwerken) zeigen, dass im Grunde kein Thema, dass sich mit der prozessorientierten Verarbeitung medizinischer Daten befasst, ohne eine explizite Berücksichtigung von Datenschutzaspekten bearbeitet werden sollte [HWE+11]. Dies ergibt sich unmittelbar sowohl aus juristischen Vorgaben (diverse Datenschutzgesetze und –richtlinien) als auch aus gesellschaftspolitischen Erwägungen. Auf Grund der zunehmenden Komplexität von Systemen, der erweiterten Möglichkeiten der Daten- und Prozessföderierung und der immer detaillierteren Datenbestände ist es aber gleichzeitig eine immer größere Herausforderung, Ansätze im Kontext von SOA zu entwickeln, die den Schutz der Privatsphäre trotz Vernetzung garantieren oder nur in explizit erlaubter Weise verletzen. Dabei muss es Ziel sein, nicht nur den Nachweis für die Einhaltung existierender Datenschutzvorschriften zu bringen, sondern auch das Vertrauen der Gesellschaft bei der Implementierung solcher Prozesse durch IT-Systeme – gerade im medizinischen Bereich – zu stärken. Datenschutzfragen waren auch eine wesentliche Motivation für die Aufnahme von Prof. Scheuermann, einem Experten für Fragen der IT-Sicherheit, und von Prof. Gövercin, dessen Forschungsgebiet auch Fragen des Datenschutzes in medizinischen Anwendungen umfasst.

Im Bereich der Datenspeicherungssysteme und Datenkommunikation wurden verschiedene Ansätze entwickelt, die den Schutz der Privatsphäre sicherstellen [AST05]. Wichtige Konzepte sind die k-Anonymität [Swe02] oder Differential Privacy [Dwo05]; gerade letztere ist für grundlegende Untersuchungen interessant, da dieser Ansatz eine formal fundierte Grundlage hat und damit wichtige Eigenschaften von Algorithmen bewiesen werden können. Viele Fragen sind aber noch unbeantwortet. So ist ein Großteil der Privacy-Forschung aus der Datenbankwelt entstanden und kann nicht ohne weiteres auf das prozessorientierte SOC übertragen werden. Offene Fragen betreffen, zum Beispiel, Datenintegration unter Berücksichtigung von PrivacyAnforderungen, Authentifizierung und Autorisierung in dynamischen Koalitionen, oder Spezifikationssprachen zum Ausdruck individueller Datenschutzanforderungen in verteilten SOA-Umgebungen.