Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Rechnerorganisation und Kommunikation

Forschung

Unsere Forschungsvision

Der Lehrstuhl für Rechnerorganisation und Kommunikation forscht im Bereich der verlässlichen Systeme (dependable systems). Der Begriff Verlässlichkeit umfasst eine Kombination aus verschiedenen Systemeigenschaften, welche zusammengefasst betrachtet werden: Verfügbarkeit (availability), Zuverlässigkeit (reliability), Sicherheit (safety), Integrität (integrity) und Wartbarkeit (maintainability).

Unsere Gruppe beschäftigt sich mit Konzepten, Methodiken, Algorithmen und Technologien, um verlässliche Systeme in verschiedenen Anwendungsgebieten realisieren zu können - von eingebetteten Echtzeitsystemen, über mobile Geräte, Standard-PC-Architekturen, Enterprise-Systeme bis hin zu Cloud Computing Szenarien.

 mission-logo-de.png

 

Unsere Forschung orientiert sich an drei Grundkonzepten zur Realisierung verlässlicher Systeme. Diese können zur Design- oder zur Laufzeit (offline vs. online) eine Rolle spielen.

  • Datenerfassung (data acquisition): Konzepte zur Datenerfassung konzentrieren sich auf die quantitative Beobachtung und Einschätzung von Systemen, was im Gegensatz zu vielen rein qualitativen Ansätzen steht. Die erfassten Daten werden einerseits dazu verwendet, Systemeigenschaften einzuschätzen und abzuleiten. Auf der anderen Seite können sie zur Laufzeit überwacht werden, um den aktuellen Systemzustand permanent zu evaluieren. Beispiele aus unserer Forschung sind die Laufzeitüberwachung von Hardware- und Softwarekomponenten, oder die Ausnutzung von Ortungsinformationen zur Erhöhung der Verlässlichkeit von Systemen.
  • Evaluierung (evaluation): Konzepte zur Evaluierung von verlässlichen Systemen beschäftigen sich mit der Analyse und Interpretation erfasster Daten, um zukünftige Fehler vorherzusagen oder eingetretene Fehler zu diagnostizieren. Letzteres enthält dabei die Lokalisierung (diagnosis) und die Ursachenanalyse (root cause analysis) für einzelne Fehler oder ganze Systemausfälle.
  • Aktion (action): Mit Konzepten für geeignete Aktionen in verlässlichen Systemen kann die angestrebte Erhöhung der Systemverlässlichkeit erreicht werden, da hier die Ergebnisse der Datenerfassung und Evaluierung in echte proaktive oder reaktive Aktivitäten münden. Im Falle der (online) Laufzeitüberwachung  werden Aktionen angestossen, die einen drohenden Ausfall entweder vermeiden oder seine Auswirkungen eindämmen, im Falle der (offline) Systemanalyse soll besteht die Aktivität in einer geeigneten Anpassung des Systemdesigns.

Die drei Grundbestandteile eines verlässlichen Systems werden in unserer Forschung durch allgemeine Techniken zur Bewertung (Assessment), zur Modellierung (Modeling) und Gestaltung (Design) von Systemkomponenten und ganzen Systemen ergänzt. Modelle spielen dabei u.a. eine entscheidende Rolle, um Verlässlichkeitseigenschaften geeignet einschätzen zu können. Typische Beispiele sind die Ermittlung von Dienstgüteeigenschaften (service level agreements) und Dienstgütezielen (service level objectives). Ein Beispiel für den Querschnittsaspekt der Systemgestaltung ist die Kombination von Echtzeiteigenschaften und Verlässlichkeit in einer Systemarchitektur.

Forschungsthemen

Unsere Forschungsaktivitäten im Bereich verlässlicher Systeme sind thematisch wie folgt aufgestellt:

  • Proaktive Fehlerbehandlung
  • Adaptive und selbst-heilende Systeme
  • Verfügbarkeitsbewertungen (SHIP Modell)
  • Verlässlichkeit eingebetteter Systeme
  • NOMADS – Netzwerk von mobilen adaptiven verlässlichen Systemen. Siehe NOMADS-Wiki.
  • Mobile Kommunikation und Ad-Hoc Netzwerke
  • Standortbezogene Dienste. Siehe Projekt MagicMap.
  • Komponierbarkeit und Verifikation von Softwaresystemen
  • Ausfallvorhersage für Hardware-Komponenten und komplexe Rechnersysteme
  • Verlässlichkeit in Multi-Core / GPU Systemen
  • Verlässlichkeit in verteilten Systemen, speziell in dienstorientierten Architekturen
  • Stochastische Modellierung komplexer Systeme
  • Planung und Umsetzung von Dienstgütevereinbarungen

 

Aktuelle Forschungsprojekte

  • MagicMap - Ein System zur kooperativen Positionsbestimmung über WLAN & RFID. Ansprechpartner: Peter Ibach
  • METRIK - Graduiertenkolleg Modellbasierte Entwicklung von Technologien für selbstorganisierende dezentrale Informationssysteme im Katastrophenmanagement. Mitarbeiter am Lehrstuhl ROK: Andreas Dittrich
  • Proactive Fault Management in the Cloud - Cloud Computing stellt neue Mittel bereit, physikalische Redundanz dynamisch zu verwalten, und somit proaktives Fehlermanagement zu unterstützen.
    Ansprechpartner: Felix Salfner

 

Abgeschlossene Projekte

  • DFG-Projekt "Reliability and Performance of Service-Oriented Architectures"
  • Graduiertenkolleg "Stochastische Modellierung und quantitative Analyse großer Systeme in den Ingenieurwissenschaften"

 

Forschungsseminar

Aktuelle Forschungsarbeiten werden wöchentlich im Forschungsseminar präsentiert und diskutiert.

 

Studien- und Diplomarbeiten

 

Publikationen

 

Verantwortlich für die Seite: Felix Salfner