Sommersemester 2024

Zuverlässigkeit von Rechensystemen

Inhalt

Die Vorlesung behandelt grundlegende Verfahren zur Erhöhung der Zuverlässigkeit von Rechensystemen, insbesondere durch sog. Fehlertoleranz. Der Rechner wird dadurch in die Lage versetzt, trotz interner Fehler weiterhin seine spezifizierte Funktion zu erfüllen. Zunächst werden die wichtigsten Fehlertypen in Hardware und Software sowie deren Abstraktion zu Fehlermodellen eingeführt. Grundlegende Redundanztechniken für fehlertolerante Systeme werden vorgestellt und mittels mathematischer Zuverlässigkeitsmodelle quantitativ bewertet und verglichen. Zur Umsetzung dieser Verfahren erforderliche Techniken zur Fehlerdiagnose, Rekonfiguration und zum Wiederanlauf sowie zur Fehlermaskierung werden behandelt. Anhand typischer Beispielsysteme wird der Einsatz von Fehlertoleranztechniken in praktischen Anwendungen mit hohen Zuverlässigkeitsanforderungen wie Luft- und Raumfahrt, Prozessautomatisierung oder Transaktionsservern diskutiert.

 

Die Vorlesungsunterlagen finden Sie im Moodle.

Literatur

  • Dubrova, E.:
    Fault-Tolerant Design.
    Springer, Berlin 2013
  • Echtle, K.:
    Fehlertoleranzverfahren.
    Springer, Berlin 1990
  • Koren, I.; Krishna, C. M.:
    Fault Tolerant Systems.
    Morgan-Kaufman, Boston 2007
  • Trivedi, K.:
    Probability and Statistics with Reliability, Queuing, and Computer Science Applications.
    Wiley, New York 2008