Störungen an Bord von Apollo XIII

Aus: Der Rationale Manager von Charles H. Kepner und Benjamin B. Tregoe, Princeton Research Press, Princeton, NJ, 1998

Die beste Anwendung der Problemanalyse ist die Anwendung, die am besten funktioniert. Jeden einzelnen Prozessschritt starr einzuhalten, ist nicht besonders wirkungsvoll, wenn eine kurze formlose Konzeptanwendung ausreicht, um die Ursache zu finden. Nach längerer Anwendung der Problemanalyse entwickelt man eine gewisse Fertigkeit, Teile des Prozesses herauszugreifen, die für alltägliche Probleme geeignet sind. Fragen wie „Hat sich in letzter Zeit etwas im Betriebsablauf verändert?“ oder „In welchem Stadium befand sich das Verfahren, als die Störung entdeckt wurde?“ zeigen, dass der Übergang von der Theorie zur automatischen Anwendung der Problemanalyse im Arbeitsalltag geschafft ist.

Problemanalysen werden großenteils ohne Papier und Bleistift durchgeführt.

Das gilt ganz besonders für die Schnellanwendung des Prozesses. Die Tragweite eines Problems ist nicht unbedingt ausschlaggebend dafür, wie langwierig oder komplex die Analyse sein muss, denn selbst schwerwiegende Probleme lassen sich durch Schnellanwendung des Prozesses lösen. Sind nur spärliche Angaben vorhanden, ist eine vollständige Anwendung von vornherein ausgeschlossen. Unter solchen Umständen muss man sich an die Prozessschritte halten und sie mit einer auf Wissen und Erfahrung beruhenden Hypothese kombinieren, um zur wahrscheinlichsten Ursache zu gelangen.

Apollo XIII befand sich auf dem Weg zum Mond.

Die Mission war seit 54 Stunden und 52 Minuten bzw.ca. 350.000 km unterwegs und alles lief bestens. Plötzlich schaltete sich John L. Swigert Jr., der gerade das Kommando führte, nach Houston ein: „Houston, wir haben hier ein Problem... Haupt-Bus B ist ohne Spannung.“ Dies war Fachjargon dafür, dass die elektrische Spannung des zweiten Stromgenerators ausgefallen war und ein Warnsignal ausgelöst hatte. Kurz darauf kehrte der Strom zurück. Swigert berichtete: „Die Spannung scheint in Ordnung zu sein. Es hat aber einen ziemlichen Knall gegeben, als das Warnsignal auftrat.“ Drei Minuten später, als die Dimensionen des Problems klarer hervortraten, fuhr er fort: „Also, Haupt-Bus A ist auch ohne Spannung... sie zeigt ungefähr 25 1/2 an. Haupt-Bus B steht jetzt auf Null.“

Apollo XIII, die drei Mann mit unvorstellbarer Geschwindigkeit zum Mond tragen sollte, verlor rapide an Energie und konnte schnell zum Sarg für alle drei Besatzungsmitglieder werden. Es gab ein Problem im Weltall, und keiner wusste genau, was passiert war.

NASA-Ingenieure beginnen Problemanalyse.

In der Bodenstation in Houston verloren NASA-Ingenieure keine Zeit und begannen sofort mit der Problemanalyse. Anhand der Antworten auf ihre Fragen und der Prüfbilddaten wurde die Abweichung definiert.

Schadensbegrenzende Maßnahmen werden eingeleitet.

Gleichzeitig wurden Notmaßnahmen zur Stromeinsparung an Bord von Apollo XIII in Angriff genommen. 13 Minuten nach seinem ersten Bericht meldete Swigert: „Tank Nr. 2 Cryo-Sauerstoff steht auf Null...es scheint, wenn ich aus der Luke sehe, als ob irgendetwas ins All ausströmt...es sieht wie Gas aus.“

Was zunächst nach einem Problem in der Elektrik – Spannungsverlust – ausgesehen hatte, verwandelte sich plötzlich in einen Sauerstoffverlust im zweiten Tank und eine allmählichere Sauerstoffabnahme im ersten Tank. Da Sauerstoff im Raumschiff Strom erzeugte und direkt die Rettungsvorrichtungen versorgte, konnte die Lage kaum ernster sein.

Ingenieure finden die Ursache und ergreifen Maßnahmen.

Obgleich zu der Zeit niemand sagen konnte, was zur Explosion des Tanks geführt haben könnte, war „Zerbersten des Cryogen-Sauerstofftanks Nr. 2“eine Erklärung, die den plötzlichen Stromausfall und anschließenden Druckverlust erklären würde.

Weitere Maßnahmen zur Einsparung von Sauerstoff und Strom wurden ergriffen. Eine Reihe von Fragen zur Ermittlung weiterer IST- und IST-NICHT-Daten wurden gestellt. Hinzu kamen Überprüfungen des Systems, um die Ursache zu beweisen. Schließlich wurde festgestellt, dass der Tank Nr. 2 explodiert und der gesamte Sauerstoff ausgeströmt war. Außerdem war eine beachtliche Menge des Gases durch ein beschädigtes Ventil aus Tank Nr. 1 ins All entwichen.

Die Besatzung kehrte wohlbehalten auf die Erde zurück, allerdings erst, nachdem ihr Leben auf Messers Schneide gestanden hatte. Hätte man die Ursache auch nur wenig später gefunden, wäre nicht genügend Sauerstoff zum Überleben vorhanden gewesen.

Was war also die Ursache?

Es dauerte Wochen, bis man durch Tests und Experimente auf der Bodenstation den Kern des Problems entdeckte. Zwei Wochen vor dem Start hatte Bodenpersonal während einer Übung des Count-Downs flüssigen Sauerstoff in die Tanks gefüllt. Anschließend hatten sie Schwierigkeiten, den Sauerstoff aus Tank Nr. 2 wieder herauszupumpen. Eine Heizvorrichtung im Tank wurde in Betrieb gesetzt, um ein wenig flüssigen Sauerstoff zu verdunsten und mit dem erzeugten Druck den Sauerstoff ganz herauszutreiben. Die Heizvorrichtung blieb 8 Stunden lang eingeschaltet, länger als je zuvor. Es gab zwar einen Sicherungsschalter, der das Gerät bei Überhitzung ausschalten sollte, aber dieser Schalter war in der EIN-Position durchgebrannt, denn das Bodenpersonal hatte das Gerät an eine 65 V-Spannung und nicht an eine 28 V-Spannung, wie sie in der Apollo XIII verwendet wird, angeschlossen. Später, während des Fluges schaltete die Mannschaft das Heizgerät kurz ein, um die genaue Menge abzulesen. Der durchgebrannte Schalter erzeugte einen Lichtbogen, der den Sauerstoff im Tank überhitzte, hierdurch den Innendruck gewaltig erhöhte und die Kuppel mit den meisten Verbindungsrohren ins All schleuderte.

Die NASA in Houston hatte nicht genügend Zeit, um eine vollständige Liste aller Besonderheiten und möglicherweise beobachteten Veränderungen durchzugehen. Stattdessen fragten sie: „Welche tiefgreifende Veränderung konnte den plötzlichen und totalen Stromausfall verursachen?“ Eine Unterbrechung der Sauerstoffzufuhr zu den Brennstoffzellen könnte dazu führen. Sie wussten, welche Brennstoffzellen defekt waren, als Swigert meldete, dass der Cryo-Tank Nr. 2 Null anzeige.

Die verfügbaren Informationen wurden verwendet, um mögliche Ursachen zu testen

Die Ursache – der explodierte Tank – wurde getestet, und dabei wurde festgestellt, dass sie das plötzliche und totale Versagen nach der Problemdefinition erklären konnte. Sie würde auch den Knall zum Zeitpunkt des ersten Anzeigens von Spannungsverlust, die von der Mannschaft gemeldete Erschütterung des Raumschiffs und das Ausströmen von „etwas... ins All“ erklären. Die zusammengetragenen IST-Daten und die über den Bildschirm erhaltenen IST-NICHT-Daten führten zu einer Erklärung. Insbesondere ließ sich auf diese Weise das plötzliche und totale Versagen des Systems begründen.

Den NASA-Ingenieuren fiel es schwer, diese Ursache zu akzeptieren.

Schließlich hatten sie grenzenloses Vertrauen in die Technik des Apollo-Raumschiffs und wussten, dass sie das Beste und Modernste war, was es gab. Unvorstellbar, dass ein Sauerstofftank im All explodierte. Alles dies war durch ihre Erfahrung begründet. Ohne diesen Schnitzer auf der Bodenstation zwei Wochen vor dem Start, wäre der Tank wie vorgesehen zum Mond und zurück geflogen und hätte seinen Zweck erfüllt. Obgleich ihnen der Unfall unfassbar war, hielten die Ingenieure in Houston am Prozess der Problemanalyse fest und waren überzeugt, ihr Testen nach der Ursache würde die richtige Antwort liefern. Der Beweis wurde in Rekordzeit erbracht. Es war ihre Rettung, dass sie mit den Systemen von Apollo XIII so vertraut waren und wussten, was den eingetretenen plötzlichen Ausfall hervorgerufen haben könnte.

Eine analytische Herangehensweise bei Unternehmens-gefährdenden Problemen

In einem solchen Fall wird die Problemanalyse durch zwei Faktoren erschwert: Nebenwirkungen und Panik. Ein plötzlicher Ausfall in einem komplexen System verursacht gewöhnlich andere Abweichungen, die die ursprüngliche Abweichung verdecken. Häufig ruft der Schock eines plötzlichen Versagens Panik hervor und gefährdet die sorgfältige Überprüfung und Verwendung von Fakten. Eine disziplinierte systematische Nachforschung ist nie einfach, aber Disziplin ist unerlässlich, wenn die Ursache schnellstens gefunden werden muss und nicht alle Daten zur optimalen Untersuchung eingeholt werden können.

Im NASA-Fall verhalf eine systematische Methode einem Team, als Einheit zusammenzuarbeiten, obwohl es über 300.000 km von der Abweichung entfernt war.

Apollo XIII   Hier herunterladen