Für Störungen und Ausfälle planen: das mag im ersten Moment zu pessimistisch erscheinen und der Vorwurf liegt nahe, eine selbsterfüllende Prophezeiung herbeizuführen. Jedoch ist diese Art der Planung unerlässlich, um Service Excellence zu erreichen. Technik ist anfällig für Störungen und das wird sich in absehbarer Zukunft auch nicht ändern, besonders da IT Systeme immer komplexer werden.

Unglücklicherweise konzentrieren sich die meisten IT-Fachleute bei der Entwicklung von Systemen und Dienstleistungen auf Best-Case-Szenarien, in denen Störungen nicht eingeplant sind. Was aber, wenn man Störungen nicht als Ausnahme begreift, sondern diese als normal betrachtet? Was, wenn man die Betrachtungsweise umkehrt und die Zeiten, in denen ein System einwandfrei läuft, als Ausnahme sieht?

 

„Normal“ neu definieren

Man schaue sich den IT-Betrieb von einem größeren Unternehmen an (egal aus welcher Branche) und stellt folgende Frage: „Wieviel Prozent der Zeit laufen alle IT Systeme gleichzeitig einwandfrei?”  Die Einschätzung von den meisten Firmen liegt bei etwa 15% und weniger. Im Umkehrschluss bedeutet das, dass in 85% der Zeit etwas nicht so funktioniert wie es sollte. Vielleicht ist es an der Zeit „Normal“ neu zu definieren. Es ist wichtig herauszustellen, dass diese Frage die Größe und die Auswirkungen einer Störung nicht berücksichtigt, sondern lediglich, dass etwas nicht normal läuft. Das ist eine entscheidende Abgrenzung, weil es einen Hinweis auf die eigentlichen Service Excellence Möglichkeiten gibt. Eine Störung bedeutet nicht immer zwangsläufig, dass der Service nicht verfügbar ist.  

 

Auf Störungen ausgelegte Systeme entwerfen  

Wie wäre es, wenn Firmen Systeme entwickeln würden, die auf Störungen ausgelegt sind; wenn bei der Entwicklung ebenjener Systeme angenommen würde, dass Komponenten versagen und Anomalien passieren? Könnten Systeme dann nicht so entwickelt werden, dass Störungen auftreten und Reparaturen vollzogen werden können, ohne dass Performance und Verfügbarkeit weitgehend beeinträchtigt werden? Auf beide Fragen kann man mit „Ja“ antworten. Einige führende Unternehmen weltweit entwickeln Systeme bereits entsprechend und ihre wichtigsten Erkenntnisse in der Planung von auf Störungen ausgelegten Systemen sind folgende:

  • Es gilt die Anzahl von kritischen Abhängigkeiten zu verringern
  • Der Umfang der Releases sollte reduziert werden (stattdessen erfolgen Releases auf einer kontinuierlichen Basis)
  • Die Anzahl der Fälle, in denen einzelne Komponenten das gesamte System beeinflussen, gilt es zu dezimieren. Redundanz ist wesentlich.

Die Architekturen, die zur Entwicklung solcher Systeme benötigt werden, erlauben die Live-Anwendung von „Hotfixes”. Hierbei eliminiert man bei einer Störung die Notwendigkeit, das System offline zu nehmen, um Veränderungen durchzuführen. Wenn Probleme gelöst und Veränderungen umsetzt werden können, ohne das System offline nehmen zu müssen, dann sind theoretisch 100% Verfügbarkeit möglich.

 

Nach Service Excellence streben

Service Excellence bedeutet nicht nur die Einhaltung von SLAs und das Erfüllen von Mindesterwartungen. Es bedeutet Kunden und dem Business die Leistungen zu geben, die benötigt werden. Man strebt nicht nach der Erfüllung von Mindestanforderungen an Qualität und Performance, sondern zielt darüber hinaus. Dazu gehört es, die Anzahl der Zeiten, in denen das System gestört ist, so gering wie möglich zu halten. Moderne Architekturen können dabei helfen, mehr als nur „gut genug” zu sein und Leistungen anzubieten, die Systemausfälle drastisch verringern. Alles beginnt damit, die Art und Weise, in der man über Störungen nachdenkt, zu ändern –  sehen Sie Störungen als ein neues „Normal“ an und planen Sie entsprechend.

Besuchen Sie unseren öffentlichen Workshop IT Troubleshooting-Foundation &  ‑Simulation, um zu lernen, wie die KT-Prozesse Ihnen helfen können, Störungen erfolgreich zu meistern.

()

0 Comment(s)

Schreiben Sie einen Kommentar
  1. Leave this field empty

Notwendiges Feld