-- WEBONDISK OK --

08720 Das Zero-Outage-Programm der T-Systems – Hochverfügbarkeit für alle Kunden

Zero Outage ist ein ganzheitliches Programm, das notwendig ist, um ein erforderliches Höchstmaß an Qualität im ICT-Bereich zu etablieren. Dies ist wiederum die Voraussetzung dafür, den Schritt in das digitale Zeitalter zu absolvieren und dort erfolgreich agieren zu können.
Der Beitrag erläutert die Gründe, die bei T-Systems zur Entwicklung und zum Aufbau dieses tiefgreifenden Systems zur Qualitätssicherung geführt haben. Die Standardisierung wird als Ausweg beschrieben, um den wachsenden Anforderungen zu begegnen und einen störungsfreien ICT-Betrieb zu gewährleisten. Dabei wird deutlich, dass die zu bewältigende Aufgabe nicht beschränkt auf das eigene Unternehmen gesehen werden kann, sondern auch die Dienstleister und Kunden – im Grunde eine ganze Branche – mit einschließt.
Zero Outage definiert dazu die Rahmenparameter für das optimale Zusammenspiel von Personal, Prozessen und Plattformen. Im Beitrag erfahren Sie, wie sie bei T-Systems ineinanderwirken.
von:

1 Einleitung: Ohne ausfallsichere IT keine digitale Transformation

Ziel: zuverlässige ICT
Eine zuverlässige Informations- und Telekommunikationstechnik (ICT) ist die Grundlage für die erfolgreiche digitale Transformation. Das gilt für den eigenen IT-Betrieb wie für ICT-Dienstleistungen, die von einem Service Provider bezogen werden. Die Geschäftsfähigkeit und damit die gesamte Existenz von Unternehmen hängen heutzutage davon ab.
Unternehmen, die es verabsäumen, eine nachhaltig ausfallsichere ICT aufzubauen, drohen massive Probleme. Das Marktforschungsunternehmen Gartner prognostizierte bereits 2013, dass bis zum Jahr 2017 ein Viertel aller Unternehmen vom Markt verschwinden wird, wenn die für die digitale Transformation notwendigen qualitativen Voraussetzung nicht erfüllt werden können – Stichwort „digitale Inkompetenz” [1]
3-P-Prinzip
Qualität in der ICT sicherzustellen ist jedoch eine aufwendige Managementaufgabe. Unzählige Komponenten müssen jederzeit reibungslos zusammenspielen, damit etwa Produktion oder Vertrieb störungsfrei arbeiten können. Dafür braucht es klare Standards: für die Prozesse, für die technischen Plattformen und bei der Ausbildung des Personals („3-P-Prinzip”). Diese Standards müssen nicht nur eingeführt und umgesetzt, sondern auch konsequent aufrechterhalten werden.
Sinn für Dringlichkeit
Neben diesen Standards sind auch die ständige Wachsamkeit der Mitarbeiter und ein Sinn für Dringlichkeit („sense of urgency”) von entscheidender Bedeutung. Denn menschliches Fehlverhalten ist und bleibt die häufigste Ursache für Stör- und Ausfälle. Hier hilft nur ein ganzheitlicher Ansatz, der die Belegschaft systematisch für das Thema Qualität sensibilisiert und sicherstellt, dass sich jeder Mitarbeiter einer Null-Fehler-Kultur verpflichtet fühlt.
Das Qualitätsdenken darf an den Unternehmensgrenzen nicht haltmachen, denn Unternehmen jeder Größe und Branche arbeiten industrieübergreifend zusammen. Damit gibt es immer mehr Schnittstellen und immer mehr Reibungspunkte. Wenn nicht jede beteiligte Organisation dasselbe hohe Qualitätsverständnis hat und aufrechterhält, drohen fehlerhafte Produkte und Ausfälle.
Null-Fehler-Prinzip
Die notwendige reibungslose Zusammenarbeit kann nur funktionieren, wenn es einen gemeinsamen Qualitätsstandard gibt. Daher braucht die ICT-Branche ein Ökosystem, das sich dem Null-Fehler-Prinzip verpflichtet und gemeinsame Regeln für das Qualitätsmanagement verfolgt – mit Zero Outage lassen sich diese Ziele optimal verfolgen.
T-Systems hat mit Zero Outage bereits im Jahr 2011 ein ganzheitliches Programm zur Qualitätssicherung beim Betrieb von ICT-Services eingeführt. Das Ziel: möglichst wenig Downtime für höchstmögliche Geschäftsfähigkeit seiner Kunden im digitalen Zeitalter.

2 Qualität als wichtigstes Entscheidungskriterium

Qualität wichtigstes Kriterium
Dass die Bedeutung von Qualität bei erbrachten Dienstleistungen gerade im Zeitalter der Digitalisierung besonders groß ist, veranschaulichen zahlreiche Studien. So geben zwei Drittel der im Jahr 2015 durch das Beratungshaus PwC befragten Unternehmen an, dass Qualität mit 84 % das wichtigste Kriterium bei der Wahl des Service-Anbieters ist. Damit kommt Qualität weit vor finanziellen Überlegungen (58 %) [2]. Die Information Services Group (ISG) hat zudem herausgefunden, dass IT-Qualität „sehr häufig” bis „immer” bei der Entscheidungsfindung für Unternehmen eine Rolle spielt. Dabei ist insbesondere die generelle Performance unter anderem im Sinne von stabilen Prozessen und zukunftsfähigen Services ein wichtiger Faktor [3].

2.1 Jeder Ausfall kostet Geld

Die zunehmende Digitalisierung erhöht den Druck auf die IT-Abteilungen in Unternehmen aller Branchen. Die gesamte Telekommunikation, Systeme der Rettungsdienste, Logistik von Post, Transportunternehmen, der Handel, die gesamte Finanzwirtschaft und vieles mehr sind heute abhängig von einer störungsfreien IT.
Kleiner Störfäll – große Wirkung
Je mehr Plattformen und Prozesse miteinander vernetzt sind, desto mehr steigen die Abhängigkeiten und desto wahrscheinlicher wiederum treten Störfälle, also Incidents, auf. Diese Incidents – selbst die kleinsten – können schwerwiegende Auswirkungen haben bis hin zu einem kompletten Ausfall eines businesskritischen Service.
Millionenverluste
Jeder Ausfall kostet bares Geld: Mehr als 37 Millionen Mannstunden verlieren allein europäische Unternehmen mit über 50 Mitarbeitern durch IT-Ausfallzeiten und die Wiederherstellung von Daten – und das pro Jahr. In vielen Bereichen führt heute selbst ein kurzzeitiger Ausfall von IT-Systemen zu hohen finanziellen Verlusten bei den betroffenen Unternehmen und Einrichtungen. Apples App Store war 2015 aufgrund technischer Probleme elf Stunden nicht erreichbar. Das Unternehmen hat dabei 2,2 Millionen Dollar Verlust verkraften müssen, und das pro Stunde. Auswirkungen dieser Art sind keine Ausnahme, sondern eher die Regel.
Um die hohen Qualitätsanforderungen des heutigen Geschäftslebens an die IT erfüllen zu können, braucht es also eine Strategie, die einerseits die Zahl der Incidents möglichst niedrig hält und andererseits Störfälle schnellstmöglich behebt. Diese Erfolgsstrategie hat einen Namen: Zero Outage.

2.2 Zero Outage: Auf dem Weg zum Null-Fehler-Prinzip

Zero Outage ist der Inbegriff dessen, wie sich eine Organisation im Hinblick auf eine systematische und effiziente Bearbeitung qualitätsrelevanter Aufgabenstellungen verhält – mit dem Ziel, die Qualität kontinuierlich zu steigern. Zero Outage betrifft daher den Betrieb von Telekommunikation und IT, die Lieferung von Services und die Durchführung von Projekten sowie die Optimierung der Kundenschnittstelle und die Einbindung weiterer ICT-Lieferanten. Wichtig dabei ist: Zero Outage bezieht auch das Verhalten aller Mitarbeiter einer Organisation mit ein – vom Topmanagement bis zum Mitarbeiter an der Basis.
Der von TÜV Rheinland zertifizierte Zero-Outage-Dienstleistungsprozess umfasst Maßnahmen auf allen Ebenen – von modernsten Plattformen über reibungslose, global einheitliche Prozesse mit kurzen Entstörzeiten bis hin zu speziell ausgebildetem Personal. Denn: Erst ein optimales Zusammenspiel von Mensch und Technik ermöglicht eine stabile und sichere ICT.
Präventiv handeln
Die wichtigste Grundlage von Zero Outage ist dabei immer ein übergreifendes und proaktives Risikomanagement. Es gilt das Motto: Prävention statt Reaktion. Es geht nicht nur darum, der Schnellste zu sein, um im Falle eines Falles das Feuer zu löschen, sondern Risiken vorher zu sehen, den Plan B und C vorab zu entwickeln und so zu verhindern, dass der Brandherd überhaupt erst entsteht. Einer flächendeckenden Qualitätssicherung schon in der Planungsphase von Changes oder Projekten bzw. einem allgemein hohen Standardisierungsgrad von Prozessen und Technologie kommt dabei eine große Bedeutung zu.
Wo ist Handlungsbedarf?
Doch woher weiß man, an welcher Stelle man präventiver werden muss und kann? Im Rahmen des Zero-Outage-Programms wurden zunächst knapp 300 Risiken identifiziert, diese in 40 Cluster unterteilt und daraus schließlich konkrete Maßnahmen abgeleitet. So sind spezifische Regelungen sowie Handlungsanweisungen für verschiedene Störfälle entstanden, beispielsweise im Fall defekter Systemkomponenten, für Netzwerk-, Strom- oder VoIP-Ausfälle oder auch Incidents während eines Change. Dieser sogenannte Bebauungsplan bildet die Grundlage für das Qualitätsmanagement bei T-Systems: In regelmäßigen Abständen analysiert ein Expertenteam anhand festdefinierter Kennzahlen im Zusammenspiel von Vergangenheitsbetrachtungen und Extrapolation mögliche Risiken, die den störungsfreien ICT-Betrieb gefährden könnten. Aus dem Bebauungsplan werden einzelne Programme abgeleitet, denen sich gezielt eine fest definierte Programmorganisation widmet.

Weiterlesen und den „Information Security Management“ 4 Wochen gratis testen:

  • Das komplette Know-how in Sachen Informationssicherheit und Datenschutz
  • Zugriff auf über 230 Fachbeiträge und 210 Arbeitshilfen
  • Onlinezugriff – überall verfügbar


Sie haben schon ein Abonnement oder testen bereits? Hier anmelden

Ihre Anfrage wird bearbeitet.
AuthError LoginModal