Daniel Goldinger
SLA - Wie man Verfügbarkeit bei Services messen sollte und wie Microsoft es macht
  • Datum 22.04.2022

In der IT Branche wird die Qualität von Hosting-Anbietern unter anderem in Verfügbarkeit gemessen. Die Verfügbarkeit wird in % pro Quartal oder % pro Jahr angegeben und die Zielwerte werden im Vertrag mit dem Anbieter (meist SLA, «Service Level Agreement») schriftlich festgehalten. Hier kommt ein Beispiel:

Die garantierte Verfügbarkeit eines Servers von 99.9% über ein Jahr bedeutet:

  • 1 Jahr = 8760h
  • 0.1% = 8.76h

Der Server darf also pro Jahr 1x für 8.76 Stunden ausfallen. Oder 4x für 2.19h. Und so weiter.

Was passiert beim Unterschreiten der Zielwerte?

Fragen Sie Ihren Anbieter auch immer, was passiert, wenn der Zielwert unterschritten wird. Falls er darauf keine (oder keine zufriedenstellende) Antwort findet, ist die «Garantie» auch nichts wert. Das Nichterfüllen des SLA muss für den Anbieter _ immer**_ mit Kosten / Vertragsauflösung o.Ä. verbunden sein, damit es auch einen Anreiz gibt, den Vertrag zu erfüllen.

Downtimes (Ausfälle) sollten transparent sein!

Es fällt naturgemäss schwer, Systemausfälle mitzuteilen. Schliesslich zeigen diese erbarmungslos die eigenen Schwächen auf. Deshalb sind transparente Mitteilungen der eigenen Downtimes immer auch ein Zeichen für die Qualität des Anbieters.

Google zeigt die Downtime History für sämtliche Google Cloud Services etwa hier auf:

https://status.cloud.google.com/summary

Transparent, übersichtlich (inkl. Dauer des Unterbruchs) und für jedermann einsehbar.

Und wie man es auch machen kann...

Schauen wir uns mal die Statusseite von Microsoft für MS365 näher an:

https://status.office365.com/

Microsoft 365 Service health status SeiteKeine History und weitere Informationen gibt es nur nach Anmeldung (also nur für Kunden). Ich kaufe somit die Katze im Sack.

Fairerweise muss man sagen, dass Microsoft die Meldungen auch auf Twitter publiziert. Von dort kann man sich die Downtime also selbst zusammenrechnen.

Ausgewiesene Verfügbarkeit vs. reale Verfügbarkeit

Prüfen Sie als Kunde immer genau nach, ob die veröffentlichten Zahlen stimmen und fragen Sie auch nach, wie die Zahlen zusammengesetzt sind. Kleines Beispiel gefällig?

Unter diesem Link publiziert Microsoft die «worldwide uptimes» für «Microsoft 365 and Office 365 platform service»:

https://docs.microsoft.com/en-us/office365/servicedescriptions/office-365-platform-service-description/service-health-and-continuity

Q3, 2018:

99.97% Verfügbarkeit gemäss Microsoft.

Ein Quartal hat 2190h, 0.03% Ausfallzeit sind demnach 0.657h, oder knapp 40 Minuten.

Gemäss der Webseite GeekWire waren es am 04.09.2018 jedoch «mehrere Stunden».

Q1, 2021:

99.97% Verfügbarkeit gemäss Microsoft.

Also wieder 40 Minuten im ganzen Quartal.

Gemäss der Newsseite Bleepingcomputer waren es wieder mehrere Stunden.

Fazit

IT ist Vertrauenssache. Transparenz schafft Vertrauen.

Hinterfragen Sie als Kunde die Daten, die Sie von Ihrem Anbieter erhalten immer kritisch. Auch die von uns. Prüfen Sie anhand Stichproben, ob die Angaben plausibel sind. Und verwenden Sie bei Bedarf ein unabhängiges «Monitoring as a Service».