Oh nein, da hat es aber ordentlich gekracht bei Rogers Networks, dem führenden Telekommunikationsunternehmen Kanadas. Am 8. Juli 2022 war dort nämlich erstmal Sendepause angesagt. Und das nicht nur für ein paar Minuten, sondern für ganze 26 Stunden. Das ist ja fast so lang wie eine Staffel deiner Lieblingsserie auf Netflix!
Dabei waren ganze zwölf Millionen Kunden betroffen. Egal ob Mobilfunk oder Festnetz, nichts ging mehr. Keine Telefonate, keine Datenübertragung und noch nicht mal ein Notruf war möglich. Da war der Schock groß und die kanadische Regierung schaltete direkt in den Panikmodus.
Natürlich wurde sofort eine Untersuchung angeordnet, schließlich wollte man wissen, was da schiefgelaufen ist. Aber wie das so ist, dauert das natürlich seine Zeit. Zwei Jahre nachdem die Regulierungsbehörde CRTC den Bericht der Telecom-Beratungsfirma Xona Partners veröffentlichte, warten die Leute immer noch gespannt auf die vollständige Version. So viel zur Schnelligkeit der Bürokratie.
In dem Bericht werden dann auch gleich drei zentrale Herausforderungen aufgezeigt: die Fähigkeit zur Widerstandsfähigkeit, das Change Management und das Krisenmanagement. Klingt ja fast so, als wäre Rogers Networks ein bisschen überfordert gewesen. Aber hey, wer hätte das gedacht?
Der Totalausfall wurde übrigens durch einen technischen Fehler verursacht. Rogers hatte nämlich die schlaue Idee, ein einheitliches IP-Kernnetz für Festnetztelefonie, Internet und Mobilfunk zu verwenden. Klingt praktisch, ist aber auch ziemlich riskant. Denn wenn da mal was schiefgeht, dann geht gleich alles schief.
Und genau das ist passiert. Bei einem Update für die Router, die den Datenverkehr abwickeln, ist ein entscheidender Fehler passiert. Die Access Control Lists wurden gelöscht und plötzlich konnten die Distributionsrouter machen, was sie wollten. Das Ergebnis: Das Kernnetz wurde überlastet und alle Dienste waren offline. Oops, da hat wohl jemand nicht aufgepasst.
Aber auch danach lief nicht alles wie geschmiert. Die Netztechniker hatten nämlich auch noch mit ein paar Hindernissen zu kämpfen. Zum Beispiel konnten sie nicht auf die ausgefallenen Router zugreifen, weil das Management-Netzwerk ebenfalls auf das IP-Kernnetz angewiesen war. Und eine alternative Verbindung gab es auch nicht. Da mussten die armen Mitarbeiter persönlich zu den Routern fahren, um das Problem zu lösen. Das hat natürlich ordentlich Zeit gekostet.
Aber hey, immerhin hatten sie ja noch ihre Smartphones, um sich untereinander abzusprechen. Ach nee, Moment mal! Das Mobilfunknetz von Rogers funktionierte ja auch nicht. Da mussten erstmal Boten SIM-Karten von anderen Netzbetreibern bringen, damit überhaupt mal eine Kommunikation möglich war. Na, das ist ja mal eine effiziente Lösung.
Und als ob das nicht schon genug wäre, hatten die Netztechniker dann auch noch 14 Stunden lang keinen Zugriff auf die Logdateien. Das ist ja fast so, als würde man Sherlock Holmes ohne seine Lupe auf Verbrecherjagd schicken. Da kann man ja nur hoffen, dass sie ihre Detektivarbeit trotzdem erfolgreich erledigen konnten.
Der Totalausfall bei Rogers Networks zeigt uns allen mal wieder, wie wichtig es ist, seine Systeme sorgfältig zu planen, zu testen und zu überwachen. Denn Ausfälle dieser Größenordnung können nicht nur für unzählige Fluchwörter sorgen, sondern auch große wirtschaftliche Schäden verursachen. Also liebe Telekommunikationsunternehmen, nehmt euch das zu Herzen und lasst uns Kunden nicht im Regen stehen. Oder besser gesagt: im Netzlosen.
Schlagwörter: Rogers + Juli + Kanadas
Wie bewerten Sie den Schreibstil des Artikels?
