IT-Ausfall Blogbeitrag Ein Achtung Symbol auf einem Chip.

Was ist ein IT-Ausfall – und wie können wir uns davor schützen?

Heutige IT-Systeme sind hochkomplex und weltweit vernetzt. Doch dies bringt nicht nur Vorteile. Manchmal genügt eine Verkettung ungünstiger Umstände, um das ganze System zum Einsturz zu bringen – so etwa im Juli 2024. Ein fehlerhaftes Update des Entwicklers Crowdstrike legte PCs auf der ganzen Welt lahm. Ein Einzelfall? keineswegs. Selbst die größten Unternehmen hatten bereits mit IT-Ausfällen zu kämpfen. Das zeigen Beispiele wie Google, Facebook, British Airways, Lufthansa und VW.

In diesem Beitrag beleuchten wir die größten IT-Ausfälle der Geschichte – und zeigen, welche Ursachen dahintersteckten. Anschließend wagen wir einen Blick in die Zukunft. Welche Maßnahmen planen Politik und Wirtschaft, um IT-Ausfälle zu verhindern oder zumindest abzuschwächen?

IT-Ausfall – Definition

Selbst, wenn Du noch nie vom Begriff „IT-Ausfall“ gehört hast – erlebt hast Du ihn bestimmt schon einmal. Das liegt an der Komplexität heutiger Computer wie PCs, Laptops, Smartphones und Tablets. Beim Zusammenspiel zwischen Hard- und Software treten unweigerlich Fehler auf. Diese können Apps, Dienste oder gar das ganze Betriebssystem zum Absturz bringen.

Bei einem einzelnen Gerät mag das verschmerzbar sein. Oft genügt ein einfacher Neustart; oder das Problem muss im abgesicherten Modus behoben werden. Versagen mehrere Geräte den Dienst – etwa in einer Firma – ist der Schaden schon größer. Kostbare Arbeitszeit geht verloren. Der „Super GAU“ tritt dann ein, wenn Computer auf der ganzen Welt betroffen sind. In diesem Fall spricht man von einem globalen IT-Ausfall.

Experten unterscheiden zwischen versehentlichen IT-Ausfällen – und solchen, die absichtlich herbeigeführt werden. Sog. Cyber-Angriffe zielen darauf ab, die Infrastruktur eines Unternehmens oder einer Organisation lahmzulegen. Dahinter stecken meist finanzielle Motive. Hacker verlangen „Lösegeld“, um den Fehler im System zu beheben. Aber auch politisch motivierte Cyber-Attacken, etwa auf Regierungen, sind bereits Alltag. Das Beispiel Ukrainekrieg zeigt: Kämpfe werden heute nicht nur auf dem Schlachtfeld, sondern auf digitaler Ebene geführt.

Sehen wir uns nun einige Beispiele für IT-Ausfälle genauer an.

Ein Monitor, auf dem ein Windows Update und ein Crowdstrike Symbol zu sehen ist.

2024 – Globaler IT-Ausfall durch Crowdstrike

Bis zum Juli 2024 kannten die wenigsten Menschen den Namen „Crowdstrike“. Das Unternehmen mit Sitz in den USA war vor allem unter Geschäftskunden bekannt. Tausende Firmen nutzten die Sicherheitssoftware Falcon Sensor, um ihre PCs vor Viren und Malware zu schützen. Alles lief reibungslos – bis am 19. Juli ein fataler Fehler auftrat.

Hacker und Betrüger schlafen nicht. Um auf neue Bedrohungslagen zu reagieren, muss Falcon Sense regelmäßig aktualisiert werden. Crowdstrike lieferte darum einen Patch, der einige Konfigurationsdateien änderte. Leider verursachte dieser Patch gleichzeitig einen Logikfehler. Ob die Schuld nun bei den Programmierern oder der Qualitätssicherung liegt, sei dahingestellt. In jedem Fall wurde der Fehler übersehen.

Normalerweise wäre dies nicht dramatisch. Schließlich führt ein Softwarefehler selten dazu, dass der komplette PC abstürzt. Doch fatalerweise nistete sich Falcon Sensor tief im sog. Kernel – dem Herzstück jedes Computers – ein. Dieser Bereich erfordert die strengsten Sicherheitsrechte. Nur wenige Programme erhalten Zugriff darauf. Warum das sinnvoll ist, mussten Nutzer schmerzhaft miterleben. Die fehlerhafte Konfigurationsdatei zwang nicht nur Falcon Sensor, sondern das ganze Betriebssystem in die Knie. Mehr als 8 Millionen Windows-PCs sahen statt ihrer gewohnten Nutzeroberfläche nur noch einen „BSOD“: den sog. „Bluescreen des Todes“.

Das letzte Puzzleteil für den IT-Ausfall war dann Crowdstrikes Update-Strategie. Der fehlerhafte Patch wurde an PCs auf der ganzen Welt geschickt – und zwar gleichzeitig, angefangen in Australien. Als der Fehler bemerkt wurde, gab es keine Möglichkeit, das Update noch aufzuhalten.

Um es kurz zu machen: Alle Computer, die mit Falcon Sense arbeiteten, fielen auf einen Schlag aus. Firmen mussten ihre Mitarbeiter nach Hause schicken oder den Betrieb sogar komplett einstellen. Bänder standen still und Logistikketten wurden unterbrochen.

Doch nicht nur kleine und mittelständische Unternehmen waren vom Ausfall der IT betroffen. Den „Großen“ erging es nicht besser.

Geduld brauchten alle, die für den 19. Juli einen Flug gebucht hatten. Allein die US-Fluglinie Delta musste über 5.000 Flüge streichen. Sie hatte besonders viele PCs mit der Sicherheitssoftware ausgestattet. Auch Lufthansa, American Airlines und British Airways blieben auf dem Boden. Es kam zu den größten Einschränkungen des Luftverkehrs seit dem 11. September.

Ebenso prekär war die Lage in Krankenhäusern. Sicherheitskameras fielen aus; Mitarbeiter konnten ihre Schlüsselkarten nicht mehr nutzen und Patientenakten, die auf Windows-PC lagerten, waren unzugänglich. Ohne Zugriff darauf mussten viele Behandlungen verschoben oder abgesagt werden. Geschätzter Schaden weltweit: fast 2 Milliarden US-Dollar.

Der IT-Ausfall brachte weitere Branchen in Bedrängnis – darunter Banken. Kunden, die sich in ihr Online-Banking einloggen wollten, hatten Pech gehabt. Logistik-Unternehmen wie FedEx mussten ihre Lieferungen zeitweise einstellen, und auch Medien hatten mit Ausfällen zu kämpfen. Sky News, MSNBC und NBC News sendeten zeitweise keine Live-Programme mehr. Etwas Fast Food, um die Nerven zu beruhigen? Nicht in Japan! Dort blieben 30 % aller McDonalds-Filialen aufgrund des Computerfehlers geschlossen.

Nahezu alle Branchen waren vom weltweiten IT-Ausfall betroffen. Nur eine „Berufsgruppe“ profitierte: Hacker und Online-Betrüger. Sie kontaktierten verzweifelte Unternehmen mit Emails, die eine Lösung versprachen. Gefälschte Konfigurationsdateien wurden in Umlauf gebracht. Dahinter verbarg sich meist Malware.

Crowdstrike und Apple – ein Positiv-Beispiel?

Im Gegensatz zu Windows-PCs blieben Apples Geräte vom IT-Ausfall verschont. Dies liegt vor allem am geschlossenen System der Kalifornier – auch als Walled Garden bekannt. Nicht nur arbeitet Apple kaum mit Drittanbietern zusammen. Das Unternehmen legt auch äußerst streng fest, welche Software Zugriff auf das „Herz“ ihres Betriebssystems erhält. Eine einzige fehlerhafte Datei reicht also kaum aus, um das ganze System in die Knie zu zwingen.

Heißt dies nun, dass Apple-Nutzer hundertprozentig sicher vor IT-Ausfällen sind? Nein. Im Fall Crowdstrike hatte Apple auch eine gehörige Portion Glück. Das fehlerhafte Update wurde zuerst an Windows-PCs geschickt – einfach, weil dieses Betriebssystem von den meisten Unternehmen verwendet wird. Aus demselben Grund waren auch Linux-PCs nicht betroffen.

Crowdstrikes Reaktion und die Folgen

Nicht nur bei Windows-Nutzern – auch bei Crowdstrike herrschte Panik. Eine schnelle Reaktion war gefragt. Innerhalb von 90 Minuten lieferte das Unternehmen eine Lösung für den IT-Ausfall. Doch diese entpuppte sich als zeitintensiv. Nutzer wurden aufgefordert, ihre PCs im Wiederherstellungsmodus zu starten und die fehlerhafte Datei zu löschen. Was in kleinen Unternehmen problemlos möglich war, wurde in Konzernen mit hunderten oder gar tausenden PCs zur Sisyphos-Arbeit.

Zum Glück normalisierte sich die Lage am 20. Juli wieder. Crowdstrike lieferte einen neuen Patch, der den Software-Fehler behob. Schritt für Schritt konnten PCs wieder normal hochgefahren werden. Auch Bedenken, es hätte sich um einen Cyberangriff gehandelt, zerstreuten sich. Doch der Schaden blieb. Laut Forbes erlitten allein die Fortune 500-Unternehmen Verluste in Höhe von 5,4 Milliarden US-Dollar. Der gesamte Schaden wird auf 10 Milliarden US-Dollar geschätzt.

Nun fragst Du Dich vielleicht: Was ist mit Crowdstrike passiert: der Firma, die den größten IT-Ausfall aller Zeiten verursacht hat? Nicht nur erhielt Crowdstrike den unrühmlichen „Most Fail“-Award auf der DEFOM 2024. Auch betroffene Unternehmen waren sauer. Delta-Airlines etwa forderte Entschädigungen in Höhe von 500 Millionen Dollar. Crowdstrikes Aktionäre erhoben eine Sammelklage – verständlich, denn der Aktienkurs fiel erst einmal ins Bodenlose. Im Oktober musste Crowdstrike-Vizepräsident Adam Myers sogar vor dem US-Kongress erscheinen – kein angenehmer Termin. Myers bekundete sein Bedauern und sicherte zu, aus vergangenen Fehlern zu lernen. Volksvertreter wiederum mahnten strengere Kontrollen für Software-Entwickler an.

Zwar dürften sich die Rechtsstreitigkeiten noch Jahre lang hinziehen. Doch es scheint, als wäre Crowdstrike mit einem blauen Auge davongekommen. Die Schelte des US-Kongress fiel weniger streng aus als erwartet; und auch Crowdstrikes Aktienkurs ist fast wieder auf dem Niveau vor dem IT-Ausfall!

Eines scheint indes sicher: Nicht alle betroffenen Unternehmen werden entschädigt. Laut AGBs muss Crowdstrike lediglich die „gezahlten Gebühren“ erstatten. Das heißt, Nutzer erhalten den Betrag als Entschädigung, den sie vorher an Crowdstrike gezahlt haben – nicht mehr. Der entstandene Schaden ist unerheblich. Wenn er nicht durch eine Cyber-Versicherung abgedeckt wird, bleiben Unternehmen auf den Kosten sitzen. Eine Ausnahme sind große Konzerne. Diese haben evtl. Zusatz-Klauseln mit Crowdstrike ausgehandelt und erhalten mehr Geld.

Nicht nur Crowdstrike, auch Microsoft rückte in den Fokus der Kritik. Schnell wurde die Frage laut: Wie konnte eine einzelne Software das System von Millionen PCs zum Absturz bringen? Microsoft reagierte. Das Unternehmen versprach, externe Entwickler in Zukunft strenger zu kontrollieren.

Somit endet die Geschichte des bisher größten IT-Ausfalls fürs erste. Doch dass dieser kein Einzelfall war, zeigen folgende Beispiele:

Eine Frau die mit einem Koffer bei einem Flughafen sitzt. Im Hintergrund sind durch ein Fenster Flugzeuge zu sehen.

2017: Ausfälle bei British Airways

British Airways wurde nicht nur 2024 Opfer einer IT-Panne. Ein ähnlicher Vorfall ereignete sich am 27. Mai 2017. Wer an diesem Tag einen Flug von Heathrow oder Gatwick gebucht hatte, musste auf dem Boden bleiben. Ganze 400 Flugzeuge der Airline fielen aus. Vor den Schaltern standen Passagiere Schlange und das Gepäck stapelte sich im Terminal. Grund dafür war ein Stromstoß im Rechenzentrum, der das gesamte Computersystem lahmlegte. Fatalerweise hatte British Airways keinen Backup-Plan implementiert, um das System zu schützen. Drei Tage lang dauerten die Ausfälle an. Erst danach konnte der Flugverkehr wieder regulär aufgenommen werden. Doch der finanzielle Schaden blieb: Laut Schätzungen musste British Airways etwa 74 Millionen Euro Entschädigungen zahlen.

2019: Google Cloud-Ausfall

Dass selbst die größten Konzerne nicht vor IT-Ausfällen geschützt sind, zeigt das Beispiel Google. Am 2. Juni 2019 trat eine Störung in Googles Cloud-Plattform auf. Essenzielle Dienste wie Gsuite, Gmail und Youtube blieben unerreichbar. Glück im Unglück: Der 2. Juni war ein Sonntag. Viele Unternehmen waren daher nicht auf die Google-Dienste angewiesen. Schlimmer traf es Nutzer, die ihr Smart Home mit Google Nest ausgestattet hatten. Durch den Ausfall wurden Klimaanlagen lahmgelegt. Türschlösser ließen sich auf einmal nicht mehr öffnen und sperrten ihre Besitzer aus. Zum Glück war der Spuk nach etwa vier Stunden vorbei. Auch zur Ursache äußerte sich Google prompt. Laut Stellungnahme hatten Techniker routinemäßige Wartungsarbeiten durchgeführt. Eine unglückliche Kombination von Fehlern sorgte dann dafür, dass das Netzwerk überlastet wurde. In diesem Fall war der Fehler schnell gefunden. Doch der Google Cloud-Ausfall zeigte deutlich, wie abhängig viele Nutzer von den Diensten eines großen Unternehmens sind.

2021: Facebook-Ausfall

Auch Facebook kann auf unrühmliche IT-Ausfälle zurückblicken. Der wohl gravierendste ereignete sich am 4. Oktober 2021. Durch eine veränderte Konfiguration der Backbone-Router kam es zu einer Kettenreaktion. Alle Facebook-Services fielen vorübergehend aus. Betroffen war nicht nur die Social Media-Plattform. Auch Instagram und WhatsApp versagten den Dienst. Fatalerweise waren selbst Facebook-Mitarbeiter betroffen. Sie kamen plötzlich nicht mehr in ihre Büros und hatten keinen Zugriff auf die interne Kommunikation.

Wie Facebook das Problem nach sechs Stunden löste – dazu schweigen die Kalifornier. Gerüchten zufolge wurden Mitarbeiter zu den Servern geschickt, um diese manuell neu zu starten. Alles noch einmal gut gegangen? Vielleicht. Doch dem ohnehin schon angeschlagenen Ruf von Facebook half der IT-Ausfall natürlich nicht. Der Aktienkurs fiel um 5 % und durch weggefallene Werbeeinnahmen gingen etwa 100 Millionen US-Dollar verloren. Dies zeigt, wie dramatisch selbst kurz andauernde IT-Störungen für ein Unternehmen sein können.

2023: IT-Ausfall in Frankfurt

Auch in Deutschland sind wir nicht vor IT-Ausfällen sicher. Das zeigte sich im Februar 2023, als ein Baggerfahrer versehentlich mehrere Glasfaser-Kabel durchtrennte. Internet, Mobilfunk und Festnetz der Telekom brachen zeitweise zusammen. Besonders betroffen vom IT Ausfall war die Lufthansa. Sie musste mehr als 200 Flüge streichen. Tausende Passagiere saßen am Flughafen Frankfurt fest. Erst hieß es, Schuld am Lufthansa IT Ausfall wäre das kaputte Kabel gewesen. Doch die Airline korrigierte sich nachträglich. Eigentlich hätte Lufthansas IT-Notfallplan die Stromversorgung sicherstellen müssen. Warum dieser Notfallplan versagte, ist bis heute ungeklärt.

Ein Binärcode mit einem Error dazwischen ist zu sehen. Zusätzlich ein VW Logo.

2023: IT-Ausfall bei VW

Ein weiterer IT-Ausfall ereignete sich am 27. September 2023. Betroffen war VW. An gleich vier Standorten musste die Produktion für mehrere Stunden eingestellt werden. Grund war – entgegen vielen Befürchtungen – kein Cyber-Angriff, sondern eine Störung im Netzwerk. Diese hatte auch Auswirkungen auf ausländische VW-Standorte sowie die Tochterkonzerne Audi und Porsche. Glück im Unglück: Der Fehler konnte innerhalb eines Tages behoben werden. So hielten sich die Kosten durch Betriebsausfälle in Grenzen.

Die Automobilbranche gilt als besonders anfällig für IT-Pannen – vor allem aufgrund der weltweiten Vernetzung. VW ist kein Einzelfall. Nur einen Monat zuvor musste Toyota seine Produktion einen Tag lang unterbrechen. Der Grund dafür war banal: Einigen Servern war der Speicherplatz ausgegangen, sodass essenzielle Updates nicht installiert werden konnten.

IT-Ausfälle – welche Schutzmaßnahmen gibt es?

All diese Beispiele demonstrieren: Nicht einmal große Konzerne sind vor IT-Ausfällen geschützt. Bei der Komplexität und immer stärkeren Vernetzung heutiger Systeme lassen sie sich nie ganz ausschließen. Manchmal genügt eine Verkettung ungünstiger Umstände, um den Crash zu verursachen.

Im Juli 2024 hatte die Welt noch einmal „Glück“ – in Anführungszeichen. Zum einen war der IT-Ausfall nach etwa 78 Stunden behoben. Zum anderen konnten Experten relativ schnell Entwarnung geben. Es handelte sich um eine versehentliche Störung, und nicht um einen Cyber-Angriff.

Doch ein mulmiges Gefühl blieb: Was wäre, wenn Hacker tatsächlich hinter diesem Ausfall gesteckt hätten? In diesem Fall wäre der Patch zur Problemlösung vermutlich nie geliefert worden. Kaum überraschend wurden schnell Forderungen nach mehr IT-Sicherheit laut. 

Diese richteten sich an Entwickler wie Crowdstrike. Experten forderten mehr Freiheiten beim Aktualisieren von Software. Hätte Crowdstrike seinen Patch z. B. nicht zeitgleich, sondern Stück für Stück ausgerollt, wäre der IT-Ausfall kaum in diesem Ausmaß aufgetreten.

Auch das Thema Cybersicherheit rückte in den Vordergrund. Unternehmen, die einen Notfallplan aufgestellt hatten, konnten den IT-Ausfall wesentlich leichter abfedern. Kaum überraschend gaben nach dem Desaster mehr als 60 % aller Firmen an, nun einen solchen Notfallplan zu entwickeln (Quelle: Bitkom-Studie). Dazu gehören auch regelmäßige Backups, die Segmentierung von Netzwerken und eine redundante Stromversorgung.

Sinnvoll erscheinen diese Maßnahmen in jedem Fall. 2024 mag die Weltwirtschaft noch einmal mit einem blauen Auge davongekommen sein – doch Experten sind sich einig: Der nächste IT-Ausfall ist nur eine Frage der Zeit! 100-prozentige Sicherheit bleibt auch in Zukunft ein Wunschdenken.