close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Am gestrigen Montag trat eine Art Internet-GAU (Größter Anzunehmender Unfall) ein: Ein Fehler in Amazons Server-Infrastruktur hat zahlreiche abhängige Internet-Dienste lahmgelegt. Das betraf nicht nur Amazons eigene Angebote wie Prime, Music und ähnliche, sondern auch Anbieter, die Kapazitäten in Amazons Cloud gebucht haben. Gegen Mitternacht hat Amazon nun Rückkehr zur Normalität gemeldet.

Weiterlesen nach der Anzeige

Status-Update zu Amazon Web Services

Amazon hat das Problem im Status-Update der Cloud-Dienste als gelöst markiert.

(Bild: Screenshot heise medien)

Im Eintrag auf Amazons Cloud-Status-Webseite erklärt das Unternehmen jetzt Ursachen des Ausfalls und deren Lösung. Die Zusammenfassung im Eintrag datiert auf 0:53 Uhr Mitteleuropäischer Sommerzeit am 21. Oktober 2025. Demnach kam es zwischen 8:49 Uhr hiesiger Zeitrechnung und 11:24 Uhr am 20.10.2025 zu „erhöhten Fehlerraten und Latenzen bei den AWS Services in der US-EAST-1-Region“. Zudem erfuhren in diesem Zeitraum Dienste und Funktionen Probleme, die von US-EAST-1-Endpoints abhängen, wie IAM und die DynamoDB Global Tables.

„Gegen 9:26 Uhr konnten wir den Auslöser des Vorfalls als DNS-Auflösungsprobleme in den regionalen DynamoDB-Dienste-Endpoints identifizieren. Nach Lösung der DynamoDB-DNS-Probleme gegen 11:24 Uhr begannen die Dienste, sich zu erholen, jedoch kam es zu nachfolgenden Beeinträchtigungen der internen EC2-Subsysteme, die für das Starten von EC2-Instanzen verantwortlich sind, aufgrund ihrer Abhängigkeit von der DynamoDB“, erklärt Amazon weiter.

Probleme während der Problemlösung

Als die Amazon-Techniker sich durch die EC2-Instanz-Startprobleme wühlten, kam es auch noch zu Beeinträchtigungen der Netzwerk-Loadbalancer-Health-Checks – also Netzwerk-Monitoren –, wodurch es zu weiteren Verbindungsstörungen in mehreren Diensten wie Lambda, DynamoDB und CloudWatch kam. Die Loadbalancer-Health-Checks haben sie gegen 18:38 Uhr wieder in den Griff bekommen.

„Als Teil der Bemühungen, die Dienste wiederherzustellen, haben wir temporär einige Operationen ausgebremst, etwa den Start von EC2-Instanzen, Verarbeiten von SQS-Warteschlangen über Lambda Event Source Mappings und asynchrone Lambda-Aufrufe. Im weiteren Verlauf haben wir das Ausbremsen reduziert und parallel an den Netzwerk-Verbindungsproblemen gearbeitet, bis die Dienste sich vollständig erholt haben. Um 0:01 Uhr am 21.10. kehrten alle AWS-Dienste zum Normalbetrieb zurück“, führt Amazons Techniker-Team weiter aus.

Einige Dienste wie AWS Config, Redshift und Connect haben noch einen Rückstau an Nachrichten, die sie in den kommenden Stunden abarbeiten werden. Amazon kündigt noch einen detaillierteren Bericht als Nachbesprechung des Ereignisses an.

Weiterlesen nach der Anzeige

(dmk)

Dieser Link ist leider nicht mehr gültig.

Links zu verschenkten Artikeln werden ungültig,
wenn diese älter als 7 Tage sind oder zu oft aufgerufen wurden.

Sie benötigen ein heise+ Paket, um diesen Artikel zu lesen. Jetzt eine Woche unverbindlich testen – ohne Verpflichtung!