Amazon Web Servicesin (AWS) hiljattainen käyttökatkos on avannut uudelleen perustavanlaatuisen kysymyksen: kuinka kauan maailman digitaalinen infrastruktuuri on riippuvainen yhdestä ainoasta vikaantumisesta? Katkos, joka vaikutti yli 2 500 yritykseen ja palveluun ympäri maailmaa, aiheutti arviolta 2,5 miljardin dollarin vahingot. Ja kaikki johtui ongelmista yhdellä palvelinalueella – US-EAST-1:llä Pohjois-Virginiassa. 

Mitä oikeastaan ​​tapahtui? 

Kriittinen katkos AWS-datakeskuksen verkkoytimessä aiheutti internetin ”puhelinluettelon” eli DNS-järjestelmän kaatumisen. Keskeinen tietokantapalvelu DynamoDB lakkasi toimimasta, minkä seurauksena sovellukset ja palvelut eivät löytäneet tietolähteitään. Seurauksena oli sähkökatkosta muistuttava ketjureaktio – ylikuormitus yhdestä pisteestä levisi järjestelmän muihin osiin. 

Toiminnan palauttaminen kesti useita tunteja ja vaati manuaalisia toimia ja niin sanottua ”nopeuden rajoittamista” eli toiminnan tilapäistä hidastamista infrastruktuurin vakauttamiseksi. 

AWS

Ketä tämä vaikutti? 

Vaikutukset olivat laaja-alaisia. Katkos ei vaikuttanut ainoastaan ​​suosittuihin sovelluksiin, kuten Snapiinchat, Reddit, Fortnite tai PlayStation Verkko, mutta myös kriittiset palvelut, kuten pankkitoiminta, koulutus, liikenne ja julkishallinto. Esimerkiksi Britannian verovirasto HMRC, lentoyhtiöt United AirLines ja Delta tai koulutusalusta Canvas olivat tilapäisesti poissa käytöstä. Jopa Valioliigan automaattisten paitsiopäätösten teknologia petti. 

Mitä pitää muuttaa? 

Perustavanlaatuinen kysymys on edelleen, miksi niin monet keskeiset palvelut ovat riippuvaisia ​​yhdestä palvelinalueesta. Historialliset syyt nesttoimii tällaisen riskikeskittymän perusteluna. On olemassa kaksi pääratkaisua: 

  • Pakollinen monialueinen arkkitehtuuri – Keskeisiä palveluita tulisi käyttää rinnakkain useilla maantieteellisillä alueilla, jotta käyttökatkoksen sattuessa on mahdollista välittömästi siirtyä varainfrastruktuuriin. 
  • Sääntelytoimenpiteet – Hallitusten tulisi asettaa tiukemmat säännöt kriittisten digitaalisten palvelujen toiminnalle, mukaan lukien vaatimukset varasuunnitelmille ja muulle.clouduusia strategioita.

turvallisuutta

Mitä käyttäjä voi tehdä? 

Yksilöiden tulisi harkita siirtymistä laitteisiin, jotka toimivat ilman internetyhteyttä. cloudu. Esimerkiksi protokollapohjaiset teknologiat Matter Ne mahdollistavat älykodin paikallisen hallinnan ilman etäpalvelimien käyttöä. Pitkällä aikavälillä on kuitenkin ratkaisevan tärkeää, että käyttäjät vaativat palveluntarjoajilta korkeampaa redundanssia – mieluiten kuluttajavalintojensa kautta. 

Tämä tapaus on jälleen yksi todiste siitä, että internetin infrastruktuuri kaipaa perusteellista uudistusta. Jos mikään ei muutu, tulemme jatkossakin näkemään tilanteita, joissa ”Kun AWS yskii, puolet internetistä saa flunssan”.