Amazon Web Services skaidro plašās interneta pārtraukuma cēloņus
Šonedēļ plašu satraukumu izraisījušais Amazon Web Services (AWS) serveru darbības traucējums, kas skāra tūkstošiem uzņēmumu un miljoniem lietotāju, beidzot ir saņēmis oficiālu skaidrojumu no paša AWS. Kā atklājies, problēmas sakne meklējama kļūdā automatizācijas programmatūrā, kas radīja kaskādes efektu, paralizējot virkni svarīgu tiešsaistes pakalpojumu, sākot no bankām un valsts iestāžu portāliem līdz pat sociālajiem tīkliem un ēdienu piegādes platformām.
DNS sistēmas defekts radīja domino efektu
AWS paziņojumā detalizēti apraksta, ka centrālā problēma bija saistīta ar piekļuvi DynamoDB – kritiski svarīgai sistēmai, kurā tiek glabāti klientu dati. Šī piekļuve tika bloķēta, jo radās “latent defekts” automātiskajā domēnu vārdu sistēmas (DNS) pārvaldībā. DNS, ko var salīdzināt ar interneta telefongrāmatu, ir atbildīga par cilvēkiem saprotamu vietņu nosaukumu (piemēram, www.amazon.com) pārvēršanu datoriem saprotamās IP adresēs, kas nepieciešamas ierīču savstarpējai savienošanai tīklā. Problēma radās, kad AWS DNS automatizācijas sistēma kļūdaini dzēsa DNS ierakstus savam reģionālajam galapunktam. Tas nozīmēja, ka AWS nespēja savienoties ar DynamoDB un citiem pakalpojumiem.
Manuala iejaukšanās nepieciešama, lai novērstu kļūdu
Diemžēl šī programmatūras kļūda nebija spējīga automātiski sevi salabot, un problēmas novēršanai bija nepieciešama operatoru tieša, manuāla iejaukšanās. Šie traucējumi visvairāk skāra galvenos AWS pakalpojumus Ziemeļvirdžīnijas reģionā, kur atrodas daļa no Amazon galvenajām mītnes ēkām. Lai gan pašas tehniskās problēmas tika novērstas dažu stundu laikā, pilns interneta pakalpojumu darbības traucējumu laiks sasniedza pat 14,5 stundas. Ziņots, ka kopumā problēmas skāra vairāk nekā 8 miljonus cilvēku.
Ietekmēto pakalpojumu plašais spektrs un nākotnes pārdomas
Saskaņā ar Downdetector datiem, starp aptuveni 2000 skartajām vietnēm un lietotnēm bija tādi zināmi pakalpojumi kā Signal, Roblox, Snapchat, kā arī Apvienotās Karalistes nodokļu un muitas dienesta tīmekļa vietne. Šis plašais traucējums izraisīja diskusijas tehnoloģiju ekspertu vidū par Eiropas pārmērīgo atkarību no viena mākoņpakalpojumu sniedzēja, kā arī mudināja uz padziļinātām pārdomām par nepieciešamību attīstīt savus, neatkarīgus mākoņplatformu risinājumus.