Een grootschalige storing bij AWS heeft wereldwijd impact op digitale diensten. Bedrijven en consumenten ondervinden enorme hinder doordat applicaties en infrastructuur niet beschikbaar zijn. In Nederland zijn er ook problemen, onder andere met DigiD en de Belastingdienst. De oorzaak wordt nog onderzocht door Amazon.
Amazon Web Services (AWS) ligt eruit. De storing begon in de vroege ochtend in de VS en trof direct een breed scala aan platforms. Canva, Duolingo, Fortnite, Roblox, Signal, Snapchat, Tripadvisor, de lijst gaat door. Ook Amazon zelf en Alexa-apparaten functioneerden niet naar behoren. Volgens Amazon’s statuspagina onderzoekt het bedrijf ‘increased error rates and latencies for multiple AWS services in the US-EAST-1 Region.’
‘Perplexity is down right now,’ bevestigde Aravind Srinivas, ceo van Perplexity, op X volgens MSN. De massale problemen laten zien wat de concentratierisico’s zijn die ontstaan door de afhankelijkheid van een beperkt aantal hyperscalers. Wanneer een kernregio van AWS uitvalt, heeft dat direct gevolgen voor duizenden bedrijven die hun workloads in deze infrastructuur draaien.
Nederlandse overheid ook geraakt
Naast de directe impact op consumentenapps zijn ook zakelijke toepassingen geraakt. Zo zouden er problemen zijn met Amazon DynamoDB en Elastic Compute Cloud, belangrijke bouwstenen voor talloze saas-oplossingen. Downdetector meldt via diens Nederlandse tak ook talloze meldingen, waaronder overheidsplatforms zoals de Belastingsdienst en DigiD, KPN en banken als ABN Amor, ING en Rabobank.
Hoewel AWS nog geen definitieve oorzaak heeft genoemd, zal de complexiteit van grootschalige cloudinfrastructuur ongetwijfeld een rol hebben gespeel. Zo kan een simpele fout in netwerkconfiguratie of identity- en accessmanagement al snel leiden tot kettingreacties. Voor organisaties die sterk leunen op één regio of provider, zijn de gevolgen dan direct voelbaar. De storing bevestigt maar weer eens dat afhankelijkheid van de cloud niet alleen maar operationele voordelen biedt.
[ UPDATE 13:30 ]
AWS meldt dat de storing, in de US-EAST-1 regio (Noord-Virginia), grotendeels is verholpen. ‘We kunnen bevestigen dat wereldwijde services en functies die afhankelijk zijn van US-EAST-1 ook hersteld zijn. We blijven werken aan een volledige oplossing en zullen updates verstrekken zodra we meer informatie hebben,’ aldus Amazon op het Health Dashboard. Het bedrijf waarschuwt dat er nog wel sprake kan zijn van nasleep en verhoogde latencies bij sommige workloads. De verwachting is dat in de loop van de middag de platforms weer in hun normale doen zijn. ‘Als u nog steeds problemen ondervindt bij het oplossen van de DynamoDB-service-eindpunten in US-EAST-1, raden we u aan uw DNS-caches te legen,’ aldus het bedrijf. Ook wordt nog gewerkt aan ‘volledig herstel van EC2-opstartfouten, die zich kunnen manifesteren als een ‘Insufficient Capacity Error’’.
Lijkt er op dat een hele Region uitviel, met alle Availabiltiy Zones daarbinnen.
Of in ieder geval een hoop diensten in die Region.
Best bijzonder want:
us-east-1 is the AWS region code for US East (N. Virginia), located in Northern Virginia, United States. It’s the default region for many AWS services and is the oldest and largest AWS region. It’s home to a significant number of data centers and AWS infrastructure, and its large footprint means it serves as the default for many operations.
“Hoewel AWS nog geen definitieve oorzaak heeft genoemd, zal de complexiteit van grootschalige cloudinfrastructuur ongetwijfeld een rol hebben gespeel. Zo kan een simpele fout in netwerkconfiguratie of identity- en accessmanagement al snel leiden tot kettingreacties.”
Benieuwd of deze verklaring van AWS zelf komt. Ik verwacht van niet.
AWS staat immers bekend om zijn sterke design en betrouwbaarheid.
Daarom lijkt mij dit het commentaar van een klant die de eigen keuzes tbv availability zelf moeilijk vindt.
Benieuwd wat de analyses achteraf zullen zijn.
Begrijpend lezen begint met: “Hoewel AWS nog geen definitieve oorzaak heeft genoemd…” Dus ja,, er is sprake van redactionele aannames zoals je zelf ook doet als ik kijk naar je opvolgende reactie.
Zo’n 100 diensten geraakt lees ik op de AWS status page.
maar ook:
Oct 20 3:03 AM PDT We continue to observe recovery across most of the affected AWS Services. We can confirm global services and features that rely on US-EAST-1 have also recovered. We continue to work towards full resolution and will provide updates as we have more information to share.
Blijkbaar is een aantal global services (worldwide dus niet regio gebonden services) ook afhankelijk van die speciale regio en precies die heeft/had problemen. Daar kun je als klant niets aan doen. Geen beste beurt van AWS.