Uma pane massiva na nuvem causada pela região US-EAST-1 da Amazon Web Services (AWS), localizada no norte da Virgínia, próxima ao Capitólio dos EUA, provocou interrupções generalizadas em sites e plataformas ao redor do mundo na manhã desta segunda-feira.
A principal plataforma de e-commerce da Amazon, junto a outros serviços como as campainhas inteligentes Ring e a assistente Alexa, enfrentaram quedas e instabilidades durante todo o período.
Além disso, o WhatsApp, da Meta; o ChatGPT, da OpenAI; a plataforma de pagamentos Venmo, do PayPal; diversos serviços da Epic Games; vários sites do governo britânico, entre outras plataformas, também foram afetados.
A causa das interrupções foi identificada nas APIs do banco de dados DynamoDB da AWS, também na região US-EAST-1.
Em atualizações de status, a Amazon informou que o problema estava relacionado especificamente a falhas na resolução de DNS (Domain Name System).
O DNS é um serviço fundamental da internet que funciona como uma lista telefônica automática, convertendo URLs — como www.wired.com — em endereços IP numéricos para que navegadores possam carregar o conteúdo correto.
Problemas na resolução de DNS ocorrem quando os servidores falham em mapear esses endereços corretamente, fornecendo dados incorretos na equivalência nome-endereço.
“Com base em nossa investigação, a falha parece estar vinculada à resolução DNS do endpoint da API do DynamoDB na região US-EAST-1”, informou a AWS nas atualizações.
Pouco depois, a empresa recomendou que usuários “limpassem o cache DNS” caso ainda enfrentassem dificuldades para acessar os serviços do DynamoDB naquela localidade.
Questionada, a AWS não comentou detalhes sobre a origem da falha.
Embora problemas de resolução DNS possam ocorrer por ataques maliciosos, conhecidos como DNS hijacking, não há indicações de que o episódio tenha sido provocado por ação criminosa.
Segundo Davi Ottenheimer, vice-presidente da empresa de infraestrutura de dados Inrupt e especialista em operações de segurança, “quando o sistema não conseguia identificar corretamente o servidor para conexão, falhas em cascata derrubaram serviços pela internet”.
Ele destaca que “a pane da AWS é um exemplo clássico de problema de disponibilidade, mas precisamos começar a encará-la também como uma falha na integridade dos dados”.
Os problemas começaram por volta das 3h (horário de Brasília).
Às 5h22, a AWS anunciou que já havia adotado “mitigações iniciais” e começado a restaurar o serviço.
Às 6h35, a empresa afirmou ter resolvido completamente as questões técnicas subjacentes, alertando, no entanto, que “alguns serviços ainda terão um acúmulo de tarefas a processar, o que pode demandar mais tempo para a completa regularização”.
A AWS já enfrentou outras interrupções graves, incluindo um incidente significativo em 2023.
A dependência de serviços centralizados na nuvem, oferecidos por gigantes como AWS, Microsoft Azure e Google Cloud, trouxe avanços importantes para a segurança e estabilidade globais, ao estabelecer padrões de proteção e melhores práticas para os usuários.
Contudo, essa padronização acarreta vulnerabilidades, pois essas plataformas funcionam como pontos únicos de falha para muitos serviços críticos.
“Os problemas crescentemente estão ligados à integridade dos dados”, afirma Ottenheimer.
“Dados corrompidos, validações falhas ou, como neste caso, resolução incorreta de nomes que compromete tudo que depende dessa base.
Enquanto não entendermos e protegermos melhor a integridade, concentrar-se apenas em manter sistemas ativos é uma ilusão.”
Publicidade
Conheça a Solyd One, e tenha acesso a todos os cursos de segurança ofensiva da Solyd, todas as certificações práticas, incluindo a SYCP, 2 CTFs anuais com prêmios de até 30 mil reais, dezenas de laboratórios realísticos, suporte, comunidade e muito mais. Saiba mais...