
Siga ZDNET: Agréganos como tu fuente preferida Google.
Puntos importantes de ZDNET
Una importante interrupción de AWS afectó a sitios web, aplicaciones y servicios en todo el mundo. Este problema se debió a una falla de DNS en la región US-East-1 de AWS. En su última actualización, Amazon dijo que la interrupción de AWS se resolvió.
Servicios web de Amazon (AWS) es la columna vertebral de gran parte de la Internet moderna. Temprano el lunes por la mañana, alrededor de las 12:11 a.m. ET; sufrió un gran corte de energíaelimina toneladas de sitios web, aplicaciones y plataformas en línea en todo el mundo. La interrupción se produjo en la región crítica de EE. UU. Este-1 de AWS en el norte de Virginia, su centro de datos más grande e importante.
Amplias desaceleraciones y tiempos de espera
AWS reconoció este problema por primera vez cuando detectó mayores tasas de error y latencias en varios de sus servicios clave, incluidos EC2, Lambda y la tecnología de base de datos en la nube de Amazon, DynamoDB. Luego, los ingenieros identificaron un problema de resolución del sistema de nombres de dominio (DNS) que afectaba al punto final de la API de DynamoDB, lo que afectó a todo el sistema dependiente.
Además: el plan de Europa para eliminar a los gigantes tecnológicos estadounidenses se basa en el código abierto y gana impulso
Sí, eso es correcto. El viejo chiste tecnológico de que siempre que hay un problema con su red, el DNS siempre es el culpable se ha vuelto cierto una vez más.
A medida que la interrupción se intensificaba, el Panel de estado del servicio de AWS confirmó que 28 servicios individuales de AWS se vieron afectados, lo que provocó desaceleraciones y tiempos de espera generalizados en todas las operaciones de la nube.
El impacto se extendió a sectores clave, cortando el acceso a las principales plataformas de consumo como Snapchat, Ring, Alexa, Roblox y Hulu, así como a servicios financieros y de inteligencia artificial como Coinbase, Robinhood y Perplexity. Amazon.com y Prime Video también experimentaron cortes parciales.
Se informó que los principales bancos, incluido Lloyds Banking Group, y algunas agencias gubernamentales cayeron en el Reino Unido y la UE a medida que la perturbación se extendió más allá de América del Norte.
Artículo relacionado: Los mejores servicios de almacenamiento en la nube: probados por expertos
Según DownForEveryoneOrJustForMe, miles de usuarios comenzaron a informar problemas poco después de las 3 a.m. ET, y a media mañana solo Amazon había registrado más de 14.000 informes de interrupciones. Los sistemas domésticos inteligentes que dependen de AWS, como los timbres Ring y los dispositivos habilitados para Alexa, dejaron de funcionar o perdieron conectividad, lo que pone de relieve la profunda dependencia que muchos hogares y empresas tienen de la nube de Amazon.
Los datos de Downdetector, una empresa propiedad de Ziff Davis, muestran el amplio alcance de la interrupción de AWS de esta mañana. Sólo en las primeras dos horas, se notificaron más de 1 millón de casos en Estados Unidos, seguidos de 400.000 en el Reino Unido. A media mañana, el número total de casos notificados en todo el mundo había aumentado a más de 8,1 millones, de los cuales 1,9 millones provenían de Estados Unidos y 1 millón del Reino Unido.
A la 1:03 p. m., AWS todavía no estaba completamente en buen estado. La compañía informa: “Continuamos aplicando mitigaciones del estado del balanceador de carga de la red para restaurar la conectividad para la mayoría de los servicios de AWS. Lambda está experimentando una falla en la llamada de función porque un subsistema interno se vio afectado por la verificación del estado del balanceador de carga de la red. Estamos tomando medidas para recuperar este sistema Lambda interno. Estamos validando una solución para la falla de la instancia lanzada EC2 y planeamos implementarla en la primera AZ tan pronto como estemos seguros de que podemos solucionarlo”. Sin peligro. “Espere un momento. Puede que tarde algún tiempo.
Artículo relacionado: El futuro de la nube: 8 tendencias a seguir y cuánto costarán
No hace falta decir que las redes sociales se vieron inundadas de quejas de los usuarios y especulaciones, ya que causaron una interrupción en cascada en las operaciones minoristas, de streaming, de juegos y financieras en todo el mundo. Descubrimos que no somos felices sin Internet. ¿Quién lo sabía?
Reducido pero la recuperación es lenta
Los ingenieros de AWS inicialmente centraron su investigación en fallas en las puertas de enlace de la red en la costa este de EE. UU. y dijeron que estaban “trabajando en múltiples caminos paralelos para acelerar la recuperación”.
Amazon dijo La interrupción de AWS se resolvió a las 6:35 a.m. ET, pero algunos servicios como Ring y Chime aún tardaron en recuperarse. Downdetector anunció que a las 12:30 a. m. BST, había registrado más de 6,5 millones de informes en más de 1000 servicios dependientes. Según los datos, más de 2.000 empresas sufrieron interrupciones y alrededor de 280 todavía estaban afectadas a primera hora de la mañana.
Además: ¿La Internet de tu casa es lenta? 3 cosas que siempre reviso primero para obtener velocidades Wi-Fi más rápidas
Luke Kehoe, analista de la industria en Ookla, dijo que el patrón de sincronización en cientos de servicios indica “un incidente central en la nube en lugar de una interrupción aislada de la aplicación”. Dijo que el evento destacó la importancia de la resiliencia y recomendó que las organizaciones distribuyan las cargas de trabajo en múltiples regiones para reducir el impacto de futuras interrupciones.
Daniel Ramírez, director de producto de Downdetector de Ookla, agregó que fallas de este tipo a gran escala son raras, pero pueden ocurrir con mayor frecuencia a medida que las empresas tienden a centralizar datos y operaciones críticas en un único proveedor de nube.
“Este tipo de fallas, en las que el servicio de Internet subyacente interrumpe los servicios en línea generalizados, ocurren sólo unas pocas veces al año”, dijo Ramírez. “La frecuencia probablemente esté aumentando ligeramente a medida que se anima a las empresas a confiar completamente en los servicios de nube y las arquitecturas de datos están diseñadas para aprovechar al máximo plataformas de nube específicas”.
Si resolver el punto final del servicio DynamoDB en US-East-1 no resuelve su problema, Amazon recomienda vaciar su caché DNS. Amazon dijo: “El problema subyacente del DNS se ha mitigado por completo y la mayoría de las operaciones de servicios de AWS ahora son exitosas”. “Es posible que algunas solicitudes se limiten mientras trabajamos para lograr una resolución completa”.
Además: ¿El Wi-Fi de tu casa es malo? Pruebe mis 10 formas de solucionarlo este fin de semana
Amazon probablemente Análisis post-mortem detallado Explicaré qué salió mal en los próximos días.
Reciba las principales noticias de la mañana en su bandeja de entrada todos los días con el boletín Tech Today.