Fastly afirma que la acción inocente de un cliente activó un error de ‘software’ que causó la caída de internet
La compañía asegura que detectó el fallo, oculto desde hace un mes en un programa informático, solo un minuto después de que se produjera
Un cliente de la compañía de servicios en la nube Fastly provocó inadvertidamente la caída de miles de páginas y servicios en internet este martes a las doce del mediodía, hora española. El fallo se produjo cuando el usuario cambió su configuración del servicio de forma totalmente correcta. Sin embargo, su acción activó un error informático que llevaba un mes oculto en el software de la compañía y que hundió el 85% de su red. El vicepresidente de Ingeniería e Infraestructura de Fastly, Nick Rockwell, ha dado los detalles de la caída en un ...
Un cliente de la compañía de servicios en la nube Fastly provocó inadvertidamente la caída de miles de páginas y servicios en internet este martes a las doce del mediodía, hora española. El fallo se produjo cuando el usuario cambió su configuración del servicio de forma totalmente correcta. Sin embargo, su acción activó un error informático que llevaba un mes oculto en el software de la compañía y que hundió el 85% de su red. El vicepresidente de Ingeniería e Infraestructura de Fastly, Nick Rockwell, ha dado los detalles de la caída en un mensaje publicado este miércoles por la compañía.
Fastly desplegó software nuevo el 12 de mayo. Allí, oculto, había un error informático que solo podía “activarse con una configuración de cliente específica y bajo determinadas circunstancias”, escribe Rockwell. Ese conjunto de casualidades se dio este 8 de junio. Es como si hubiera un imperceptible agujero en la estructura de un edificio y poco después de haberlo terminado un residente colgara un cuadro justo ahí e hiciera que todo se viniese abajo.
Fastly encontró el error a las 11.48, un minuto después del inicio del desastre, según Rockwell. Al cabo de 10 minutos habían publicado ya el primer comunicado. A las 12.27, siempre hora española, encontraron dónde estaba el problema de configuración del cliente y otros 10 minutos después sus servicios empezaron a recuperarse. Fue la media hora más larga en la historia de Fastly, el día que en su empresa, vital para muchos medios de comunicación y servicios de internet, se hizo famosa.
Fastly es una compañía llamada de red de distribución de contenidos (CDN, en sus siglas habituales en inglés). Su función es distribuir servicios en internet por miles de puntos locales en todo el mundo para acercar las páginas a los usuarios finales.
“Aunque fueron unas condiciones específicas las que provocaron la caída, deberíamos haberlo anticipado”, detalla Rockwell. “Proporcionamos servicios críticos y tratamos cualquier acción que cause problemas en los servicios con la mayor sensibilidad y prioridad”, añade. Fastly es junto a Cloudflare y Akamai una de las pocas compañías realmente globales que sostiene internet. Como se vio este martes, la estructura global de la red depende a varios niveles de pocos proveedores.
Esta descentralización ya se produce e incluso se promueve entre las empresas, como dice Andy Champagne, vicepresidente de Akamai, competidora clave de Fastly, al comentar la caída de este martes: “El uso de múltiples CDN es algo que se ha vuelto cada vez más común”, dice en un comunicado compartido por su empresa. “En teoría, las CDN múltiples proporcionan a las empresas un respaldo en caso de que una de ellas tenga un problema, pero no es una estrategia a prueba de balas. Debe aplicarse el mismo rigor a la hora de contratar proveedores incluso cuando se utilizan varias CDN, ya que la división no garantiza un tiempo de actividad del 100% para los clientes. Si una CDN sufre una interrupción, suele ser necesaria la intervención manual para dirigir el tráfico a otra CDN, no es algo automático”.
Aparte de que el servicio seguiría repartiéndose entre los dominadores del mercado, el problema al que se refiere Champagne es que levantar una estructura de software para los clientes de las CDN para redireccionar el tráfico en una caída de menos de una hora, requiere un esfuerzo considerable. Y, hasta que no haya caídas peores, sale poco a cuenta.
Puedes seguir a EL PAÍS TECNOLOGÍA en Facebook y Twitter o apuntarte aquí para recibir nuestra newsletter semanal.