La interrupción tecnológica mundial mostró que estamos a un solo error de distancia del caos

Una versión de esta historia apareció en el boletín Nightcap de CNN Business. Para recibirlo en tu bandeja de entrada, regístrate gratis. aquí.


Nueva York
CNN

En caso de que los acontecimientos recientes (un intento de asesinato, un nuevo candidato republicano a la vicepresidencia, el presidente en funciones que contrajo Covid antes de abandonar su intento de reelección) no lo hayan dejado lo suficientemente ansioso por la fragilidad del orden global, no olvidemos que una empresa de ciberseguridad de la que probablemente nunca haya oído hablar cometió un gran error que demostró cómo Internet podría, sin previo aviso, simplemente detenerse.

Aunque quizás no lo supieras El nombre CrowdStrike antesEs poco probable que lo olvides pronto. Con un solo error en una actualización de software de rutina, la empresa desencadenó lo que probablemente era La mayor interrupción informática de la historia — creando el tipo de colapso tecnológico que sus productos están diseñados para prevenir.

Aunque CrowdStrike dijo que la actualización defectuosa se había revertido, los problemas que causó no son exactamente las antiguas soluciones de “apagar y encender de nuevo” a las que la mayoría de nosotros estamos acostumbrados. Como dijo mi colega Brian Fung informóEl error que hace que las computadoras Windows entren en modo de pantalla azul de la muerte se puede solucionar, pero en muchos casos requiere un trabajo minucioso por parte de un ser humano.

Ahora podría ser un buen momento para comprarle a su personal de TI un buen café y una pasta para bagels porque todos y cada uno de los dispositivos afectados (para algunas organizaciones, estamos hablando de miles) probablemente tendrán que ser evaluados por un administrador y reiniciados en modo seguro, y luego el archivo ofensivo se puede eliminar manualmente.

“No se puede automatizar eso”, dijo Kevin Beaumont, investigador de seguridad y ex analista de amenazas de Microsoft, en una publicación en X“Esto va a ser increíblemente doloroso para los clientes de CrowdStrike”.

E incluso si su negocio no tuviera nada que ver con CrowdStrike, la interrupción podría haber arruinado su día.

Pensemos en una cafetería que utiliza servicios de reserva en línea de terceros, contrata a terceros para que le envíen sus pedidos y acepta tarjetas de crédito y débito a través de su punto de venta, que está conectado a sistemas de procesamiento de pagos. No hacía falta ser cliente de CrowdStrike para verse perjudicado por el error de la empresa, y eso es lo que hizo que la interrupción del servicio del viernes fuera tan frustrante.

Hemos tenido cortes de servicio aterradores antes y seguramente los volveremos a tener. Pero la magnitud del corte de CrowdStrike vuelve a poner de relieve lo interconectado que se ha vuelto el mundo a través de una red que casi ninguno de nosotros comprende y que en gran medida se autorregula.

“Hay organizaciones de las que dependemos tanto que ni siquiera nos damos cuenta de cuán dependientes somos hasta que dejan de funcionar”, dijo Stuart Madnick, profesor de tecnología de la información en la Escuela de Administración Sloan del MIT.

Microsoft estimó que la interrupción del servicio CrowdStrike afectó a unos 8,5 millones de dispositivos Windows. Las aerolíneas cancelaron 5.000 vuelos en todo el mundo el viernes, mientras que los retrasos persistieron durante el fin de semana y el lunes. Los hospitales y los servicios gubernamentales se vieron limitados y en algunas zonas las comunicaciones del 911 dejaron de funcionar.

Sería fácil culpar a CrowdStrike por su descuidada actualización del sistema, a las aerolíneas por no crear protocolos de respaldo sólidos o incluso a Microsoft por dominar el mercado de las computadoras personales, pero los expertos en TI me dijeron que hay problemas sistémicos más amplios en juego.

La naturaleza centralizada de las empresas de ciberseguridad implica que ahora tenemos “algunos puntos de falla importantes”, dijo Anil Khurana, director ejecutivo del Centro Baratta para Negocios Globales de la Escuela de Negocios McDonough de Georgetown. “Eso en sí no es malo, porque la proliferación en realidad dificulta aún más el diagnóstico”.

Pero las empresas necesitan “un modelo mejor de redundancia operativa y copias de seguridad”, dijo Khurana. “Nuestras plataformas tecnológicas tienen una combinación de sistemas heredados acoplados a sistemas modernos, lo que significa que el eslabón más débil determina el rendimiento general del sistema. Lo llamo un modelo de ‘castillo de naipes’”.

En este momento, existen salvaguardas, pero los reguladores de todo el mundo han estado durmiendo en la cama en lo que respecta a la gestión de riesgos de ciberseguridad. Los sistemas de TI son infraestructuras verdaderamente críticas, dijo Khurana, lo que sugiere que “deberían pasar por el mismo tipo de rigor, pruebas y supervisión que vemos en empresas como Boeing o JPMorgan”.

Le pregunté a Madnick si el mundo debería esperar más cortes masivos.

“Esto ya es bastante malo”, dijo. “¿Podría empeorar? La respuesta es sí, podría hacerlo”.

Por más costoso y lento que sea el reinicio manual de millones de dispositivos, la interrupción del viernes fue, en última instancia, un error aislado de una empresa que actuó rápidamente para solucionarlo.

Un mal actor que busque causar daños graves podría usar software para “hacer que las computadoras u otros equipos exploten, se incendien, se quemen; en cuyo caso, no solo se reinicia, se destruye”.

Vale, hay un escenario de pesadilla que nos haría a todos desear irnos a vivir a una cueva. Pero antes de que empieces a acumular alimentos enlatados, Madnick tiene otra forma de ver nuestra situación actual.

“Estas tecnologías nos brindan muchos beneficios que realmente valen la pena el 99 % de las veces”, afirmó. Lo más importante es estar preparado para ese 1 % de ocasiones en las que las cosas salen mal.

Fuente