El pasado viernes se produjo lo que muchos ya han bautizado como "el mayor apagón informático de la historia". Fallaron los sistemas informáticos de miles de empresas e instituciones esenciales, afectando a millones de usuarios a nivel mundial en una crisis sin precedentes. La magnitud de este fallo es difícil de dimensionar: retrasos y cancelaciones de cientos de miles de vuelos, hospitales que se enfrentaron a la interrupción de sus sistemas informáticos, entidades bancarias con dificultades operativas o supermercados y farmacias con problemas para atender a sus usuarios.
¿Qué pasó realmente? La gran empresa de seguridad CrowdStrike publicó una actualización de su sistema de seguridad avanzado denominado Falcon con un grave fallo que provocó que, si se ejecutaba en sistemas operativos Windows de Microsoft, automáticamente los equipos dejaban de funcionar y se bloqueaban mostrando el famoso ‘pantallazo azul’.
¿Por qué ha tenido un impacto tan global y en empresas tan grandes? El sistema Falcon es un sistema de seguridad utilizado por grandes empresas y fueron muchos los sistemas afectados, pero entre ellos, destaca la importancia de que afectase a Azure. Azure es la plataforma de servicios en la nube creada por Microsoft utilizada por cientos de miles de empresas y pymes. De hecho, se calcula que aproximadamente el 20% de los sistemas informáticos en la nube a nivel mundial utilizan Azure. Azure se compone de más de 300 datacenters, que son grandes centros de datos distribuidos globalmente, y algunos de ellos quedaron inoperativos durante horas, con lo que todos los programas informáticos que dependían de dichos centros de datos dejaron de funcionar.
¿Fue un ataque informático? Según las fuentes oficiales de CrowdStrike no fue ningún tipo de ataque informático, sino simplemente un fallo de programación interno que nunca debería haberse publicado. Paradójicamente lo que es un software de seguridad avanzada que se encarga de detectar y controlar posibles ataques informáticos, se ha convertido en uno de los peores problemas informáticos de la historia a nivel global. Tanto esfuerzo en proteger y controlar a los atacantes externos y el peor enemigo del sistema estaba en casa.
¿Por qué tardarán días en restablecerse totalmente los servicios? Afortunadamente la solución para poder restablecer el servicio de los ordenadores afectados no es especialmente compleja ya que, simplemente borrando un fichero determinado, los equipos informáticos ya vuelven a ejecutarse de manera normal. El problema radica en que es un proceso que debe hacerse de manera manual y, si tienes 5 ordenadores, es relativamente fácil recuperarlos, pero en el momento que tienes miles de equipos a corregir y, donde en ocasiones no tienes acceso directo a dichos equipos, es cuando se complica el proceso de vuelta a la normalidad.
¿Puede volver a ocurrir? Teniendo en cuenta que lo que ha ocurrido en esta ocasión no ha sido un ataque informático sino un fallo de programación, es extremadamente improbable que vuelva a ocurrir de nuevo. Ha habido fallos gravísimos en los controles de calidad de CrowdStrike, por ello es evidente que se realizarán las acciones oportunas para que no pueda repetirse en un futuro.
Este artículo ha sido escrito un día después de que ocurriera este grave problema informático y, de momento, la versión oficial de CrowdStrike sigue siendo que fue un fallo informático provocado a nivel interno lo que provocó este caos mundial. A los que nos dedicamos al desarrollo de software, no deja de sorprendernos que sea este el motivo real de lo ocurrido. Los programadores tenemos una gran responsabilidad en todo el código que creamos, pero a medida que la empresa es más grande, mayores controles de calidad se van aplicando para que el software que finalmente llega al público general sea de total calidad y fiabilidad. Si a ello le añadimos que la empresa encargada es una de las más importantes a nivel mundial en materia de seguridad de la que dependen millones de usuarios, no puedo terminar de comprender cómo un fallo tan grave pudiera pasar inadvertido por todos los departamentos de calidad llegando incluso a producción. Veo bastante probable que en los próximos días surjan nuevas informaciones sobre lo sucedido.
Santiago BarroVocal del comité ejecutivo de TuristecFundador y gerente de Binary Menorca