Una falla en cascada es una condición de los sistemas interconectados cuando la falla de una parte o componente puede provocar una falla en áreas relacionadas del sistema que se propaga hasta el punto de una falla general del sistema. Hay muchos tipos de eventos de falla en cascada que pueden ocurrir en sistemas naturales y artificiales, desde sistemas eléctricos e informáticos hasta sistemas políticos, económicos y ecológicos. El campo de investigación conocido como ciencia de la complejidad intenta definir las causas fundamentales de tales fallas a fin de incorporar salvaguardas que puedan prevenirlas en el futuro.
Un tipo de evento de falla en cascada común pero difícil de predecir es un punto único de falla, donde un componente falla e inexplicablemente conduce a un efecto dominó, lo que desencadena una rápida propagación de la condición a otras partes del sistema. Un ejemplo de esto ocurrió en 1996 en Estados Unidos, cuando una línea eléctrica en el estado de Oregon falló y provocó una falla masiva de la red eléctrica en los estados del oeste de Estados Unidos y Canadá, afectando entre 4,000,000 y 10,000,000 de clientes. Cuando la línea de transmisión falló, la red eléctrica regional se dividió en islas de transmisión separadas que no pudieron manejar el aumento de carga, y luego también fallaron, lo que provocó el colapso de todo el sistema. Una falla en cascada similar ocurrió en el estado de Ohio en el medio oeste de EE. UU. En 2003, lo que provocó el mayor apagón eléctrico en la historia de EE. UU.
A menudo, una falla en cascada involucra múltiples sistemas que fallan debido al efecto mariposa, donde un evento aparentemente muy pequeño se propaga para producir uno mucho más grande. Un ejemplo de esto es el accidente de un avión DC-10 sobre París, Francia, en 1974, matando a todos a bordo. Una investigación posterior sobre la causa del accidente reveló que la puerta del compartimento de carga no se había cerrado correctamente. El hombre más directamente responsable de esto supuestamente no sabía leer inglés y, por lo tanto, no pudo leer las instrucciones sobre cómo cerrar correctamente la puerta.
El diseño técnico de la puerta de carga permitió que se cerrara sin que los pestillos estuvieran completamente enganchados. A medida que la aeronave ascendía a 13,000 pies (3,962 metros), la presión interna hizo que la puerta cediera y la descompresión explosiva alrededor de la puerta cuando explotó los controles hidráulicos dañados en el área, lo que hizo que los pilotos finalmente perdieran el control completo del aeronave. La causa raíz de tal falla en cascada es difícil de determinar. Abarca las regiones de educación, políticas gubernamentales para la contratación de inmigrantes, diseños de ingeniería para hidráulica y aviónica y sistemas informales de apoyo social dentro del entorno laboral.
Las redes eléctricas de los sistemas de alto voltaje son el ejemplo más notable de grandes eventos de fallas en cascada, pero las fallas en los grandes sistemas no son raras. Desde los atascos de tráfico hasta los choques del mercado o los incendios forestales que comienzan con una sola chispa, los grandes choques del sistema son a menudo el resultado directo de lo que se conoce como un evento de falla bizantino, donde un elemento de un sistema falla de una manera inusual, a menudo continuando funcionar y corromper su entorno antes de que se apague por completo. Tales eventos revelan una condición subyacente de todos los sistemas complejos descritos por la teoría del caos, que es la dependencia sensible. Se espera que cada parte de un sistema se comporte dentro de un cierto rango de parámetros y, cuando se desvía fuera de ese rango, puede iniciar una reacción en cadena que altera el comportamiento de todo el sistema.
El síndrome de Kessler es un ejemplo entre muchos en los que la ciencia está tratando de adelantarse a la curva y predecir una falla en cascada antes de que ocurra. Basado en las teorías de Donald Kessler en 1978, un científico estadounidense que trabaja para la Administración Nacional de Aeronáutica y del Espacio (NASA), traza los efectos de la colisión de objetos en órbita terrestre baja (LEO). Tales colisiones a lo largo del tiempo impulsarán un aumento exponencial en la cantidad de partículas pequeñas en LEO, conocido como cinturón de escombros, lo que hará que los viajes al espacio sean mucho más riesgosos que antes. Más de 500,000 piezas de escombros en órbita que viajan a hasta 17,500 millas por hora (28,164 kilómetros por hora) se rastrean a partir de 2011 de forma continua para evitar futuras colisiones catastróficas. Una partícula tan pequeña como una canica podría causar un daño irreparable a una nave espacial militar o científica en caso de impacto, lo que resultaría en posibles muertes o impactos políticos y ecológicos de proporciones imprevistas.