El tiempo medio entre fallas es una medida de la cantidad de tiempo promedio que tiene lugar entre fallas catastróficas del sistema en un sistema informático. Para calcular el tiempo medio entre fallas, un sistema debe funcionar y luego fallar. Luego, el sistema se repara y se vuelve a poner en funcionamiento, donde eventualmente volverá a fallar. El tiempo entre estas fallas es el primer valor en el tiempo medio; a medida que el sistema acumula más fallas, el tiempo medio se vuelve más preciso.
Hay dos términos básicos que componen este concepto: tiempo medio y fracaso. El tipo de media al que se hace referencia es una media aritmética, más conocida como media. Como ocurre con todos los promedios, cuantos más números se utilicen para calcular el promedio, más preciso será el resultado final. Dado que los sistemas informáticos no fallan constantemente, el tiempo medio es generalmente un promedio de una gran cantidad de sistemas diferentes que se utilizan y construyen de manera similar.
La otra gran parte del término es el fracaso. En términos informáticos, existen muchos tipos diferentes de fallas. En este caso, la falla es un apagado total del sistema. El sistema está roto más allá de su capacidad para continuar funcionando y debe repararse antes de que pueda volver a funcionar. Si una sola parte de la computadora falla, como una sola tarjeta de memoria, no se considera una falla al calcular el tiempo medio entre fallas. Además, el tiempo de inactividad programado, como el mantenimiento, no es una falla.
Estos valores se utilizan a menudo como una señal de advertencia temprana de problemas de hardware no diagnosticados. Si el tiempo medio de un sistema entre fallas es muy bajo, entonces obviamente hay un problema en el sistema en alguna parte. Los diseñadores de computadoras también analizan qué causó la falla además del período de tiempo. Esto proporciona una indicación más clara de dónde puede existir el problema y qué debe suceder para que se solucione.
El personal de mantenimiento usa el tiempo promedio entre fallas para diseñar su programa de mantenimiento del sistema. Si un sistema está presionando su tiempo medio mientras que otro está a meses de distancia, es más fácil determinar en qué sistema trabajar primero. Una revisión y revisión completa no restablecerá técnicamente el tiempo medio de un sistema, pero debería crear intervalos más largos entre fallas, aumentando efectivamente el tiempo medio.
El valor del tiempo medio entre fallas es solo uno de los muchos valores que se utilizan en la industria informática y de fabricación para indicar fallas del sistema. Otros términos comunes incluyen el tiempo medio hasta la falla, el tiempo que tarda en fallar catastróficamente la primera vez y el tiempo medio entre fallas críticas para fallas que son importantes, pero que no desconectan el sistema. También hay un tiempo medio entre el reemplazo de la unidad, que mide el tiempo promedio antes de que un sistema deba ser reemplazado por otro.