La gestión de fallas es un término comúnmente utilizado en telecomunicaciones que se refiere al proceso de detectar, identificar y, en última instancia, resolver cualquier problema que esté disminuyendo la eficiencia de las comunicaciones dentro de una red. La idea es corregir las fallas lo más rápido posible y restaurar la red a su funcionalidad completa. Este mismo concepto básico se puede aplicar a la gestión de una red empresarial interna, así como a un sistema de comunicaciones que procesa voz y datos en una nación o grupo de naciones.
Hay una serie de procesos que ayudan a realizar una gestión de fallos eficaz. Herramientas como los programas de software de diagnóstico y los procesos de prueba de secuencia son dos ejemplos de medidas proactivas tomadas para aislar y corregir fallas antes de que los usuarios de la red se vean afectados negativamente. Con un servicio de teleconferencia, los diagnósticos en los puentes de conferencia a menudo pueden identificar un canal o puerto conectado al puente que está comprometido de alguna manera. Esto hace posible deshabilitar ese puerto para que el sistema no lo seleccione como punto de terminación para una llamada entrante. El puerto permanece deshabilitado y no está disponible para su uso hasta que se corrija el mal funcionamiento, lo que evita que los clientes de la oficina de conferencias telefónicas sufran molestias.
Junto con la identificación y corrección de fallas en las telecomunicaciones, el proceso de administración de fallas también puede ser efectivo en la administración de redes que están en operación como parte de la red interna de una empresa. Aquí, el propósito de la gestión de fallas es corregir cualquier problema que amenace con interrumpir las tareas en curso que permiten que la empresa funcione. Esto incluye administrar y corregir fallas asociadas con servidores, estaciones de trabajo o cualquier otro componente que sea parte de esa red. Las copias de seguridad y los diagnósticos regulares ayudan a resolver problemas antes de que tengan la oportunidad de interferir con la operación comercial, mientras que las herramientas como los archivos de registro permiten revisar los eventos que tienen lugar e interrumpir temporalmente el sistema. Los registros de errores son especialmente útiles para aislar los orígenes de varios tipos de excepciones o fallas y corregirlos lo más rápido posible.
Muchos programas de gestión de fallos proporcionan lo que se conoce como notificaciones de detección de errores. Este es simplemente un mensaje entregado a un administrador de que algo no está funcionando correctamente. Algunos programas de administración también incluyen herramientas que permiten corregir la falla inmediatamente, después de que un administrador otorgue el permiso, una característica que también ayuda a limitar la cantidad de tiempo de inactividad experimentado debido a algún tipo de mal funcionamiento.