Qual è il tempo medio tra i guasti?

Il tempo medio tra i guasti è una misura della quantità media di tempo che intercorre tra i guasti catastrofici del sistema in un sistema informatico. Per calcolare il tempo medio tra i guasti, un sistema deve funzionare e poi guastarsi. Il sistema viene quindi riparato e rimesso in funzione, dove alla fine si guasterà di nuovo. Il tempo tra questi guasti è il primo valore nel tempo medio: man mano che il sistema accumula più guasti, il tempo medio diventa più preciso.

Ci sono due termini fondamentali che compongono questo concetto: tempo medio e fallimento. Il tipo di media a cui si fa riferimento è una media aritmetica, meglio conosciuta come media. Come per tutte le medie, più numeri vengono utilizzati per calcolare la media, più accurato è il risultato finale. Poiché i sistemi informatici non si guastano costantemente, il tempo medio è generalmente una media di un gran numero di sistemi diversi che vengono tutti utilizzati e costruiti in modo simile.

L’altra grande parte del termine è il fallimento. In termini informatici, ci sono molti diversi tipi di errore. In questo caso, l’errore è un arresto totale del sistema. Il sistema è guasto oltre la sua capacità di continuare a funzionare e deve essere riparato prima che possa tornare in servizio. Se una singola parte del computer si guasta, come una singola memory stick, non viene considerata un errore nel calcolo del tempo medio tra i guasti. Inoltre, i tempi di fermo programmati come la manutenzione non sono un fallimento.

Questi valori vengono spesso utilizzati come segnale di avvertimento precoce di problemi hardware non diagnosticati. Se il tempo medio tra i guasti di un sistema è molto basso, allora c’è ovviamente un problema nel sistema da qualche parte. I progettisti di computer esaminano anche ciò che ha causato l’errore oltre alla durata. Ciò fornisce un’indicazione più chiara di dove potrebbe esistere il problema e cosa deve accadere per risolverlo.

Il personale di manutenzione utilizza il tempo medio tra i guasti per progettare il proprio programma di manutenzione del sistema. Se un sistema sta spingendo il suo tempo medio mentre un altro è a mesi di distanza, rende più facile determinare su quale sistema lavorare per primo. Una revisione e un check-up completi non ripristineranno tecnicamente il tempo medio di un sistema, ma dovrebbero creare intervalli più lunghi tra i guasti, spingendo effettivamente il tempo medio più in alto.

Il valore del tempo medio tra i guasti è solo uno dei tanti valori utilizzati nell’industria informatica e manifatturiera per indicare i guasti del sistema. Altri termini comuni includono il tempo medio fino all’errore, il tempo necessario per un errore catastrofico la prima volta e il tempo medio tra gli errori critici per gli errori importanti, ma che non portano il sistema offline. C’è anche il tempo medio tra la sostituzione dell’unità, che misura il tempo medio prima che un sistema debba essere sostituito da un altro.