L’ottimizzazione della capacità è costituita da metodi diversi e spesso complementari sia per l’archiviazione dei dati sia per la riduzione delle esigenze di archiviazione durante l’esecuzione dei backup. Spesso le aziende e le singole imprese effettuano più backup del lavoro e la necessità di archiviare, indicizzare e recuperare i dati richiede l’ottimizzazione per ridurre la quantità di hardware e il conseguente sovraccarico necessario per gestire tutti quei dati. Quando vengono eseguiti i backup, ci sono spesso ridondanze e solo piccole modifiche tra i backup. Alla luce delle ridondanze, le strategie di ottimizzazione della capacità escogitano soluzioni che riducono i costi di storage e le dimensioni dei backup ridotti rispetto agli originali fino al 95%. L’ottimizzazione della capacità è talvolta nota come ottimizzazione della larghezza di banda quando viene utilizzata in un’applicazione WAN (Wide Area Network) per consentire un maggiore throughput durante la trasmissione e la ricezione di dati su una rete.
La compressione dei dati fa generalmente uso di tecniche di codifica per ridurre la dimensione dei dati che vengono archiviati o trasmessi. A seconda che alcuni dati vengano scartati nel processo, possono essere caratterizzati come con perdita di dati, perdita di dati o senza perdita di dati. La scansione dei dati per ridondanza o ripetizione e la sostituzione di questi con token con riferimenti incrociati e indicizzati consente grandi riduzioni della quantità di spazio di archiviazione necessaria. I codici di soppressione dei dati guidano gli acceleratori nella comunicazione per sincronizzare e utilizzare la memoria o un disco rigido per scrivere le cronologie di compressione in un repository di archiviazione consentendo di utilizzare un proxy TCP (Transmission Control Protocol) come buffer di pacchetti o sessioni in modo che le velocità di trasmissione non siano ridotto. Un altro metodo di compressione dei dati riduce la dimensione dei dati in tempo reale mentre si passa al primo backup, e quindi attraverso un’ulteriore ottimizzazione, con conseguente maggiore risparmio sia di spazio che di tempo.
Utilizzando i tradizionali mezzi di compressione è possibile ridurre la dimensione dei dati archiviati in un rapporto di 2:1; l’utilizzo dell’ottimizzazione della capacità può aumentare questa riduzione fino a 20:1. La ricerca di ridondanza nelle sequenze di byte attraverso le finestre di confronto e l’utilizzo di funzioni hash crittografiche per sequenze univoche negli algoritmi per la deduplicazione consente la segmentazione dei flussi di dati. A questi segmenti di flusso vengono quindi assegnati identificatori univoci e indicizzati per il recupero. In questo modo, solo i nuovi set di dati vengono archiviati prima di essere ulteriormente compressi utilizzando algoritmi standard di compressione. Alcuni metodi di deduplicazione sono basati su hardware e la loro combinazione con i tradizionali algoritmi di compressione software consente alle funzioni di entrambi di produrre notevoli risparmi di spazio e tempo.
Molti approcci si concentrano sulla riduzione dei costi e dello spazio della capacità di archiviazione per ridurre i costi associati all’infrastruttura di archiviazione e considerazioni simili sorgono negli scenari WAN. Un livello noto come livello di trasporto deve esistere tra le applicazioni e le strutture di rete sottostanti durante le trasmissioni, consentendo l’invio e la ricezione dei dati in modo efficiente e rapido, tuttavia il livello di trasporto è ancora quello creato nel 1981 quando è stato creato il TCP e funzionava a 300 baud Vota. Pertanto, gli acceleratori utilizzano i proxy TCP, riducendo le perdite durante la trasmissione e confermando l’aumento delle dimensioni dei pacchetti utilizzando metodi avanzati di compressione dei dati per fornire più dati per segmento temporale. Per superare gli ostacoli durante la trasmissione, queste tecniche cooperano in modo coeso per migliorare le prestazioni delle applicazioni e ridurre la quantità di consumo di larghezza di banda.