Che cos’è la compressione dei file?

La compressione dei file è un metodo utilizzato dai computer per ridurre le dimensioni di un file elettronico o di un gruppo di file alla dimensione più piccola possibile. I file ZIP sono un esempio comune di compressione dei file. Esistono molte tecniche utilizzate dai programmi per computer per comprimere i file, ma il metodo più comune è sostituire le sequenze ripetute con sequenze più piccole. I computer lo fanno catalogando la prima istanza e facendo riferimento ad essa nelle istanze successive. Ad esempio, nelle frasi precedenti a questa, le lettere “compress” sono apparse tre volte. Un computer potrebbe comprimerli catalogando la prima istanza ed eguagliando tutte le istanze successive con “&cmp”, riducendo così il numero di lettere o caratteri richiesti e la dimensione del file. Nel corso di un file di grandi dimensioni, tale sostituzione può far risparmiare molto spazio. Va notato, tuttavia, che l’utente non lo vede: il computer fa tutto il lavoro in background.

Per tenere traccia delle sostituzioni abbreviate, i programmi per computer creano anche un dizionario per il file compresso. Nel mondo della compressione dei file, un dizionario è un elenco delle frasi originali e delle loro sostituzioni. Tuttavia, questo dizionario è incluso nella dimensione del file, quindi occuperà anche spazio, riducendo la quantità di spazio risparmiata dalla compressione. Per questo motivo, di solito è meno efficiente comprimere un singolo file di piccole dimensioni rispetto a un file o gruppo di grandi dimensioni.

I programmi che eseguono la compressione dei file funzionano in modi leggermente diversi. Queste differenze sono principalmente il risultato di qualcosa chiamato algoritmo. Un algoritmo è un costrutto matematico che cerca nei file le ripetizioni e inserisce i riferimenti semplici. I programmatori creano gli algoritmi di compressione e definiscono i modelli e le sostituzioni da utilizzare per la compressione. Le varianze possono influenzare l’efficienza della compressione. Ad esempio, nella frase “è stato il migliore dei tempi, è stato il peggiore dei tempi”, vengono ripetute le sequenze “era il” e “il primo dei tempi”. Un programmatore può scegliere di sostituire ogni frase intera o forse sostituire “it” individualmente e “di tempi” individualmente. Queste leggere differenze negli algoritmi sono il motivo per cui alcuni programmi di compressione dei file funzionano meglio su alcuni tipi di file rispetto ad altri.

Alcuni tipi di file compressi sono autoestraenti, il che significa che si aprono automaticamente quando un utente fa clic su di essi: non sono necessari programmi esterni per decomprimerli. Per creare questi file, il programma di compressione originale deve aggiungere codice aggiuntivo al file compresso. Per questo motivo, un file compresso autoestraente è spesso più grande dello stesso file se fosse compresso normalmente. Questo è in genere considerato un buon compromesso per le aziende che rilasciano programmi da installare sui computer di casa. Rendendo il file autoestraente, consente all’utente domestico di saltare un passaggio e rende più probabile l’installazione del software. Per decomprimere i file che non sono autoestraenti, è possibile scaricare da Internet una serie di programmi di terze parti.