¿Qué es la compresión de archivos?

La compresión de archivos es un método utilizado por las computadoras para reducir el tamaño de un archivo electrónico o grupo de archivos al tamaño más pequeño posible. Los archivos ZIP son un ejemplo común de compresión de archivos. Hay muchas técnicas que utilizan los programas de computadora para comprimir archivos, pero el método más común es reemplazar secuencias repetidas con secuencias más pequeñas. Las computadoras hacen esto catalogando la primera instancia y refiriéndose a ella en instancias posteriores. Por ejemplo, en las frases anteriores a esta, las letras “comprimir” han aparecido tres veces. Una computadora puede comprimirlos catalogando la primera instancia y equiparando todas las instancias posteriores con “& cmp”, reduciendo así el número de letras o caracteres requeridos y reduciendo el tamaño del archivo. En el transcurso de un archivo grande, dicha sustitución puede ahorrar una gran cantidad de espacio. Sin embargo, debe tenerse en cuenta que el usuario no ve esto: la computadora hace todo el trabajo en segundo plano.

Para realizar un seguimiento de los reemplazos abreviados, los programas de computadora también crean un diccionario para el archivo comprimido. En el mundo de la compresión de archivos, un diccionario es una lista de las frases originales y sus reemplazos. Sin embargo, este diccionario está incluido en el tamaño del archivo, por lo que también ocupará espacio, reduciendo la cantidad de espacio ahorrado por la compresión. Por esta razón, generalmente es menos eficiente comprimir un solo archivo pequeño que un archivo o grupo grande.

Los programas que realizan la compresión de archivos funcionan de formas ligeramente diferentes. Estas diferencias son principalmente el resultado de algo llamado algoritmo. Un algoritmo es una construcción matemática que busca repeticiones en los archivos y coloca las referencias simples. Los programadores crean los algoritmos de compresión y definen los patrones y reemplazos que se utilizarán para la compresión. Las variaciones pueden afectar la eficiencia de la compresión. Por ejemplo, en la frase «fue el mejor de los tiempos, fue el peor de los tiempos», se repiten las secuencias «fue el» y «st de los tiempos». Un programador puede optar por reemplazar cada frase completa o quizás reemplazar «eso» individualmente y «de vez en cuando» individualmente. Esta pequeña diferencia en los algoritmos es la razón por la que algunos programas de compresión de archivos funcionan mejor en algunos tipos de archivos que en otros.

Algunos tipos de archivos comprimidos son autoextraíbles, lo que significa que se abren automáticamente cuando un usuario hace clic en ellos; no se requieren programas externos para descomprimirlos. Para crear estos archivos, el programa de compresión original debe agregar código adicional al archivo comprimido. Por esta razón, un archivo comprimido autoextraíble suele ser más grande que el mismo archivo si estuviera comprimido normalmente. Por lo general, esto se considera una buena compensación para las empresas que lanzan programas para ser instalados en computadoras domésticas. Al hacer que el archivo sea autoextraíble, permite al usuario doméstico omitir un paso y aumenta la probabilidad de que se instale el software. Para descomprimir archivos que no son autoextraíbles, hay varios programas de terceros disponibles para descargar en Internet.