Un archivo disperso guarda datos importantes solo en el disco duro de una computadora para ahorrar espacio. Este enfoque puede resultar útil cuando los archivos contienen grandes bloques de datos nulos representados por ceros. En lugar de escribir estos bloques, el sistema los ignora, comprimiendo el espacio total de almacenamiento para hacer más espacio disponible en el sistema. Cuando se accede al archivo, se copia o se modifica, se puede expandir para incluir estos datos. Numerosos sistemas de archivos admiten este tipo de almacenamiento de datos.
En la creación de archivos típica, la computadora asigna bloques de almacenamiento al archivo que incluyen no solo los datos significativos, sino también información nula. Esto puede ocupar varias cantidades de espacio, según el tipo de archivo. Con un archivo disperso, la computadora almacena metadatos sobre la información nula, pero no la información nula en sí. Como resultado, el archivo general es mucho más pequeño, ya que solo incluye bloques de información esencial, sin bloques nulos.
El sistema utiliza los metadatos como una instantánea del material con el fin de restaurarlo más tarde. Los usuarios pueden acceder al archivo disperso para cambiar el contenido, copiarlo, transferirlo y realizar otras acciones. Una precaución con un archivo disperso es que cuando se accede a él, se puede expandir. En el caso de una situación como la copia de archivos, puede que sea demasiado grande para el medio después de la expansión, en cuyo caso podría devolver errores.
Algunas utilidades están disponibles para mantener una estructura de archivos dispersa y mantener estos archivos pequeños. Se pueden utilizar para trabajar dentro de un sistema de archivos que utilice este método de almacenamiento. Mantener la compresión también puede ayudar a mantener limitado el uso del espacio en disco para garantizar que el sistema funcione sin problemas y de manera adecuada. A medida que se ocupa más y más espacio en el disco, un sistema puede tener problemas para funcionar de manera eficiente y los usuarios pueden tener más errores y otros problemas.
Varios sistemas y lenguajes de programación permiten la creación de archivos dispersos. Las desventajas del formato pueden ser una consideración al decidir si implementarlo, ya que los programadores y usuarios deben asegurarse de que sea apropiado. En los casos en que no es así, herramientas como archivar archivos no utilizados o emplear otros métodos de compresión pueden evaluarse como opciones para mantener un sistema funcionando sin problemas mientras se almacena la información que el usuario necesita. Cuando se utilizan archivos dispersos en un sistema, es importante conservar la documentación sobre el proceso que estará disponible en caso de que surja un problema.