La gestión de almacenamiento jerárquica (HSM) proporciona un medio para que las organizaciones organicen el almacenamiento y la recuperación de datos en niveles separados para la gestión de costes y la eficiencia del espacio de almacenamiento. La técnica también se denomina ocasionalmente almacenamiento por niveles. Funciona como un caché, pero a una escala mucho mayor, donde los datos de uso frecuente se almacenan en unidades de disco más rápidas desde el principio y se archivan en medios más lentos en los niveles inferiores. Como ciertos archivos se utilizan con más frecuencia, residen en el primer nivel y luego se mueven a los niveles inferiores a medida que dejan de utilizarse.
La columna vertebral de la gestión del almacenamiento jerárquico es el software. Se requiere una lógica muy detallada para catalogar los datos y observar los archivos de uso frecuente que deberían residir en el nivel superior. El software también es responsable de administrar las solicitudes al nivel de la biblioteca y garantizar que esas solicitudes se produzcan de manera oportuna.
Hay una serie de características diferentes para las diversas implementaciones de software de gestión de almacenamiento jerárquico disponibles. Algunos software pueden permitir un nivel de respaldo, donde todos los datos, independientemente de si se accede con frecuencia o si están archivados, también se envían a medios de almacenamiento adicionales a largo plazo. Otras características pueden incluir la integración con sistemas informáticos que utilizan el HSM. Aquí, los datos se extraen de otros servidores o estaciones de trabajo en la red al HSM principal y se organizan aún más en el nivel de disco o nivel de almacenamiento, o en una copia de seguridad completa.
Las implementaciones de gestión de almacenamiento jerárquica también pueden variar según el caso de uso. En algunas situaciones, una parte de un archivo grande se colocará en un disco de alta velocidad y se vinculará al resto del archivo en el medio de almacenamiento. Cuando llega una solicitud del usuario, la primera parte del archivo se lee del disco, mientras que el resto se recupera del medio de almacenamiento. Esta técnica se usa a menudo en implementaciones de transmisión de medios de gran tamaño, como video de Internet.
También existen algunos inconvenientes en la gestión del almacenamiento jerárquico. Lo más notable es el tiempo que lleva recuperar los datos que se utilizan con menos frecuencia del nivel de almacenamiento. En el caso de muchos archivos pequeños, por ejemplo, la robótica puede tardar más de horas o incluso días en reunir la solicitud, que puede estar distribuida en varios discos de la máquina de discos. En estos casos, los administradores de sistemas suelen recomendar al usuario que agrupe grandes cantidades de archivos más pequeños en archivos de formato de archivo único. El nivel de almacenamiento solo tiene que buscar un solo archivo, generalmente almacenado en un solo medio en la biblioteca.