Che cos’è la gestione gerarchica dell’archiviazione?

La gestione dell’archiviazione gerarchica (HSM) fornisce alle organizzazioni un mezzo per organizzare l’archiviazione e il recupero dei dati in livelli separati per la gestione dei costi e l’efficienza dello spazio di archiviazione. La tecnica è talvolta chiamata anche archiviazione a più livelli. Funziona in modo simile a una cache, ma su una scala molto più ampia, in cui i dati utilizzati di frequente vengono archiviati su unità disco più veloci in anticipo e archiviati su supporti più lenti ai livelli inferiori. Poiché alcuni file vengono utilizzati più spesso, risiedono nel primo livello e vengono quindi spostati nei livelli inferiori quando non vengono più utilizzati.

La spina dorsale della gestione gerarchica dello storage è il software. È necessaria una logica molto dettagliata per catalogare i dati e controllare i file utilizzati di frequente che dovrebbero risiedere nel livello superiore. Il software è anche responsabile della gestione delle richieste al livello biblioteca e di garantire che tali richieste avvengano in modo tempestivo.

Sono disponibili numerose funzionalità diverse per le varie implementazioni software di gestione dell’archiviazione gerarchica. Alcuni software possono consentire un livello di backup, in cui tutti i dati, indipendentemente dal fatto che siano utilizzati frequentemente o in archivio, vengono inviati anche a supporti di archiviazione a lungo termine aggiuntivi. Altre caratteristiche possono includere l’integrazione con i sistemi informatici che utilizzano l’HSM. Qui, i dati vengono estratti da altri server o workstation sulla rete all’HSM principale e ulteriormente organizzati fino al livello del disco o del livello di archiviazione o su un backup completo.

Anche le implementazioni della gestione gerarchica dell’archiviazione possono variare in base al caso d’uso. In alcune situazioni, una parte di un file di grandi dimensioni risiederà su un disco ad alta velocità e sarà collegata al resto del file sul supporto di memorizzazione. Quando arriva una richiesta dell’utente, la prima parte del file viene letta dal disco, mentre il resto viene recuperato dal supporto di memorizzazione. Questa tecnica viene spesso utilizzata nelle implementazioni di streaming multimediale di grandi dimensioni, come i video su Internet.

Esistono anche alcuni svantaggi della gestione gerarchica dell’archiviazione. In particolare è il tempo necessario per recuperare i dati utilizzati meno spesso dal livello di archiviazione. Nel caso di molti file di piccole dimensioni, ad esempio, possono essere necessarie ore o addirittura giorni prima che la robotica riunisca la richiesta che può essere distribuita su più dischi nel jukebox. In questi casi, gli amministratori di sistema in genere consigliano all’utente di racchiudere le grandi quantità di file più piccoli in file in formato archivio singolo. Il livello di archiviazione deve quindi solo cercare un singolo file, in genere archiviato su un singolo supporto nella libreria.