Un cluster di dati su un computer è un gruppo di settori di memoria organizzati insieme in base ai file archiviati nel computer e il cluster emulerà la dimensione dei file salvati. La creazione di un cluster di dati semplifica l’elaborazione e la gestione dei settori da parte del computer, poiché la gestione di molti piccoli settori può essere difficile. Non è necessario che i settori siano uno accanto all’altro per esistere nello stesso cluster. Un problema con questo è che la frammentazione della memoria è comune, specialmente con file più piccoli.
La memoria del computer ha molte sezioni, chiamate settori, e questi settori sono tra i più piccoli gruppi di memoria sul computer. Quando un file viene salvato sul computer, in genere sarà necessario più di un settore, poiché i settori in genere sono molto piccoli. Un cluster di dati è la memoria utilizzata per salvare quel file. Il cluster ha all’incirca la stessa quantità di memoria del file archiviato, quindi i cluster sono dinamici e organizzati in base a ciò che contengono.
Il vantaggio dell’utilizzo di un cluster di dati è che migliora la velocità di accesso quando l’utente apre il file. Senza il clustering, il computer dovrebbe ricordare ogni singolo settore in cui è archiviato il file e questo può essere noioso. Trattando tutti questi settori come un cluster, il computer può individuare rapidamente quel cluster, il che consente di recuperare più rapidamente il file.
Un computer organizza un cluster di dati come un gruppo, quindi sarebbe corretto pensare che i settori debbano essere uno accanto all’altro. Tuttavia, non è così che funziona il computer, perché i settori possono essere distribuiti su diversi livelli e aree della memoria del computer. Tutto ciò che fa il clustering è raccogliere la posizione di ciascun settore in modo che possano essere salvati come un gruppo.
Sebbene una maggiore velocità sia un vantaggio, la possibilità di dati frammentati è elevata quando viene utilizzato un cluster di dati. Quando il file viene salvato, specialmente su sistemi ottimizzati per cluster di dimensioni maggiori, il file normalmente sarà più piccolo dell’intero cluster. Normalmente questo non è un problema con una piccola quantità di file, ma i computer che hanno un numero elevato di file potrebbero riscontrare dati frammentati. Le porzioni del cluster che non vengono utilizzate vengono frammentate e sprecate, perché non possono essere liberate per altri file; ciò può causare problemi di velocità o ridurre la quantità complessiva di memoria del computer.