Che cos’è il test del data warehouse?

Il test del data warehouse è un processo utilizzato per ispezionare e qualificare l’integrità dei dati conservati in un qualche tipo di struttura di archiviazione. L’idea alla base del test è assicurarsi che i dati non abbiano subito alcun tipo di danneggiamento e rimangano completi e recuperabili quando e quando necessario. Il test regolare dei dati archiviati consente di identificare eventuali problemi che potrebbero essere in via di sviluppo e correggere tali problemi prima che i dati archiviati vengano completamente danneggiati e possano essere ricostruiti solo parzialmente utilizzando un qualche tipo di processo di recupero dei dati.

In molti modi, il test del data warehouse è molto simile a qualsiasi tipo di test eseguito per garantire l’integrità delle informazioni archiviate sul disco rigido di un computer o su un dispositivo di archiviazione remoto. I dati contenuti nel magazzino vengono sistematicamente controllati tramite un software che legge ogni file o altra fonte di dati per assicurarsi che rimanga completamente intatto e accessibile. Alcuni tipi di software di test del data warehouse hanno la capacità di correggere una gamma limitata di errori come parte del processo di test complessivo. Altri semplicemente compilano un elenco delle eccezioni, consentendo all’utente di valutare ciascuna eccezione individualmente prima che venga intrapresa qualsiasi azione.

I test del data warehouse in genere utilizzano un modello attivato dal sistema. Ciò significa semplicemente che il software utilizza una formula di base nota come ETL o caricamento di estrazione-trasformazione. L’idea è confrontare la condizione attuale dei dati con la condizione delle informazioni quando sono state immagazzinate per la prima volta. Se vengono identificati errori, i dati vengono contrassegnati per un’ulteriore revisione. Nella maggior parte dei casi, gli errori o le eccezioni sono minori e possono essere riparati con uno sforzo relativamente ridotto, utilizzando i protocolli incorporati nel software di test o tramite la revisione da parte di un analista che può approvare la riparazione o respingere l’eccezione come un vero tipo di corruzione .

Il processo di base del test del data warehouse è molto simile al test di qualsiasi tipo di transazione elettronica di informazioni. Le informazioni vengono esaminate in blocchi o celle che vengono poi cancellate o annotate per eventuali eccezioni che il software ha identificato prima di passare al blocco successivo. Una volta completato il processo, viene compilato un riepilogo del test, comprese le informazioni sui tipi di eccezioni trovate e se tali eccezioni sono state corrette durante il test o sono in attesa di revisione manuale. Come con qualsiasi tipo di test di sistema, è una buona idea condurre regolarmente test di data warehouse per garantire che le informazioni rimangano complete e prive di qualsiasi tipo di corruzione.