Ci sono quattro fattori principali da considerare quando si cerca di mantenere la qualità del data warehouse: integrità dei dati, origine e metodologia di input dei dati utilizzati, frequenza di importazione dei dati e audience. Un data warehouse è un repository elettronico di grandi quantità di dati ed è sempre più utilizzato dalle aziende e da altre organizzazioni più grandi per archiviare i dati in uno strumento che facilita i requisiti di reportistica e output dei dati. L’utilità di un data warehouse è guidata principalmente dalla qualità dei dati e dalla capacità di risposta ai requisiti degli utenti.
L’integrità dei dati è un concetto comune alla qualità del data warehouse in quanto si riferisce alle regole che governano le relazioni tra i dati, le date, le definizioni e le regole aziendali che modellano la pertinenza dei dati per l’organizzazione. Mantenere i dati coerenti e riconciliabili è il fondamento dell’integrità dei dati. I passaggi utilizzati per mantenere la qualità del data warehouse devono includere un piano di architettura dei dati coerente, un’ispezione regolare dei dati e l’uso di regole e processi per mantenere i dati coerenti quando possibile.
L’origine di input dei dati per un data warehouse è in genere uno strumento o un programma di importazione. Il modo più semplice per mantenere la qualità del data warehouse è implementare regole e punti di controllo nel programma di importazione dei dati stesso. I dati che non seguono il modello appropriato non verranno aggiunti al data warehouse ma richiederanno l’intervento dell’utente per correggere, riconciliare o modificare il programma. In molte organizzazioni, questi tipi di modifiche possono essere implementati solo dall’architetto del data warehouse, il che aumenta notevolmente la qualità del data warehouse.
L’accuratezza e la pertinenza dei dati è essenziale per mantenere la qualità del data warehouse. I tempi di importazione e frequenza hanno un grande impatto sull’utilità generale dello strumento, nonché sulla qualità. Ad esempio, se le informazioni sull’ordine di acquisto vengono immesse nel magazzino ma le fatture vengono aggiornate solo in modo intermittente, la capacità di riferire in modo accurato sull’attività correlata all’acquisto viene compromessa.
La qualità del data warehouse è più semplice da mantenere e supportare se gli utenti sono informati e hanno una solida conoscenza dei processi aziendali. La formazione degli utenti a comprendere non solo come creare query, ma sulla struttura del data warehouse sottostante consente loro di identificare le incoerenze molto più rapidamente e di evidenziare potenziali problemi nelle prime fasi del processo. Eventuali modifiche alle tabelle di dati, alla struttura o ai collegamenti e l’aggiunta di nuovi campi di dati devono essere esaminate con l’intero team di utenti e membri del personale di supporto al fine di garantire una comprensione coerente dei rischi e delle sfide che potrebbero verificarsi.