Quali sono i diversi tipi di progettazione di data warehouse?

I data warehouse archiviano grandi quantità di dati da utilizzare in molti campi diversi. Esistono due tipi principali di progettazione del data warehouse: top-down e bottom-up. I due modelli hanno i loro vantaggi e svantaggi. Bottom-up è più facile ed economico da implementare, ma è meno completo e le correlazioni dei dati sono più sporadiche. In un progetto top-down, le connessioni tra i dati sono ovvie e ben consolidate, ma i dati potrebbero non essere aggiornati e il sistema è costoso da implementare.

I data mart sono la figura centrale nella progettazione del data warehouse. Un data mart è una raccolta di dati basata su un unico concetto. Ogni data mart è un sottoinsieme di dati unico e completo. Ognuna di queste raccolte è completamente correlata internamente e spesso ha connessioni a data mart esterni.

Il modo in cui vengono gestiti i data mart è la principale differenza tra i due stili di progettazione del data warehouse. Nella progettazione top-down, i data mart si verificano naturalmente quando i dati vengono inseriti nel sistema. Nella progettazione bottom-up, i data mart vengono realizzati direttamente e collegati tra loro per formare il magazzino. Anche se questa può sembrare una piccola differenza, crea un design molto diverso.

Il metodo top-down era il design originale del data warehouse. Utilizzando questo metodo, tutte le informazioni conservate dall’organizzazione vengono inserite nel sistema. Ogni argomento ampio avrà la propria area generale all’interno delle banche dati. Man mano che i dati vengono utilizzati, verranno visualizzate le connessioni tra i punti dati correlati e verranno visualizzati i data mart. Inoltre, tutti i dati nel sistema rimangono lì per sempre, anche se i dati vengono sostituiti o banalizzati da informazioni successive, rimarranno nel sistema come registrazione di eventi passati.

Il metodo bottom-up della progettazione del data warehouse funziona nella direzione opposta. Un’azienda inserisce le informazioni come un data mart autonomo. Col passare del tempo, altri set di dati vengono aggiunti al sistema, sia come data mart che come parte di uno già esistente. Quando due data mart sono considerati sufficientemente connessi, si uniscono in un’unica unità.
I due progetti di data warehouse hanno ciascuno i propri punti di forza e di debolezza. Il metodo top-down è un enorme progetto per set di dati ancora più piccoli. Poiché i grandi progetti sono anche più costosi, è il più costoso in termini di denaro e manodopera. Se il data warehouse è terminato e mantenuto, è una vasta raccolta, contenente tutto ciò che l’azienda conosce.
Il processo bottom-up è molto più veloce ed economico, ma poiché i dati vengono inseriti secondo necessità, il database non sarà mai effettivamente completo. Inoltre, le correlazioni tra i data mart sono tanto forti quanto il loro utilizzo le rende. Se esiste una forte correlazione, ma nessun utente la vede, si disconnette.