Quali sono i diversi tipi di sistemi di data warehouse?

Esistono due principali sistemi di data warehouse; normalizzato e dimensionale. In una struttura normalizzata, i dati sono limitati a una semplice presentazione di informazioni fattuali. Non c’è contesto o sfondo per i dati oltre a ciò che l’utente è disposto a correlare. In un sistema dimensionale, le informazioni arrivano in un contesto di altri fatti che mostrano cosa sono i dati nel loro insieme. In questo caso, c’è una ricchezza di informazioni disponibili, che tu lo voglia o no.

I due principali sistemi di data warehouse sono i due estremi. Nella maggior parte dei data warehouse, viene raggiunta una via di mezzo tra questi due. Le descrizioni effettive sono per la forma più pura dello stile, anche se raramente si incontra.

I dati normalizzati sono i più facili da implementare e manipolare tra i due sistemi di data warehouse. In questo stile, le informazioni vengono ridotte a fatti individuali senza alcuna connessione con altri dati. Ad esempio, il numero di serie di un prodotto e il nome del prodotto vengono uniti senza ulteriori informazioni. L’informazione è disponibile per qualsiasi utente che potrebbe volerla, ma deve fare il lavoro per far sì che significhi qualcosa.

Per dare un senso alle informazioni nei sistemi di data warehouse normalizzati, l’utente raccoglie le informazioni collegate per mettere insieme un’intera immagine. Per trovare il numero di telefono di un cliente, le informazioni di cui sopra possono essere collegate a un numero di serie e un numero di conto della persona che ha acquistato l’articolo. Quindi il numero di conto e il nome potrebbero essere individuati. Infine, vengono trovati il ​​nome e il numero di telefono. Ciascuno di questi passaggi è una query di database separata avanzata dall’utente per raccogliere informazioni.

I dati dimensionali sono l’esatto contrario. In generale, questi sistemi di data warehouse sono i più facili da usare per gli esseri umani, ma i più difficili da modificare o manipolare. Quando le informazioni vengono raccolte, tutto viene combinato in un’unica grande sfera di dati. Invece di un numero di serie e di prodotto, verrebbe inserita un’intera fattura di acquisto contemporaneamente.

Se un utente cercasse un numero di telefono in un database dimensionale, il processo sarebbe diverso. Il numero di serie produrrebbe un’intera cronologia per quel cliente, nomi e date di tutto ciò che è stato acquistato e qualsiasi chiamata o reso di servizio. Inoltre, anche ogni indirizzo e numero di telefono che il cliente abbia mai utilizzato sarebbe direttamente disponibile. Il quadro è molto completo, ma forse così completo che le informazioni richieste sono difficili da trovare.