Il data warehouse mining è l’analisi delle informazioni contenute in uno o più database al fine di rendere le informazioni utili. Questi database, o data warehouse, sono un deposito centrale per i dati. Le aziende aggregano le informazioni che raccolgono sui propri clienti in un data warehouse. Una volta che le informazioni sono state raccolte, vengono “estratte” e da esse vengono estratte informazioni utili per produrre informazioni che possono aiutare l’azienda a prendere decisioni aziendali che aumenteranno i profitti o ridurranno i costi. I rivenditori utilizzano spesso il data warehouse mining per analizzare e prevedere il comportamento dei propri clienti.
Ad esempio, quando un acquirente va al supermercato e consegna al cassiere la sua carta acquisti frequenti, le informazioni sui suoi acquisti vengono raccolte e archiviate nel data warehouse dell’azienda. Una catena di supermercati avrà milioni di dati su ciò che le persone acquistano, quando, in che quantità e a quale prezzo. Un negozio potrebbe sapere che l’anno scorso sono state vendute 50,000 confezioni di piselli surgelati, ma questa informazione da sola non è particolarmente utile. Se l’estrazione del data warehouse rivela, tuttavia, che il 75% di quei piselli surgelati è stato venduto durante i mesi in cui i piselli freschi non erano disponibili, o che il 10% dei piselli è stato venduto nelle due settimane precedenti il Ringraziamento, l’azienda potrebbe essere in grado di utilizzare tali informazioni per aumentare le vendite annuali di piselli surgelati.
Le aziende possono utilizzare tecniche di data warehouse mining per prevedere le vendite future. Il data mining può anche aiutarli a stimare l’impatto delle decisioni di stoccaggio e prezzi. Al supermercato, il data mining potrebbe impedire ai negozi di rimanere senza piselli surgelati in caso di scarso raccolto di piselli freschi in un determinato anno.
La regressione del data mining è una tecnica di data mining che viene utilizzata per mostrare cosa è probabile che accada a un valore di dati se qualcosa nell’equazione viene modificato. Utilizzando l’esempio del supermercato, la regressione prevede il livello delle vendite di piselli surgelati se i piselli freschi aumentano di prezzo. La regressione utilizza i dati storici e vi applica una formula che prevede il comportamento futuro.
Le aziende utilizzano spesso un’applicazione software di data warehouse mining per raccogliere ed estrarre i propri dati. L’applicazione corretta è determinata dalla quantità di dati che hanno e dal tipo di analisi che vogliono fare. La scelta dello strumento di data mining corretto è fondamentale per raccogliere e interpretare dati utili.