Il data mining descrive il processo di estrazione di dati da grandi insiemi di informazioni e di presentarli in un modo unico. Questo processo si trova spesso negli studi di business intelligence, in cui gli esperti estraggono grandi insiemi di dati relativi a un mercato o alle operazioni aziendali e tentano di scoprire relazioni e tendenze precedentemente non riconosciute. Un modello di data mining si riferisce alle tecniche utilizzate dagli specialisti per raggruppare e presentare le informazioni, nonché ai modi in cui possono applicare le informazioni a determinate domande e problemi.
Molti specialisti considerano la regressione del data mining il modello di data mining più basilare e comunemente usato. In questo processo, un esperto analizza un insieme di dati e crea una formula che lo descrive. Molti analisti finanziari utilizzano questa tecnica per fare previsioni sui prezzi e sull’andamento del mercato. Questo modello funziona meglio negli scenari in cui si prevede che i dati rimangano coerenti.
Un altro popolare modello di data mining si basa sull’associazione. Uno specialista può analizzare i set di dati per determinare quali componenti appaiono spesso insieme. Quando due componenti vengono accoppiati ancora e ancora, un ricercatore può presumere che esista una qualche associazione tra di loro. Ad esempio, un ricercatore che utilizza il data mining per conoscere le prestazioni di un negozio al dettaglio potrebbe scoprire che i consumatori spesso acquistano penne e matite nello stesso momento in cui acquistano carta. Un manager può utilizzare le informazioni apprese da un modello di data mining per aumentare le vendite visualizzando tutti gli articoli associati in uno spazio.
L’analisi fattoriale è un altro modello comune di data mining. In questo processo, un ricercatore raccoglie una serie di variabili diverse e tenta di individuare i fattori che determinano le fluttuazioni di valore. Un ricercatore di mercato, ad esempio, può apprendere da una base di clienti come valuta le caratteristiche di prodotti simili. Un ricercatore può quindi organizzare queste informazioni per illustrare i fattori che determinano la valutazione delle caratteristiche da parte dei consumatori. Mentre i sostenitori di questo modello credono che possa evidenziare la comunanza tra variabili apparentemente disparate, alcuni critici ritengono che questo modello possa portare alcuni interpreti ad assumere la causa di determinati fenomeni quando tutte le informazioni necessarie per determinare la causa potrebbero non essere disponibili.
I ricercatori possono utilizzare un modello di data mining basato sulla categorizzazione per problemi più semplici. Usando questa tecnica, gli specialisti organizzano i dati in base alle loro classificazioni e tendono a organizzarli in una forma visiva, come in un albero o in un grafico. Questo tipo di modello è particolarmente utile negli scenari in cui un individuo deve scegliere tra diverse opzioni in ciascuna categoria. Un designer potrebbe trovare utile questo modello se in ogni fase di un processo può scegliere tra diversi materiali.