Esistono diversi metodi di data mining utilizzati sia nelle opzioni software che nei concetti teorici. Questi consentono agli utenti di estrarre informazioni dai dati raccolti da individui e aziende utilizzando una varietà di strumenti. Grandi quantità di dati possono essere utilizzate per determinare vari fattori in un singolo soggetto o in una varietà di soggetti. Questi metodi di data mining sono più comunemente utilizzati nei settori della protezione dalle frodi, del marketing e della sorveglianza.
Per centinaia di anni, i metodi di data mining sono stati utilizzati per estrarre informazioni dai soggetti. Le tecniche moderne, tuttavia, utilizzano concetti automatizzati per fornire dati sostanziali tramite risorse computerizzate. Con l’emergere delle scienze informatiche nel corso del XX secolo, il concetto di metodi di data mining si è sviluppato nel tentativo di superare modelli nascosti in ampie aree di dati raccolti. Un buon esempio di ciò è quando un’azienda pubblicitaria analizza i modelli di acquisto di un cliente online. Questa azienda può quindi commercializzare determinati prodotti che l’individuo potrebbe essere interessato all’acquisto.
Una tecnica di data mining utilizzata comunemente nel settore è denominata Knowledge Discovery in Databases (KDD). Sviluppato nel 1989 da Gregory Piatetsky-Shapiro, KDD consente agli utenti di elaborare dati grezzi, analizzare le informazioni per i dati necessari e interpretare i risultati. Questo metodo consente agli utenti di trovare modelli negli algoritmi, tuttavia i dati generali non sono sempre accurati e possono essere messi insieme in modi compromettenti. Questo è noto come overfitting.
I metodi di data mining di base comportano quattro particolari tipi di attività: classificazione, clustering, regressione e associazione. La classificazione prende le informazioni presenti e le unisce in raggruppamenti definiti. Il clustering rimuove i raggruppamenti definiti e consente ai dati di classificarsi per elementi simili. La regressione si concentra sulla funzione delle informazioni, modellando i dati sul concetto. Il metodo di data mining finale, l’associazione, tenta di trovare relazioni tra i vari feed di dati.
Quando si utilizzano i vari metodi di data mining, vengono utilizzati determinati standard per determinare quali parametri possono essere utilizzati nel processo. Lo Special Interest Group dell’Association for Computing Machinery sulla scoperta della conoscenza e l’estrazione di dati (SIGKDD) tiene una riunione annuale per determinare quali processi sono appropriati. I fattori etici vengono soppesati insieme alle applicazioni pratiche per trovare le migliori informazioni su individui e aziende. Queste informazioni sono pubblicate in una rivista di settore chiamata SIGKDD Explorations.