Cosa sono gli strumenti di data mining?

Gli strumenti di data mining sono componenti software e teorie che consentono agli utenti di estrarre informazioni dai dati. Gli strumenti forniscono a individui e aziende la capacità di raccogliere grandi quantità di dati e utilizzarli per prendere decisioni su un particolare utente o gruppi di utenti. Alcuni degli usi più comuni degli strumenti di data mining sono nei settori del marketing, della protezione dalle frodi e della sorveglianza.

L’estrazione manuale dei dati esiste da centinaia di anni. Tuttavia, l’automazione del data mining è stata prevalente sin dagli albori dell’era dei computer. Durante il XX secolo, sono emerse varie scienze informatiche per aiutare a supportare il concetto di sviluppo di strumenti di data mining. L’obiettivo generale dell’utilizzo degli strumenti è scoprire schemi nascosti. Ad esempio, se un’azienda di marketing scopre che una persona fa un viaggio mensile da New York a Los Angeles, diventa vantaggioso per quell’azienda pubblicizzare i dettagli della destinazione all’individuo.

All’interno del settore del data mining, sono stati stabiliti degli standard per definire i parametri di utilizzo degli strumenti di data mining. Ogni anno, lo Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) dell’Association for Computing Machinery tiene una riunione per determinare quali processi vengono utilizzati. Lo stesso gruppo ha anche il compito di valutare le implicazioni etiche dell’analisi dei dati provenienti da individui e aziende. Una rivista semestrale è pubblicata dal gruppo intitolato SIGKDD Explorations.

Lo strumento più utilizzato nel data mining è il processo chiamato Knowledge Discovery in Databases (KDD). KDD è stato sviluppato nel 1989 da Gregory Piatetsky-Shapiro. Utilizzando questo strumento di data mining, gli utenti sono in grado di elaborare dati grezzi, estrarre i dati per ottenere informazioni e interpretare i vari risultati sotto forma di gestione delle informazioni.

Una delle forme più importanti di strumenti di data mining è utilizzata per combattere il terrorismo nel 21° secolo. Negli Stati Uniti, il National Research Council utilizza i concetti di pattern mining e data mining per soggetto per identificare l’attività terroristica nel grande pool di informazioni in tutto il mondo. Il pattern mining è definito dal processo di individuazione dei pattern all’interno di un grande volume di dati. Il data mining basato sul soggetto tenta di identificare le relazioni tra gli individui. Entrambe le tecniche possono essere utilizzate anche nella pratica aziendale generale definendo la mentalità di una base di clienti e la relazione interattiva tra i clienti.