Che cos’è il data mining Web?

Più che mai, sia le entità che gli individui utilizzano il World Wide Web per condurre una serie di transazioni commerciali e personali. Di conseguenza, le aziende utilizzano sempre più strumenti e tecniche di data mining Web per trovare modi per migliorare i propri profitti e far crescere la propria base di clienti. Il data mining Web implica il processo di raccolta e riepilogo dei dati dalla struttura del collegamento ipertestuale di un sito Web, dal contenuto della pagina o dal registro di utilizzo per identificare i modelli. Utilizzando il data mining Web, un’azienda può identificare un potenziale concorrente, migliorare il servizio clienti o soddisfare le esigenze e le aspettative dei clienti. Un’agenzia governativa può anche cercare di scoprire minacce terroristiche o altre attività criminali attraverso l’uso di un’applicazione di data mining Web.

Alcune comuni tecniche di data mining Web includono l’estrazione di contenuti Web, l’estrazione di utilizzo del Web e l’estrazione di strutture Web. L’estrazione di contenuti Web esamina l’oggetto di un sito Web. Ad esempio, i minatori di contenuti Web possono analizzare l’audio, il testo, le immagini e le funzionalità video di un sito. I minatori di contenuti Web in genere si concentrano sulle informazioni testuali di un sito più che su altre funzionalità del sito. L’elaborazione del linguaggio naturale e il recupero delle informazioni sono due tecniche di data mining spesso utilizzate dai minatori di contenuti Web.

Il mining di utilizzo del Web è in genere un processo automatizzato in base al quale i server Web raccolgono e segnalano i modelli di accesso degli utenti nei registri di accesso al server. Un’azienda può, ad esempio, utilizzare uno strumento di data mining sull’utilizzo del Web per segnalare i registri di accesso al server e le informazioni di registrazione degli utenti al fine di creare una struttura del sito Web più efficace. Il mining di strutture Web studia il nodo e la struttura di connessione dei siti Web. Può essere utile per identificare somiglianze e relazioni che esistono tra diversi siti Web. L’estrazione di strutture Web spesso comporta la scoperta di modelli da collegamenti ipertestuali o l’estrazione di strutture di documenti su una pagina Web.

Due tecniche generali di data mining che possono essere impiegate dai web data miner sono l’analisi dell’associazione di data mining e la regressione di data mining. L’analisi delle associazioni di data mining aiuta a scoprire relazioni degne di nota sepolte in grandi set di dati. La regressione del data mining è una tecnica statistica in base alla quale vengono utilizzate formule matematiche per prevedere risultati futuri, come margini di profitto, valori delle case o cifre di vendita.

I fornitori di software di data mining offrono strumenti di data mining Web in grado di estrarre informazioni predittive da grandi quantità di dati. Le aziende utilizzano spesso questi strumenti di estrazione del software per analizzare set di dati specifici relativi al comportamento dei consumatori. Utilizzando i risultati dell’analisi dei dati, le aziende sono in grado di prevedere le tendenze future del business.