Il web mining è una forma di raccolta di informazioni che si applica ai dati raccolti da fonti online. La raccolta di dati da fonti su Internet consente agli utenti di aggregare grandi volumi di informazioni per l’analisi per prendere decisioni aziendali chiave in un ambiente online. Ad esempio, un ricercatore potrebbe utilizzare il web mining per raccogliere informazioni sull’uso di parole chiave specifiche nei contenuti web. In alternativa, i rivenditori e altri professionisti del marketing utilizzano il data mining online per individuare le tendenze nel traffico web, la conversione dei visitatori del sito in acquirenti e altri utilizzi del web.
In termini di raccolta, ordinamento e analisi dei dati, il web mining imita le tradizionali attività di data mining. Comparativamente, le attività di web mining si concentrano su informazioni basate sul web, piuttosto che su un’ampia sezione trasversale di fonti di informazioni come database di computer offline, record dei clienti o dati contabili cartacei, come avviene tipicamente con il data mining tradizionale. Concentrarsi esclusivamente sulla raccolta di dati da fonti online fornisce analisi mirate necessarie per strategie di marketing online, decisioni sulla struttura del sito Web e processi decisionali simili relativi al commercio elettronico. La raccolta di dati tramite il web mining fornisce anche l’ulteriore vantaggio di un’ampia demografia internazionale, poiché i siti Web di tutto il mondo sono disponibili per ricercatori e raccoglitori di informazioni.
Professionalmente, il web mining è diviso in tre categorie specifiche: mining di strutture web, mining di utilizzo e mining di contenuti web. Ogni area si concentra su informazioni specifiche come la struttura e i collegamenti ipertestuali di un particolare sito Web, le informazioni di registro del server relative all’utilizzo dei visitatori e contenuti specifici disponibili online. I pacchetti e i servizi software di analisi dei siti Web sono un ottimo esempio di mining sull’utilizzo del Web, fornendo ai webmaster informazioni relative al traffico dei visitatori, ai risultati di ricerca utilizzati, ai link cliccati e al tempo trascorso a interagire con pagine specifiche. Il mining di struttura, d’altra parte, fornisce informazioni dettagliate sulla struttura interna di un sito Web specifico, inclusi collegamenti ipertestuali, database e funzioni di query.
Al professionista del marketing, il web mining offre una ricchezza di utilizzi relativi alle attività di marketing. Sapere come i visitatori del sito utilizzano un determinato sito Web, come i concorrenti creano un sito concorrente e quali contenuti sono già online sono informazioni preziose. Tali informazioni aiutano i decisori chiave a creare una strategia di marketing basata su tecniche precedentemente comprovate e informazioni documentate.
I college e le università utilizzano anche il web mining tramite software che verifica che i documenti degli studenti siano unici e non plagiati. Utilizzando i principi di estrazione dei contenuti Web, tali aiutanti di classificazione cercano contenuti simili in tutta Internet. Gli istruttori caricano il testo di un documento dello studente e quindi indicano al software antiplagio di controllare in Internet frasi simili o testo copiato online. I risultati sono spesso espressi come percentuale del testo corrispondente. Vengono forniti collegamenti a risultati simili per consentire agli istruttori di visitare i siti per determinare se le corrispondenze sono effettivamente plagiate.