Che cos’è l’estrazione di dati spaziali?

Il data mining spaziale è il processo di tentativo di trovare modelli nei dati geografici. Più comunemente usato nella vendita al dettaglio, è cresciuto fuori dal campo del data mining, che inizialmente si concentrava sulla ricerca di modelli nelle informazioni elettroniche testuali e numeriche. Il data mining spaziale è considerato una sfida più complicata rispetto al mining tradizionale a causa delle difficoltà associate all’analisi di oggetti con esistenze concrete nello spazio e nel tempo.

Come per il data mining standard, il data mining spaziale viene utilizzato principalmente nel mondo del marketing e della vendita al dettaglio. È una tecnica per prendere decisioni su dove aprire che tipo di negozio. Può aiutare a informare queste decisioni elaborando dati preesistenti su quali fattori motivano i consumatori a recarsi in un luogo e non in un altro.

Diciamo che Ashley vuole aprire una discoteca in un certo isolato. Se avesse accesso ai dati appropriati, potrebbe utilizzare il data mining spaziale per scoprire quali fattori spaziali determinano il successo dei night club. Potrebbe porre domande del tipo: verranno più persone al club se i mezzi pubblici sono nelle vicinanze? Quale distanza dagli altri locali notturni massimizza il patrocinio? La vicinanza alle stazioni di servizio è un vantaggio o uno svantaggio?

Ashley potrebbe anche voler assicurarsi che le persone che vengono al suo nightclub arrivino in una distribuzione uniforme nel corso di una singola notte. Potrebbe anche utilizzare il data mining spaziale, forse più accurato, il data mining spaziotemporale, per scoprire come le persone si muovono attraverso la città in determinati momenti. La stessa procedura potrebbe essere applicata al patrocinio in diverse notti della settimana.

Le difficoltà di questo metodo sono il risultato della complessità del mondo al di là di Internet. Mentre gli sforzi passati per il data mining di solito avevano database maturi per l’analisi, gli input disponibili per il data mining spaziale non sono griglie di informazioni ma mappe. Queste mappe hanno diversi tipi di oggetti come strade, popolazioni, attività commerciali e così via.

Determinare se qualcosa è “vicino a” qualcos’altro passa dall’essere una variabile discreta a una variabile continua. Ciò aumenta enormemente la complessità richiesta per l’analisi. Incredibilmente, questo è uno dei tipi più semplici di relazioni disponibili per chi tenta di estrarre dati spaziali.
Il data mining spaziale affronta anche il problema dei falsi positivi. Nel processo di ricerca dei dati alla ricerca di relazioni, emergeranno molte tendenze apparenti come conseguenza di falsi positivi statistici. Questo problema esiste anche per il compito di estrarre un database più semplice, ma è amplificato dalla grandezza dei dati a disposizione del dataminer. In definitiva, una tendenza identificata dal data mining dovrebbe essere confermata attraverso il processo di spiegazione e ulteriori ricerche.