¿Qué es la minería de datos espaciales?

La minería de datos espaciales es el proceso de intentar encontrar patrones en datos geográficos. Más comúnmente utilizado en el comercio minorista, ha surgido del campo de la minería de datos, que inicialmente se centró en encontrar patrones en la información electrónica textual y numérica. La minería de datos espaciales se considera un desafío más complicado que la minería tradicional debido a las dificultades asociadas con el análisis de objetos con existencias concretas en el espacio y el tiempo.

Al igual que con la minería de datos estándar, la minería de datos espaciales se utiliza principalmente en el mundo del marketing y la venta minorista. Es una técnica para tomar decisiones sobre dónde abrir qué tipo de tienda. Puede ayudar a informar estas decisiones procesando datos preexistentes sobre qué factores motivan a los consumidores a ir a un lugar y no a otro.

Digamos que Ashley quiere abrir un club nocturno en cierta cuadra de la ciudad. Si tuviera acceso a los datos adecuados, podría utilizar la minería de datos espaciales para averiguar qué factores espaciales hacen que los clubes nocturnos sean exitosos. Podría hacer preguntas como: ¿Vendrán más personas al club si el transporte público está cerca? ¿Qué distancia de otros lugares de vida nocturna maximiza el patrocinio? ¿La proximidad a las estaciones de servicio es una ventaja o una desventaja?

Ashley también podría querer asegurarse de que las personas que vienen a su club nocturno lleguen en una distribución uniforme en el transcurso de una noche individual. También podría utilizar la minería de datos espaciales (quizás más precisamente, la minería de datos espacio-temporal) para averiguar cómo se mueven las personas por la ciudad en determinados momentos. El mismo proceso podría aplicarse al patrocinio en diferentes noches de la semana.

Las dificultades de este método son el resultado de la complejidad del mundo más allá de Internet. Mientras que los esfuerzos anteriores en la minería de datos por lo general tenían bases de datos listas para el análisis, las entradas disponibles para la minería de datos espaciales no son cuadrículas de información sino mapas. Estos mapas tienen diferentes tipos de objetos como carreteras, poblaciones, empresas, etc.

Determinar si algo está “cerca” de otra cosa pasa de ser una variable discreta a una continua. Esto aumenta enormemente la complejidad requerida para el análisis. Increíblemente, este es uno de los tipos de relaciones más simples disponibles para alguien que intenta la minería de datos espaciales.
La minería de datos espaciales también se enfrenta al problema de los falsos positivos. En el proceso de búsqueda de datos en busca de relaciones, surgirán muchas tendencias aparentes como consecuencia de falsos positivos estadísticos. Este problema también existe para la tarea de extraer una base de datos más simple, pero se ve amplificado por la magnitud de los datos disponibles para el minero de datos. En última instancia, una tendencia identificada por la minería de datos debe confirmarse mediante el proceso de explicación e investigación adicional.