La minería del almacén de datos es el análisis de la información contenida en una o más bases de datos para que la información sea útil. Estas bases de datos, o almacenes de datos, son un depósito central de datos. Las empresas agregan la información que recopilan sobre sus clientes en un almacén de datos. Una vez que se ha recopilado la información, se “extrae” y se extrae información útil de ella para producir información que pueda ayudar a la empresa a tomar decisiones comerciales que aumentarán las ganancias o reducirán los costos. Los minoristas utilizan con frecuencia la minería del almacén de datos para analizar y predecir el comportamiento de sus clientes.
Por ejemplo, cuando un comprador va al supermercado y le da al cajero su tarjeta de comprador frecuente, la información sobre sus compras se recopila y almacena en el almacén de datos de la empresa. Una cadena de supermercados tendrá millones de datos sobre qué compra la gente, cuándo, en qué cantidades y a qué precio. Una tienda puede saber que el año pasado se vendieron 50,000 paquetes de guisantes congelados, pero esa información por sí sola no es particularmente útil. Sin embargo, si la minería del almacén de datos revela que el 75% de esos guisantes congelados se vendieron durante los meses en los que no había guisantes frescos disponibles, o que el 10% de los guisantes se vendieron en las dos semanas previas al Día de Acción de Gracias, la empresa puede ser capaz de utilizar esa información para aumentar sus ventas anuales de guisantes congelados.
Las empresas pueden emplear técnicas de minería de almacenamiento de datos para predecir las ventas futuras. La minería de datos también puede ayudarlos a estimar el impacto de las decisiones de almacenamiento y precios. En el supermercado, la extracción de datos podría evitar que las tiendas se queden sin guisantes congelados en caso de una mala cosecha de guisantes frescos en un año determinado.
La regresión de minería de datos es una técnica de minería de datos que se utiliza para mostrar lo que es probable que suceda con un valor de datos si se cambia algo en la ecuación. Usando el ejemplo del supermercado, la regresión predeciría el nivel de ventas de guisantes congelados si los guisantes frescos aumentaran de precio. La regresión utiliza datos históricos y les aplica una fórmula que predice el comportamiento futuro.
Las empresas suelen utilizar una aplicación de software de minería de almacenamiento de datos para recopilar y extraer sus datos. La aplicación correcta está determinada por la cantidad de datos que tienen y el tipo de análisis que quieren hacer. Elegir la herramienta de minería de datos correcta es fundamental para recopilar e interpretar datos útiles.