¿Qué son las herramientas de minería de datos?

Las herramientas de minería de datos son componentes de software y teorías que permiten a los usuarios extraer información de los datos. Las herramientas brindan a las personas y las empresas la capacidad de recopilar grandes cantidades de datos y utilizarlos para tomar decisiones sobre un usuario o grupos de usuarios en particular. Algunos de los usos más comunes de las herramientas de minería de datos se encuentran en los campos del marketing, la protección contra el fraude y la vigilancia.

La extracción manual de datos existe desde hace cientos de años. Sin embargo, la automatización de la minería de datos ha prevalecido más desde los albores de la era de las computadoras. Durante el siglo XX, surgieron varias ciencias de la computación para ayudar a respaldar el concepto de desarrollo de herramientas de minería de datos. El objetivo general de la utilización de las herramientas es descubrir patrones ocultos. Por ejemplo, si una empresa de marketing descubre que una persona realiza un viaje mensual desde la ciudad de Nueva York a Los Ángeles, resulta beneficioso para esa empresa anunciar los detalles del destino a la persona.

Dentro de la industria de minería de datos, se han establecido estándares para definir los parámetros de uso de herramientas de minería de datos. Anualmente, el Grupo de Interés Especial sobre Descubrimiento de Conocimiento y Minería de Datos de la Asociación de Maquinaria de Computación (SIGKDD) celebra una reunión para determinar qué procesos se utilizan. El mismo grupo también es responsable de evaluar las implicaciones éticas del análisis de datos de personas y empresas. El grupo SIGKDD Explorations publica una revista semestral.

La herramienta más utilizada en la minería de datos es el proceso denominado Descubrimiento de conocimientos en bases de datos (KDD). KDD fue desarrollado en 1989 por Gregory Piatetsky-Shapiro. Con esta herramienta de minería de datos, los usuarios pueden procesar datos sin procesar, extraer los datos para obtener información e interpretar los diversos resultados en forma de gestión de la información.

Una de las formas más importantes de herramientas de minería de datos se utiliza para combatir el terrorismo en el siglo XXI. En los Estados Unidos, el National Research Council utiliza los conceptos de minería de patrones y minería de datos basada en sujetos para identificar la actividad terrorista en la gran cantidad de información en todo el mundo. La minería de patrones se define por el proceso de localizar patrones dentro de un gran volumen de datos. La minería de datos basada en sujetos intenta identificar las relaciones entre individuos. Ambas técnicas también se pueden utilizar en la práctica empresarial general al definir la mentalidad de una base de clientes y la relación interactiva entre los clientes.