La minería web es una forma de recopilación de información que se aplica a los datos recopilados de fuentes en línea. La recopilación de datos de fuentes a través de Internet permite a los usuarios agregar grandes volúmenes de información para su análisis a fin de tomar decisiones comerciales clave en un entorno en línea. Por ejemplo, un investigador puede utilizar la minería web para recopilar información sobre el uso de palabras clave específicas en el contenido web. Alternativamente, los minoristas y otros profesionales del marketing utilizan la minería de datos en línea para detectar tendencias en el tráfico web, la conversión de visitantes del sitio en compradores y otros usos de la web.
En términos de recopilación, clasificación y análisis de datos, la minería web imita las actividades tradicionales de minería de datos. Comparativamente, las actividades de minería web se centran en información basada en la web, en lugar de una gran sección transversal de fuentes de información, como bases de datos informáticas fuera de línea, registros de clientes o datos contables impresos, como suele ocurrir con la minería de datos tradicional. Centrarse únicamente en la recopilación de datos de fuentes en línea proporciona un análisis específico necesario para las estrategias de marketing en línea, decisiones de estructura de sitios web y toma de decisiones similares relacionadas con el comercio electrónico. La recopilación de datos a través de la minería web también proporciona el beneficio adicional de un amplio grupo demográfico internacional, ya que los sitios web de todo el mundo están disponibles para investigadores y recolectores de información.
Profesionalmente, la minería web se divide en tres categorías específicas: minería de estructuras web, minería de uso y minería de contenido web. Cada área se centra en información específica, como la estructura y los hipervínculos de un sitio web en particular, información de registro del servidor con respecto al uso de los visitantes y contenido específico disponible en línea. Los paquetes y servicios de software de análisis de sitios web son un excelente ejemplo de la minería del uso de la web, proporcionando a los webmasters información sobre el tráfico de visitantes, los resultados de búsqueda utilizados, los enlaces en los que se hizo clic y el tiempo dedicado a interactuar con páginas específicas. La minería de estructuras, por otro lado, proporciona información detallada sobre la estructura interna de un sitio web específico, incluidos hipervínculos, bases de datos y funciones de consulta.
Para el profesional del marketing, la minería web ofrece una gran cantidad de usos relacionados con las actividades de marketing. Saber cómo los visitantes del sitio usan un sitio web en particular, cómo los competidores configuran un sitio de la competencia y qué contenido ya está en línea es información valiosa. Dicha información ayuda a los tomadores de decisiones clave a diseñar una estrategia de marketing basada en técnicas previamente probadas e información documentada.
Los colegios y universidades también utilizan la minería web a través de un software que verifica que los trabajos de los estudiantes sean únicos y no estén plagiados. Utilizando los principios de la minería de contenido web, estos asistentes de calificación buscan contenido similar en la totalidad de Internet. Los instructores cargan el texto de un documento del estudiante y luego indican al software de plagio que busque en Internet frases similares o texto copiado en línea. Los resultados a menudo se expresan como porcentaje del texto coincidente. Se proporcionan enlaces a resultados similares para permitir a los instructores la posibilidad de visitar sitios para determinar si las coincidencias están realmente plagiadas.