¿Qué es Data Stream Mining?

La minería de flujo de datos es una estrategia que implica identificar y extraer información de un flujo de datos activo. Con este enfoque, la idea es extraer los datos sin crear ningún tipo de interrupción en el flujo en sí, lo que hace posible que otros también hagan uso de los datos incluso mientras se está realizando la extracción. Este tipo de esfuerzo de extracción de flujo de datos puede involucrar todo tipo de datos, que van desde la transmisión de voz a video a través de Internet e incluso a tareas cotidianas como retirar dinero de una cuenta bancaria utilizando un cajero automático o mantener una conversación telefónica.

Una de las características de la minería de flujo de datos es la capacidad de proyectar o predecir con precisión cómo ubicar la información deseada y qué tipo de herramientas de descubrimiento de conocimiento ayudarán a ubicar y extraer con éxito la información deseada. Por ejemplo, cuando un cliente inicia una transacción utilizando un cajero automático, la programación de la máquina inicia una búsqueda de información relevante de la cuenta, localiza los datos y luego determina si el monto de la transacción reducirá el saldo de la cuenta por debajo de un monto permitido. según la forma en que está estructurada la cuenta. Desde allí, la programación puede devolver datos relevantes al usuario, como documentar la finalización exitosa de la transacción solicitada y proporcionar el saldo de la cuenta restante después de que se registre el crédito o débito involucrado con la transacción.

Otro ejemplo común de minería de flujo de datos es la búsqueda web básica mediante un navegador. Con esta aplicación, el usuario final ingresa valores de búsqueda en un campo, y el software que maneja el navegador busca interpretar esos valores y devolver datos que tengan alguna relevancia para los criterios de búsqueda. Dependiendo de cómo esté configurado el navegador, esto también puede incluir una función que busca anticipar la intención de la búsqueda que se está realizando y ofrecer palabras o frases adicionales que pueden ayudar a refinar la búsqueda más al gusto del usuario. Una vez que el usuario se ha decidido por la frase de búsqueda, el navegador devuelve los resultados en orden de clasificación, utilizando algoritmos que son relevantes para la configuración del propio navegador.

Uno de los principales beneficios de la minería de flujo de datos es la capacidad de acceder y buscar datos sin prohibir realmente que otros hagan uso de esos mismos datos. Dado que los flujos de datos se actualizan constantemente, los resultados de la extracción pueden cambiar de vez en cuando. Por ejemplo, realizar una búsqueda web utilizando una frase de búsqueda específica puede producir un conjunto de resultados hoy, pero proporcionar un conjunto de resultados ligeramente diferente mañana, según la información nueva que haya ingresado en el flujo de datos y cómo el motor de búsqueda clasifica esos datos.