Che cos’è l’estrazione del flusso di dati?

Il data stream mining è una strategia che prevede l’identificazione e l’estrazione di informazioni da un flusso di dati attivo. Con questo approccio, l’idea è quella di estrarre i dati senza creare alcun tipo di interruzione nel flusso stesso, consentendo anche ad altri di utilizzare i dati anche mentre l’estrazione è in corso. Questo tipo di attività di estrazione del flusso di dati può coinvolgere tutti i tipi di dati, dalla trasmissione vocale a quella video su Internet e persino alle attività quotidiane come prelevare denaro da un conto bancario utilizzando un bancomat o tenere una conversazione telefonica.

Una delle caratteristiche del data stream mining è la capacità di proiettare o prevedere con precisione come individuare le informazioni desiderate e quale tipo di strumenti di knowledge discovery aiuterà a individuare ed estrarre con successo le informazioni desiderate. Ad esempio, quando un cliente avvia una transazione utilizzando uno sportello automatico, la programmazione della macchina avvia una ricerca di informazioni rilevanti sul conto, individua i dati e quindi determina se l’importo della transazione ridurrà il saldo del conto al di sotto di un importo consentito, in base a come è strutturato il conto. Da lì, la programmazione può restituire all’utente dati rilevanti, come documentare il completamento con successo della transazione richiesta e fornire il saldo del conto rimanente dopo la registrazione del credito o dell’addebito coinvolti nella transazione.

Un altro esempio comune di data stream mining è la ricerca web di base utilizzando un browser. Con questa applicazione, l’utente finale inserisce i valori di ricerca in un campo e il software che guida il browser cerca di interpretare quei valori e restituire i dati che hanno una certa rilevanza per i criteri di ricerca. A seconda di come è configurato il browser, questo può includere anche una funzionalità che cerca di anticipare l’intento della ricerca condotta e offre parole o frasi aggiuntive che possono aiutare a perfezionare la ricerca secondo i gusti dell’utente. Una volta che l’utente si è assestato sulla frase di ricerca, il browser restituisce i risultati in ordine di graduatoria, utilizzando algoritmi rilevanti per la configurazione del browser stesso.

Uno dei principali vantaggi del data stream mining è la possibilità di accedere e cercare i dati senza vietare ad altri di utilizzare gli stessi dati. Poiché i flussi di dati sono in costante aggiornamento, i risultati dell’estrazione possono cambiare di volta in volta. Ad esempio, condurre una ricerca sul Web utilizzando una frase di ricerca specifica può produrre un insieme di risultati oggi, ma fornire un insieme di risultati leggermente diverso domani, in base a quali nuove informazioni sono entrate nel flusso di dati e in che modo il motore di ricerca classifica tali dati.