Consideralo come una pulizia della casa per i tuoi dati. ETL sta per estrazione, trasformazione e caricamento. ETL è un software che consente alle aziende di consolidare i propri dati disparati spostandoli da un luogo all’altro, e non importa che i dati siano in forme o formati diversi. I dati possono provenire da qualsiasi fonte. ETL è abbastanza potente da gestire tali disparità di dati.
Ad esempio, un istituto finanziario potrebbe avere informazioni su un cliente in diversi reparti e ogni reparto potrebbe avere le informazioni di quel cliente elencate in modo diverso. Il dipartimento di appartenenza potrebbe elencare il cliente per nome, mentre il dipartimento di contabilità potrebbe elencare il cliente per numero. ETL può raggruppare tutti questi dati e consolidarli in una presentazione uniforme, ad esempio per l’archiviazione in un database o in un data warehouse.
Un altro modo in cui le aziende utilizzano l’ETL è spostare le informazioni in un’altra applicazione in modo permanente. Ad esempio, i dati di elaborazione testi potrebbero essere tradotti in numeri e lettere, che sono più facili da tenere traccia in un foglio di calcolo o in un programma di database. Ciò è particolarmente utile per il backup delle informazioni quando le aziende passano completamente al nuovo software.
Una funzione importante di ETL è la “pulizia” dei dati. I protocolli di consolidamento ETL prevedono anche l’eliminazione di dati duplicati o frammentari, in modo che ciò che passa dalla porzione E del processo alla porzione L sia più facile da assimilare e/o memorizzare. Tali operazioni di pulizia possono includere anche l’eliminazione di determinati tipi di dati dal processo. Se non desideri includere determinate informazioni, puoi personalizzare il tuo ETL per eliminare quel tipo di informazioni dalla tua trasformazione.
La parte T dell’equazione, ovviamente, è la più potente. ETL può trasformare non solo i dati provenienti da diversi reparti, ma anche i dati provenienti da diverse fonti. Ad esempio, i dati in un programma di posta elettronica come Microsoft Outlook potrebbero essere trasformati insieme ai dati di un’applicazione di produzione SAP, con il risultato di essere dati di un thread comune alla fine. Microsoft, ovviamente, crea un pacchetto ETL, così come Oracle e IBM.