¿Qué es ETL?

Piense en ello como una limpieza de la casa para sus datos. ETL significa extraer, transformar y cargar. ETL es un software que permite a las empresas consolidar sus datos dispares mientras los mueven de un lugar a otro, y realmente no importa que esos datos estén en diferentes formas o formatos. Los datos pueden provenir de cualquier fuente. ETL es lo suficientemente poderoso como para manejar tales disparidades de datos.

Por ejemplo, una institución financiera puede tener información sobre un cliente en varios departamentos y cada departamento puede tener la información de ese cliente listada de una manera diferente. El departamento de membresía puede enumerar al cliente por nombre, mientras que el departamento de contabilidad puede enumerar al cliente por número. ETL puede agrupar todos estos datos y consolidarlos en una presentación uniforme, como para almacenarlos en una base de datos o almacén de datos.

Otra forma en que las empresas utilizan ETL es mover información a otra aplicación de forma permanente. Por ejemplo, los datos de procesamiento de texto pueden traducirse en números y letras, que son más fáciles de rastrear en una hoja de cálculo o un programa de base de datos. Esto es particularmente útil para realizar copias de seguridad de la información a medida que las empresas realizan la transición a un nuevo software.

Una función importante de ETL es la «limpieza» de datos. Los protocolos de consolidación ETL también incluyen la eliminación de datos duplicados o fragmentarios, para que lo que pasa de la parte E del proceso a la parte L sea más fácil de asimilar y / o almacenar. Dichas operaciones de limpieza también pueden incluir la eliminación de ciertos tipos de datos del proceso. Si no desea incluir cierta información, puede personalizar su ETL para eliminar ese tipo de información de su transformación.

La parte T de la ecuación, por supuesto, es la más poderosa. ETL puede transformar no solo datos de diferentes departamentos, sino también datos de diferentes fuentes en conjunto. Por ejemplo, los datos de un programa de correo electrónico como Microsoft Outlook podrían transformarse junto con los datos de una aplicación de fabricación de SAP, y al final el resultado sería un hilo común. Microsoft, por supuesto, fabrica un paquete ETL, al igual que Oracle e IBM.