ETL
3.4 Procesos básicos del Data WareHouse (ETL)
· Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.
· Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.
· Carga: al final del proceso de transformación, los datos están en forma para ser cargados. [1]
[1] http://www.monografias.com/trabajos17/data-warehouse/data-warehouse.shtml#loseleme
Los procesos básicos del Data WareHouse (ETL)
· Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.
· Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.
· Carga: al final del proceso de transformación, los datos están en forma para ser cargados. [1]
ETL - este termino viene de
ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar
y Cargar y se refiere a los datos en una empresa. ETL es el proceso que
organiza el flujo de los datos entre diferentes sistemas en una organización y
aporta los métodos y herramientas necesarias para mover datos desde múltiples
fuentes a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra
base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia
Empresarial (Business Intelligence), también llamado “Gestión de los Datos”
(Data Management).
La idea es que una aplicación ETL lea los datos primarios de unas bases de
datos de sistemas principales, realice transformación, validación, el proceso
cualitativo, filtración y al final escriba datos en el almacén y en este momento
los datos son disponibles para analizar por los usuarios.
Los más populares herramientas y aplicaciones ETL del mercado
[1] http://www.monografias.com/trabajos17/data-warehouse/data-warehouse.shtml#losproce
[2] http://etl-tools.info/es/bi/proceso_etl.htm
Referencias Bibliograficas.
[1] http://es.scribd.com/doc/27007744/Que-Es-Un-Data-Warehouse