En la base de Data Mart se guardan las instancias de todos los procesos terminados y en ejecución. Los datos los utilizan los paneles de control para el análisis ampliado de datos. Estos datos se almacenan en esquemas de estrella, en lugar de en los formularios planos que utiliza la base de datos de Monitor. La base de datos de Data Mart se ha optimizado para las consultas agregadas y de larga ejecución utilizadas por DB2 Alphabloxen las vistas de los paneles de control para proporcionar informes multidimensionales avanzados. El Gestor de acciones también almacena datos en esta base de datos. Sólo hay una base de datos para Data Mart por instalación de WebSphere Business Monitor.
Los datos históricos nunca se suprimen automáticamente, por lo tanto, el administrador de base de datos se ocupará de suprimir los datos que ya no se necesitan. La base de datos del Data Mart guarda la información relativa a instancias de larga ejecución así como a instancias terminadas. Esta información se almacena en esquemas de estrella, en lugar de en los formularios transaccionales planos que utiliza la base de datos de Monitor. La base de datos de está optimizada para consultas de larga duración y datos agregados. La utiliza DB2 Alphablox en las vistas de controles para proporcionar informes multidimensionales avanzados.
En la base de datos de Data Mart, cada contexto de supervisión tiene su propia tabla y cada fila de la tabla es una instancia de proceso. A diferencia de la base de datos de Monitor, cada conjunto de tablas es un esquema de estrella que da soporte a los informes multidimensionales.
La base de datos contiene tablas dinámicas que se crean según el modelo de Monitor desplegado. El Generador de servicios de datos genera el esquema de la base de datos del Data Mart , que se utiliza para crear tablas dinámicas y definiciones de Cube Views.
La base de datos la utilizan los paneles de control de WebSphere Business Monitor. Los paneles de control recuperan los datos necesarios para llenar algunas vistas de la base de datos del Data Mart de datos. Por ejemplo, la vista Informe se centra en el análisis de los datos extraídos de la base de datos.
La base de datos del Data Mart contiene datos de diferentes versiones de instancias de proceso que están ejecutándose o que se han completado.[2]
FUENTES:
[1] http://www2.rhernando.net/modules/tutorials/doc/bd/dw.html
Bases de datos que intervienen en Data Warehouse
Las bases de datos que conforman el componente de almacenamiento físico del DW se caracterizan por los siguientes aspectos: ƒ
Integradas: Deben constituir un conjunto de datos y metadatos perfectamente integrados con respecto al nombre de las variables, formatos de los distintos campos, medida de los atributos, codificación, etc.
Temáticas: Las bases de datos deben conformarse hacia materias o temas, como clientes, productos, campañas, etc., a diferencia de las bases de datos de los sistemas operacionales, más orientadas a procesos administrativos.
Históricas: Este es un factor clave en la toma de decisiones, contar con información histórica para comparar datos en distintos períodos e identificar tendencias. El tiempo debe estar en todos y cada uno de los registros del DW, de manera que, cuando un dato entra en el DW se sepa en qué momento tenía ese valor.
No Volátiles: La información una vez incorporada al DW debe mantenerse, en general, invariable, cargándose una vez en el tiempo y no permitiendo actualizaciones de los datos. [1]
Bases de datos que intervienen en Data Mart
Base de Datos Multidimensional:
Llamada DATAMART en la cual se guardan los datos históricos correspondientes a los indicadores de gestión de calidad de DB Access. Todas las bases de dato se construyeron con SQL Server 2000.
Modelo Estrella de la Base de Datos Multidimensional
En la fase de análisis y diseño se realizaron los modelos estrellas, constituidos por las tablas de hecho y tablas de dimensiones para los indicadores de gestión de calidad deDB Access: Satisfacción del Cliente y Porcentaje de Utilización de Planta.
Queries Básicas y Reporting:
En este tipo de herramientas el usuario accede directamente a la estructura de las bases de datos relacionales para construir consultas e informes, vía SQL (estándar para el acceso a las bases de datos relacionales).
El SQL es un lenguaje muy extendido entre los programadores, pero no tanto entre los usuarios finales. Aunque estas herramientas escondan en cierta forma los comandos del SQL, sigue siendo necesario tener claro el modelo relacional en cuanto se quiere hacer algún informe complejo, por lo que su utilización directa no está recomendada a usuarios finales.
Queries y Reporting Avanzado:
Estas herramientas aportan una visión temática de las bases de datos relacionales (visión de negocio), mediante la cual el usuario final tiene una visión menos “técnica” del datamart.
Este tipo de herramientas pone una capa de términos que le son más familiares a los usuarios finales y establece, las interrelaciones de las tablas del datamart, de forma que sea más sencillo. Aún así, sigue siendo la estructura relacional básica la que subyace en estas herramientas.
Cognos:
A través de su interfaz simple al estilo de asistente, Cognos integra bases de datos y aplicaciones de Lotus Notes, el único producto de inteligencia de negocios que ofrece toda la gama de capacidades de inteligencia de negocios en una arquitectura única y probada.[2]
[1]http://lsi.ugr.es/rosana/investigacion/papers/bd_efsi04.pdf
[2] http://santacruzramos.wikispaces.com/3.3.3.2+Herramientas+de+bases+de+datos.
Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el data warehouse, esta vista estará dispuesta según unas dimensiones y podrá contener información calculada. El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un análisis multidimensional.
A la información de un cubo puede acceder el ejecutivo mediante "tablas dinámicas" en una hoja de cálculo o a través de programas personalizados. Las tablas dinámicas le permiten manipular las vistas (cruces, filtrados, organización, totales) de la información con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de información se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, éste es una colección de datos que está formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos elementos que participan en el análisis y variables a los valores que se desean analizar.
Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la información general complementaria a cada uno de los registros de la tabla de hechos.
También llamadas “indicadores de gestión”, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo” (medido en días, horas, semanas, etc.), ...
Ejemplos de variables podrían ser:
Ejemplos de dimensiones podrían ser:
Según lo anterior, podríamos construir un cubo de información sobre el índice de ventas (variable a estudiar) en función del producto vendido, la provincia, el mes del año y si el cliente está casado o soltero (dimensiones). Tendríamos un cubo de 4 dimensiones.
DM
- Sistemas de bases de datos tradicionales.
- Sistemas de Data Warehousing.
El Data Mining se basa en técnicas que han existido desde hace bastante tiempo. La razón de que ahora se haga uso de ellas para el minado de datos es que ahora existe una gran cantidad de datos recopilados, estructurados y organizados. En gran parte esto es debido a los sistemas de bases de datos, que permiten asegurar características tales como la integridad y la seguridad.
Las aplicaciones de minería de datos deberían tenerse muy en cuenta desde un principio, durante el diseño de un almacén de datos. Asimismo, las herramientas de minería de datos deberían ser diseñadas para facilitar su uso en conjunción con los almacenes de datos. De hecho, para muchas bases de datos de gran tamaño que se convierten en terabytes de datos, el éxito de la utilización de aplicaciones de minería de bases de datos dependerá en primer lugar de la construcción de un almacén de datos.
[1] http://www.gestiopolis.com/canales8/ger/data-mining-y-los-sistemas-de-base-de-datos.htm
Bases de Datos que Intervienen en DWH y DM
Bases de datos que intervienen en DataWarehouse
Las bases de datos que pueden conformar los DataWarehouse son:
· Integradas: Deben constituir un conjunto de datos y metadatos perfectamente integrados con respecto al nombre de las variables, formatos de los distintos campos, medida de los atributos, codificación, etc.
· Temáticas: Las bases de datos deben conformarse hacia materias o temas, como clientes, productos, campañas, etc., a diferencia de las bases de datos de los sistemas operacionales, más orientados a procesos administrativos.
· Históricas: Este es un factor clave en la toma de decisiones, contar con información histórica para comparar datos en distintos períodos e identificar tendencias. El tiempo debe estar en todos y cada uno de los registros del DW, de manera que, cuando un dato entra en el DW se sepa en qué momento tenía ese valor.
· No Volátiles: La información una vez incorporada al DW debe mantenerse, en general, invariable, cargándose una vez en el tiempo y no permitiendo actualizaciones de los datos. [1]
Bases de datos que intervienen en Data Mart
Las bases de datos que pueden intervenir en un DataMart son:
· Base de Datos Multidimensional:
Llamada DATAMART en la cual se guardan los datos históricos correspondientes a los indicadores de gestión de calidad de DB Access. Todas las bases de dato se construyeron con SQL Server 2000.
Modelo Estrella de la Base de Datos Multidimensional
En la fase de análisis y diseño se realizaron los modelos estrellas, constituidos por las tablas de hecho y tablas de dimensiones para los indicadores de gestión de calidad de DB Access: Satisfacción del Cliente y Porcentaje de Utilización de Planta.
· Queries Básicas y Reporting:
En este tipo de herramientas el usuario accede directamente a la estructura de las bases de datos relacionales para construir consultas e informes, vía SQL (estándar para el acceso a las bases de datos relacionales).
El SQL es un lenguaje muy extendido entre los programadores, pero no tanto entre los usuarios finales. Aunque estas herramientas escondan en cierta forma los comandos del SQL, sigue siendo necesario tener claro el modelo relacional en cuanto se quiere hacer algún informe complejo, por lo que su utilización directa no está recomendada a usuarios finales.
· Queries y Reporting Avanzado:
Estas herramientas aportan una visión temática de las bases de datos relacionales (visión de negocio), mediante la cual el usuario final tiene una visión menos “técnica” del DataMart.
Este tipo de herramientas pone una capa de términos que le son más familiares a los usuarios finales y establece, las interrelaciones de las tablas del DataMart, de forma que sea más sencillo. Aun así, sigue siendo la estructura relacional básica la que subyace en estas herramientas.
· Cognos:
A través de su interfaz simple al estilo de asistente, Cognos integra bases de datos y aplicaciones de Lotus Notes, el único producto de inteligencia de negocios que ofrece toda la gama de capacidades de inteligencia de negocios en una arquitectura única y probada. [2]
Fuentes:
BASES DE DATOS Y DATA WAREHOUSE:
En el marco actual de la empresa, la confluencia de nuevas infraestructuras de comunicación con potentes y flexibles herramientas de tratamiento de información (bases de datos, Data Warehouse −DW−, Data Mining,...) mejoran la calidad, cantidad y eficiencia de los datos comerciales, así como el análisis, procesamiento y comunicación de los mismos. En otras palabras, pueden aportar a las corporaciones la base tecnológica necesaria para afrontar los nuevos retos de la situación actual y las perspectivas de futuro de la gestión comercial. De ahí, que en este trabajo, se resalte el hecho de que las bases de datos y el DW permiten en primera instancia el almacenamiento adecuado de los datos obtenidos de las actividades habituales de organización, producción, control de gestión, marketing, planificación estratégica etc.. Pero, además se incide en otro hecho, que es el que a través de dichas herramientas las corporaciones pueden extraer de dichos datos, la información y el conocimiento que necesitan para identificar y responder estratégicamente a las necesidades de su actividad comercial. Permitiendo un mejor conocimiento del cliente para poder desarrollar productos y/o servicios enfocados a sus expectativas.
Ayudando a desarrollar campañas basadas en perfiles con productos, ofertas y mensajes dirigidos específicamente a ciertos tipos de clientes. Como resultado se mejora el proceso de comunicación entre la empresa y el cliente, hecho que redunda en la fidelización de los clientes y en el aumento drástico de la eficacia de las acciones de comunicación.[1]
BASE DE DATOS DATAMART
Actualmente la mayor parte de las empresas cuenta con sistemas de información atomizados respondiendo cada cual a un uso diferente. En el momento de la toma de decisiones, las áreas de estadística y economía destinan gran parte de su tiempo a la recolección y homogeneización de los datos y normalmente estos son utilizados solo una vez y con un fin especifico. Como consecuencia, si en un futuro se necesita ver la información obtenida con datos actualizados, hay que repetir el proceso de obtención y proceso de datos.[2]
[2] http://segunda-wiki.wikispaces.com/file/view/USO+DEL+DATAMART.pdf
[1] http://lsi.ugr.es/rosana/investigacion/papers/bd_efsi04.pdf
Datamart.
Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información.Por tanto, para crear el datamart de un área funcional de la empresa es preciso encontrar la estructura óptima para el análisis de su información, estructura que puede estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designación de una u otra dependerá de los datos, los requisitos y las características específicas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts:
Referencias bibliograficas.
[1] http://lsi.ugr.es/rosana/investigacion/papers/bd_efsi04.pdf
[2] http://definiciondeconceptos.blogspot.mx/