3 Data Warehouse y DataMart 3.6 Propuesta de Bases de Datos Estratégicas.(25 09 2012)

75 views
Skip to first unread message

Administrador Grupo

unread,
Sep 18, 2012, 11:30:33 AM9/18/12
to itecnodgo_nint...@googlegroups.com
Investigue sobre las bases de datos que intervienen en DWH y DM.

FE 25 09 2012

deyci.quezada

unread,
Sep 19, 2012, 11:06:29 PM9/19/12
to itecnodgo_nint...@googlegroups.com
BASES DE DATOS EN DATAWERHOUSE
  • Relacionales.
  • documentales.
  • Geográficas.
  • Archivos. [1]
BASES DE DATOS DATAMART

En la base de Data Mart se guardan las instancias de todos los procesos terminados y en ejecución. Los datos los utilizan los paneles de control para el análisis ampliado de datos. Estos datos se almacenan en esquemas de estrella, en lugar de en los formularios planos que utiliza la base de datos de Monitor. La base de datos de Data Mart se ha optimizado para las consultas agregadas y de larga ejecución utilizadas por DB2 Alphabloxen las vistas de los paneles de control para proporcionar informes multidimensionales avanzados. El Gestor de acciones también almacena datos en esta base de datos. Sólo hay una base de datos para Data Mart por instalación de WebSphere Business Monitor.

Los datos históricos nunca se suprimen automáticamente, por lo tanto, el administrador de base de datos se ocupará de suprimir los datos que ya no se necesitan. La base de datos del Data Mart guarda la información relativa a instancias de larga ejecución así como a instancias terminadas. Esta información se almacena en esquemas de estrella, en lugar de en los formularios transaccionales planos que utiliza la base de datos de Monitor. La base de datos de está optimizada para consultas de larga duración y datos agregados. La utiliza DB2 Alphablox en las vistas de controles para proporcionar informes multidimensionales avanzados.

En la base de datos de Data Mart, cada contexto de supervisión tiene su propia tabla y cada fila de la tabla es una instancia de proceso. A diferencia de la base de datos de Monitor, cada conjunto de tablas es un esquema de estrella que da soporte a los informes multidimensionales.

La base  de datos contiene tablas dinámicas que se crean según el modelo de Monitor desplegado. El Generador de servicios de datos genera el esquema de la base de datos del Data Mart , que se utiliza para crear tablas dinámicas y definiciones de Cube Views.

La base de datos la utilizan los paneles de control de WebSphere Business Monitor. Los paneles de control recuperan los datos necesarios para llenar algunas vistas de la base de datos del Data Mart de datos. Por ejemplo, la vista Informe se centra en el análisis de los datos extraídos de la base de datos.

La base de datos del Data Mart contiene datos de diferentes versiones de instancias de proceso que están ejecutándose o que se han completado.[2]

FUENTES:

[1] http://www2.rhernando.net/modules/tutorials/doc/bd/dw.html 

[2] http://publib.boulder.ibm.com/infocenter/dmndhelp/v6rxmx/index.jsp? topic=/com.ibm.btools.help.monitor.doc/Doc/concepts/dbServices/md_datamartdatabase.html 


jmanuelgarciaaragon

unread,
Sep 20, 2012, 12:44:45 PM9/20/12
to itecnodgo_nint...@googlegroups.com

Bases de datos que intervienen en Data Warehouse

Las bases de  datos que conforman el componente de almacenamiento físico del DW se caracterizan por los siguientes aspectos: ƒ

Integradas:  Deben constituir un conjunto de datos y metadatos perfectamente integrados con respecto al nombre de las variables, formatos de los distintos campos, medida de los atributos, codificación, etc.

Temáticas: Las bases de datos deben conformarse hacia materias o temas, como clientes, productos, campañas, etc., a diferencia de las bases de datos de los sistemas operacionales, más orientadas a procesos administrativos. 

Históricas:  Este es un factor clave en la toma de decisiones, contar con información histórica para comparar datos en distintos períodos e identificar tendencias. El tiempo debe estar en todos y cada uno de los registros del DW, de manera que, cuando un dato entra en el DW se sepa en qué momento tenía ese valor.

No Volátiles: La información una vez incorporada al DW debe mantenerse, en general, invariable, cargándose una vez en el tiempo y no permitiendo actualizaciones de los datos. [1]

Bases de datos que intervienen en Data Mart

Base de Datos Multidimensional:

Llamada DATAMART en la cual se guardan los datos históricos correspondientes a los indicadores de gestión de calidad de DB Access. Todas las bases de dato se construyeron con SQL Server 2000.

Modelo Estrella de la Base de Datos Multidimensional

En la fase de análisis y diseño se realizaron los modelos estrellas, constituidos por las tablas de hecho y tablas de dimensiones para los indicadores de gestión de calidad deDB Access: Satisfacción del Cliente y Porcentaje de Utilización de Planta.

Queries Básicas y Reporting:

En este tipo de herramientas el usuario accede directamente a la estructura de las bases de datos relacionales para construir consultas e informes, vía SQL (estándar para el acceso a las bases de datos relacionales).

El SQL es un lenguaje muy extendido entre los programadores, pero no tanto entre los usuarios finales. Aunque estas herramientas escondan en cierta forma los comandos del SQL, sigue siendo necesario tener claro el modelo relacional en cuanto se quiere hacer algún informe complejo, por lo que su utilización directa no está recomendada a usuarios finales.

Queries y Reporting Avanzado:

Estas herramientas aportan una visión temática de las bases de datos relacionales (visión de negocio), mediante la cual el usuario final tiene una visión menos “técnica” del datamart.

Este tipo de herramientas pone una capa de términos que le son más familiares a los usuarios finales y establece, las interrelaciones de las tablas del datamart, de forma que sea más sencillo. Aún así, sigue siendo la estructura relacional básica la que subyace en estas herramientas.

Cognos:

A través de su interfaz simple al estilo de asistente, Cognos integra bases de datos y aplicaciones de Lotus Notes, el único producto de inteligencia de negocios que ofrece toda la gama de capacidades de inteligencia de negocios en una arquitectura única y probada.[2]

[1]http://lsi.ugr.es/rosana/investigacion/papers/bd_efsi04.pdf

[2] http://santacruzramos.wikispaces.com/3.3.3.2+Herramientas+de+bases+de+datos.

luis.galindo.ortega

unread,
Sep 24, 2012, 1:03:33 PM9/24/12
to itecnodgo_nint...@googlegroups.com
Datawarehouses  [1]

Modelo de Datos Dimensional

El modelo dimensional es una adaptación especializada del modelo relacional, solía representar datos en depósitos de datos, en un camino que los datos fácilmente pueden ser resumidos usando consultas OLAP. En el modelo dimensional, una base de datos consiste en una sola tabla grande de hechos que son descritos usando dimensiones y medidas.

Una dimensión proporciona el contexto de un hecho (como quien participó, cuando y donde pasó, y su tipo). Las dimensiones se toman en cuenta en la formulación de las consultas para agrupar hechos que están relacionados. Las dimensiones tienden a ser discretas y son a menudo jerárquicas; por ejemplo, la ubicación podría incluir el edificio, el estado, y el país.

Una medida es una cantidad que describe el hecho, tales como los ingresos. Es importante que las medidas puedan ser agregados significativamente - por ejemplo, los ingresos provenientes de diferentes lugares pueden sumarse.

En una consulta (OLAP), las dimensiones son escogidas y los hechos son agrupados y añadidos juntos para crear un reporte.

El modelo dimensional a menudo es puesto en práctica sobre la cima del modelo emparentado que usa un esquema de estrella, consistiendo en una mesa que contiene los hechos y mesas circundantes que contienen las dimensiones. Dimensiones en particular complicadas podrían ser representadas usando múltiples mesas, causando un esquema de copo de nieve.

Un almacen de datos (data warehouse) puede contener múltiples esquemas de estrella que comparten tablas de dimensión, permitiéndoles para ser usadas juntas. La llegada levanta un conjunto de dimensiones estándar y es una parte importante del modelado dimensional. [2]

Modelos de Datos Conceptuales

Son los orientados a la descripción de estructuras de datos y restricciones de integridad. Se usan fundamentalmente durante la etapa de Análisis de un problema dado y están orientados a representar los elementos que intervienen en ese problema y sus relaciones. El ejemplo más típico es el Modelo Entidad-Relación.

Modelos de Datos Lógicos

Son orientados a las operaciones más que a la descripción de una realidad. Usualmente están implementados en algún Manejador de Base de Datos. El ejemplo más típico es el Modelo Relacional, que cuenta con la particularidad de contar también con buenas características conceptuales (Normalización de bases de datos).

Modelos de Datos Físicos

Son estructuras de datos a bajo nivel implementadas dentro del propio manejador. Ejemplos típicos de estas estructuras son los Árboles B+, las estructuras de Hash, etc. [3]

Datamarts

La categorizacion de Dtamarts esta absada principalmente en la fuente de datos que alimenta al datamart. Se mencionan tres tipos a continuacion:

1. Multidimensional Datamarts
2. Relational Datamarts
3. Networked Datamarts

Multidimensional Datamarts:

Contienen solo datos numericos
Mantienen su estructura mientras los datos ingresan al sistema
Solo los campos modificados se actualizan y no otros

Relational Data Marts :

Contiene datos numericos y alfanumericos
Soprta los esquemas "Star" y "Snowflake" (Estrella y Copo de Nieve)
Mantiene los datos estructurados
Emplea indices mientras crea datamarts

Networked Data Marts:

Los datos necesitan ser limpiados y estandarizados
Todos los Datamarts distribuidos pueden ser accesados desde una estacion de trabajo
Contienen un directorio de metadatos [4]

Bibliografia

Victor Manuel Niebla Romero

unread,
Sep 24, 2012, 10:28:01 PM9/24/12
to itecnodgo_nint...@googlegroups.com
  1. Bases de datos que intervienen en DW y DM

Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que recoge información de múltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la Toma de Decisiones -es decir, en el análisis de la información- en vez de en su captura. Una vez reunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos históricos; así los almacenes de datos proporcionan al usuario una interfaz consolidada única para los datos, lo que hace más fácil escribir las consultas para la toma de decisiones.

Diferencias entre almacén de datos y base de datos

Base de Datos Operacional  Almacén de Datos
Datos operacionales             Datos del negocio para Información
Orientado a aplicación         Orientado al sujeto
Actual                                  Actual + Histórico
Detallada                             Detallada + Resumida
Cambia continuamente          Estable

La estructura lógica de un Almacén de Datos está compuesta por los siguientes niveles:

  • Metadatos. Describen la estructura de los datos contenidos en el almacén.
  • Están en una dimensión distinta al resto de niveles.
  • Datos detallados actuales. Obtenidos directamente del procesado de los datos.
  • Forman el nivel más bajo de detalle.
  • Ocupan mucho espacio.
  • Se almacenan en disco, para facilitar el acceso.
  • Datos detallados históricos. Igual que los anteriores, pero con datos correspondientes al pasado.
  • Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente.
  • Datos ligeramente resumidos. Primer nivel de agregación de los datos detallados actuales.
  • Corresponden a consultas habituales.
  • Se almacenan en disco.
  • Datos muy resumidos. Son el nivel más alto de agregación.
  • Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rápidamente.
  • Suelen estar separados del Almacén de datos, formando Supermercados de Datos (Data Marts).

La estructura física puede presentar cualquiera de las siguientes configuraciones:

Arquitectura centralizada. Todo el Almacén de datos se encuentra en un único servidor.
Arquitectura distribuida. Los datos del Almacén se reparten entre varios servidores. Asignando cada servidor a uno o varios temas lógicos.
Arquitectura distribuida por niveles. Refleja la estructura lógica del Almacén, asignando los servidores en función del nivel de agregación de los datos que contienen. Un servidor está dedicado para los datos de detalle, otro para los resumidos y otro para los muy resumidos.
Cuando los datos muy resumidos se duplican en varios servidores para agilizar el acceso se habla de Supermercados de datos (Data Marts). [1]

Un modelo de base de datos es una teoría o especificación que describe como una base de datos es estructurada y usada. Varios modelos han sido sugeridos.
Modelos comunes:
  • Modelo jerárquico
  • Modelo de red
  • Modelo relacional
  • Modelo entidad-relación
  • Modelo objeto-relacional
  • Modelo de objeto también define el conjunto de las operaciones que pueden ser realizadas sobre los datos. El modelo relacional, por ejemplo, define operaciones como selección, proyección y unión. Aunque estas operaciones pueden no ser explícitas en un lenguaje de consultas particular, proveen las bases sobre las que éstos son construidos.

Modelo de tabla

El modelo de tabla consiste en una serie única, bidimensional de elementos de datos, donde todos los miembros de una columna dada son asumidos para ser valores similares, y todos los miembros de una fila son asumidos para ser relacionados el uno con el otro. Por ejemplo, columnas para el nombre y la contraseña que podría ser usada como una parte de una base de datos de seguridad de sistema. Cada fila tendría la contraseña específica asociada con un usuario individual. Las columnas de la tabla a menudo tienen un tipo asociado con ellos, definiéndolos como datos de carácter, fecha o la información de tiempo, números enteros, o números de punto flotante.

Modelo jerárquico

En un modelo jerárquico, los datos son organizados en una estructura parecida a un árbol, implicando un eslabón solo ascendente en cada registro para describir anidar, y un campo de clase para guardar los registros en un orden particular en cada lista de mismo-nivel. Las estructuras jerárquicas fueron usadas extensamente en los primeros sistemas de gestión de datos de unidad central, como el Sistema de Dirección de Información (IMS) por la IBM, y ahora describen la estructura de documentos XML. Esta estructura permite un 1:N en una relación entre dos tipos de datos. Esta estructura es muy eficiente para describir muchas relaciones en el verdadero real; recetas, índice, ordenamiento de párrafos/versos, alguno anidó y clasificó la información. Sin embargo, la estructura jerárquica es ineficaz para ciertas operaciones de base de datos cuando un camino lleno (a diferencia del eslabón ascendente y el campo de clase) también no es incluido para cada registro.
Una limitación del modelo jerárquico es su inhabilidad de representar manera eficiente la redundancia en datos. Los modelos de base de datos " el valor de atributo de entidad " como Caboodle por Swink están basados en esta estructura.
En la relación Padre-hijo: El hijo sólo puede tener un padre pero un padre puede tener múltiples hijos. Los padres e hijos son atados juntos por eslabones "indicadores" llamados. Un padre tendrá una lista de indicadores de cada uno de sus hijos.

Modelo de red

El modelo de red (definido por la especificación CODASYL) organiza datos que usan dos fundamental construcciones, registros llamados y conjuntos. Los registros contienen campos (que puede ser organizado jerárquicamente, como en el lenguaje COBOL de lenguaje de programación). Los conjuntos (para no ser confundido con conjuntos matemáticos) definen de uno a varios relaciones entre registros: un propietario, muchos miembros. Un registro puede ser un propietario en cualquier número de conjuntos, y un miembro en cualquier número de conjuntos.
El modelo de red es una variación sobre el modelo jerárquico, al grado que es construido sobre el concepto de múltiples ramas(estructuras de nivel inferior) emanando de uno o varios nodos (estructuras de nivel alto), mientras el modelo se diferencia del modelo jerárquico en esto las ramas pueden estar unidas a múltiples nodos. El modelo de red es capaz de representar la redundancia en datos de una manera más eficiente que en el modelo jerárquico.
Las operaciones del modelo de red son de navegación en el estilo: un programa mantiene una posición corriente, y navega de un registro al otro por siguiente las relaciones en las cuales el registro participa. Los registros también pueden ser localizados por suministrando valores claves.
Aunque esto no sea un rasgo esencial del modelo, las bases de datos de red generalmente ponen en práctica las relaciones de juego mediante indicadores que directamente dirigen la ubicación de un registro sobre el disco. Esto da el funcionamiento de recuperación excelente, a cargo de operaciones como la carga de base de datos y la reorganización.
La mayor parte de bases de datos de objeto usan el concepto de navegación para proporcionar la navegación rápida a través de las redes de objetos, generalmente usando identificadores de objeto como indicadores "inteligentes" de objetos relacionados. Objectivity/DB, por ejemplo, los instrumentos llamados 1:1, 1:muchos, muchos:1 y muchos:muchos, llamados relaciones que pueden cruzar bases de datos. Muchas bases de datos de objeto también apoyan SQL, combinando las fuerzas de ambos modelos.
El modelo de red (definido por la especificación CODASYL) organiza datos que usan dos fundamental construcciones, registros llamados y conjuntos. Los registros contienen campos (que puede ser organizado jerárquicamente, como en el lenguaje COBOL de lenguaje de programación). Los conjuntos (para no ser confundido con conjuntos matemáticos) definen de uno a varios relaciones entre registros: un propietario, muchos miembros. Un registro puede ser un propietario en cualquier número de conjuntos, y un miembro en cualquier número de conjuntos. El modelo de red es una variación sobre el modelo jerárquico, al grado que es construido sobre el concepto de múltiples ramas(estructuras de nivel inferior) emanando de uno o varios nodos (estructuras de nivel alto), mientras el modelo se diferencia del modelo jerárquico en esto las ramas pueden estar unidas a múltiples nodos. El modelo de red es capaz de representar la redundancia en datos de una manera más eficiente que en el modelo jerárquico.efinen de uno a varios relaciones entre registros: un propietario, muchos miembros. Un registro puede ser un propietario en cualquier númer Las operaciones del modelo de red son de navegación en el estilo: un programa mantiene una posición corriente, y navega de un registro al otro por siguiente las relaciones en las cuales el registro participa. Los registros también pueden ser localizados por suministrando valores claves. Aunque esto no sea un rasgo esencial del modelo, las bases de datos de red generalmente ponen en práctica las relaciones de juego mediante indicadores que directamente. dirigen la ubicación de un registro sobre el disco. Esto da el funcionamiento de recuperación excelente, a cargo de operaciones como la carga de base de datos y la reorganización.efinen de uno a varios relaciones entre registros: un propietario, muchos miembros. Un registro puede ser un propietario en cualquier númer

Modelo Dimensional

El modelo dimensional es una adaptación especializada del modelo relacional, solía representar datos en depósitos de datos, en un camino que los datos fácilmente pueden ser resumidos usando consultas OLAP. En el modelo dimensional, una base de datos consiste en una sola tabla grande de hechos que son descritos usando dimensiones y medidas.
Una dimensión proporciona el contexto de un hecho (como quien participó, cuando y donde pasó, y su tipo). Las dimensiones se toman en cuenta en la formulación de las consultas para agrupar hechos que están relacionados. Las dimensiones tienden a ser discretas y son a menudo jerárquicas; por ejemplo, la ubicación podría incluir el edificio, el estado, y el país.
Una medida es una cantidad que describe el hecho, tales como los ingresos. Es importante que las medidas puedan ser agregados significativamente - por ejemplo, los ingresos provenientes de diferentes lugares pueden sumarse.
En una consulta (OLAP), las dimensiones son escogidas y los hechos son agrupados y añadidos juntos para crear un reporte.
El modelo dimensional a menudo es puesto en práctica sobre la cima del modelo emparentado que usa un esquema de estrella, consistiendo en una mesa que contiene los hechos y mesas circundantes que contienen las dimensiones. Dimensiones en particular complicadas podrían ser representadas usando múltiples mesas, causando un esquema de copo de nieve.
Un almacen de datos (data warehouse) puede contener múltiples esquemas de estrella que comparten tablas de dimensión, permitiéndoles para ser usadas juntas. La llegada levanta un conjunto de dimensiones estándar y es una parte importante del modelado dimensional.

Modelo de objeto

En años recientes, el paradigma mediante objetos ha sido aplicado a la tecnología de base de datos, creando un nuevo modelo de programa sabido(conocido) como bases de datos de objeto. Estas bases de datos intentan traer el mundo de base de datos y el uso que programa el mundo más cerca juntos, en particular por asegurando que la base de datos usa el mismo sistema de tipo que el programa de uso. Esto apunta para evitar el elevado (a veces mencionaba el desajuste de impedancia) de convertir la información entre su representación en la base de datos (por ejemplo como filas en mesas) y su representación en el programa de uso (típicamente como objetos). Al mismo tiempo, las bases de datos de objeto intentan introducir las ideas claves de programa de objeto, como encapsulation y polimorfismo, en el mundo de bases de datos.
Una variedad de estas formas ha sido aspirada almacenando objetos en una base de datos. Algunos productos se han acercado al problema del uso que programa el final, por haciendo los objetos manipulados según el programa persistente. Esto también típicamente requiere la adición de una especie de lengua de pregunta, ya que lenguajes de programación convencionales no tienen la capacidad de encontrar objetos basados en su contenido de la información. Los otros han atacado el problema a partir del final de base de datos, por definiendo un modelo de datos mediante objetos para la base de datos, y definiendo un lenguaje de programación de base de datos que permite a capacidades de programa llenas así como instalaciones de pregunta tradicionales.

Las bases de datos de objeto han sufrido debido a la carencia de estandarización: aunque las normas fueran definidas por ODMG, nunca fueron puestas en práctica lo bastante bien para asegurar la interoperabilidad entre productos. Sin embargo, las bases de datos de objeto han sido usadas satisfactoriamente en muchos usos:Usualmente aplicaciones especialisadas como bases de datos de ingenieria, base de datos biologica molecualar, más bien que proceso de datos establecido comercial. Sin embargo, las ideas de base de datos de objeto fueron recogidas por los vendedores emparentados y extensiones influidas hechas a estos productos y de verdad a la lengua SQL. [2]

Referencias Bibliográficas

francisco.gonzalez.cassio

unread,
Sep 24, 2012, 11:54:50 PM9/24/12
to itecnodgo_nint...@googlegroups.com
Que Bases de Datos Intervienen en los DWH Y DM.

Hoy en día, las grandes empresas necesitan de grandes sistemas para manejar de una forma optima y organizada la información de clientes, personal, inventario, etc. Para realizar esta función algo compleja, en la actualidad existen los llamados sistemas gestores de bases de datos (SGBD), estas aplicaciones permiten tener nuestros datos centralizados y relacionados de tal forma que no haya en lo posible redundancia de datos, como ocurría antes con los sistemas de archivos. No debemos olvidar que para que el SGBD trabaje de la mejor manera se necesita antes de todo realizar un buen diseño de la base de datos.

Existen diferentes modelos de bases de datos que resguardan la información, pueden usarse como fuentes del Data warehouse, entre ellos tenemos:

Bases de datos jerárquicas: almacenan su información en una estructura jerárquica. En este modelo los datos se organizan en una forma similar a un árbol (visto al revés), en donde un nodo padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas. Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que manejan un gran volumen de información y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento.

Bases de datos de red: Este fue creado para representar relaciones de datos complejas mas eficientes de lo que el modelo anterior permitía , para mejorar el desempeño de las bases de datos y para imponer un estándar. Este modelo es similar al jerárquico en muchos aspectos, sin embargo la diferencia radica, en que el modelo red, permite que un registro tenga mas de un padre, por consiguiente, las relaciones pueden manejarse fácilmente por este modelo.

Bases de Datos transaccionales: Son bases de datos cuyo único fin es el envió y recepción de datos a grandes velocidades, estas bases son muy poco comunes y están dirigidas por lo general al entorno de análisis de calidad, datos de producción e industrial, es importante entender que su fin único es recolectar y recuperar los datos a la mayor velocidad posible, por lo tanto la redundancia y duplicación de información no es un problema como con las demás bases de datos, por lo general para poderlas aprovechar al máximo permiten algún tipo de conectividad a bases de datos relacionales.

Base de datos relacional: Fue propuesto en 1970 por Codd, este es un modelo simple potente y formal para representar la realidad, también ofrece una base firme para enfocar y analizar formalmente muchos problemas relacionados con la gestión de bases de datos, como el diseño, la redundancia, la distribución etc. El formalismo y una base matemática, son las piedras angulares del modelo relacional , el elemento básico del modelo es la relación y un esquema de bases de datos relacional es una colección de definiciones de relaciones. En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la base de datos. La información puede ser recuperada o almacenada mediante “consultas” que ofrecen una amplia flexibilidad y poder para administrar la información.1

Base de datos multidimensionales: Son bases de datos ideadas para desarrollar aplicaciones muy concretas. Básicamente no se diferencian demasiado de las bases de datos relacionales (una tabla en una base de datos relacional podría serlo también en una base de datos multidimensional), la diferencia está más bien a nivel conceptual; en las bases de datos multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien representan métricas que se desean estudiar.
Base de datos orientada a objetos: Este es un modelo reciente, trata de almacenar en la base de datos los objetos completos (estado y comportamiento). Esta base de datos debe contener todos los conceptos importantes de este paradigma de programación: Encapsulacion, herencia, polimorfismo.

Base de datos distribuidas: En este modelo la base de datos esta alojada en diferentes computadores en la red, permite que haya interacción entre diferentes bases de datos.
En la actualidad existe mucha información en la red sobre este tema, hay que aclarar que esto solo fue una introducción básica a los modelos de bases de datos, si quieren profundizar, pueden ayudarse del gran hermano (Google) el cual brindara mucha información sobre el tema en cuestión.

Fuente:

cipriano.hernadez.alanis

unread,
Sep 25, 2012, 1:30:06 PM9/25/12
to itecnodgo_nint...@googlegroups.com
DWH

Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el data warehouse, esta vista estará dispuesta según unas dimensiones y podrá contener información calculada. El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un análisis multidimensional.

A la información de un cubo puede acceder el ejecutivo mediante "tablas dinámicas" en una hoja de cálculo o a través de programas personalizados. Las tablas dinámicas le permiten manipular las vistas (cruces, filtrados, organización, totales) de la información con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de información se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, éste es una colección de datos que está formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos elementos que participan en el análisis y variables a los valores que se desean analizar.

[editar]Dimensiones

Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la información general complementaria a cada uno de los registros de la tabla de hechos.

[editar]Variables

También llamadas “indicadores de gestión”, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo” (medido en días, horas, semanas, etc.), ...

[editar]Ejemplos

Ejemplos de variables podrían ser:

  • Beneficios
  • Gastos
  • Ventas
  • etc.

Ejemplos de dimensiones podrían ser:

  • producto (diferentes tipos o denominaciones de productos)
  • localidades (o provincia, o regiones, o zonas geográficas)
  • tiempo (medido de diferentes maneras, por horas, por días, por meses, por años, ...)
  • tipo de cliente (casado/soltero, joven/adulto/anciano, ...)
  • etc.

Según lo anterior, podríamos construir un cubo de información sobre el índice de ventas (variable a estudiar) en función del producto vendido, la provincia, el mes del año y si el cliente está casado o soltero (dimensiones). Tendríamos un cubo de 4 dimensiones.

DM

Actualmente, dentro de una organización, el apoyo a la decisión se enfrenta a grandes problemas: - Hay almacenadas grandes cantidades de datos. - Los datos pueden provenir de fuentes muy distintas. - Los dominios de los datos pueden ser muy diversos.   Además se da la paradoja de que cuanta más información se posee (y más variada sea ésta) más difícil es extraer información útil. Para resolver estas situaciones surge el Data Mining (minería de datos). Para llevar a cabo el minado de datos se necesitan sistemas de bases de datos. Estos sistemas pueden ser de dos tipos:

- Sistemas de bases de datos tradicionales. 
- Sistemas de Data Warehousing. 
  
El Data Mining se basa en técnicas que han existido desde hace bastante tiempo. La razón de que ahora se haga uso de ellas para el minado de datos es que ahora existe una gran cantidad de datos recopilados, estructurados y organizados. En gran parte esto es debido a los sistemas de bases de datos, que permiten asegurar características tales como la integridad y la seguridad. 
  
Las aplicaciones de minería de datos deberían tenerse muy en cuenta desde un principio, durante el diseño de un almacén de datos. Asimismo, las herramientas de minería de datos deberían ser diseñadas para facilitar su uso en conjunción con los almacenes de datos. De hecho, para muchas bases de datos de gran tamaño que se convierten en terabytes de datos, el éxito de la utilización de aplicaciones de minería de bases de datos dependerá en primer lugar de la construcción de un almacén de datos.

[1]  http://www.gestiopolis.com/canales8/ger/data-mining-y-los-sistemas-de-base-de-datos.htm

[2] http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos 


El martes, 18 de septiembre de 2012 10:30:33 UTC-5, Administrador Grupo escribió:

jgerardo.felixo

unread,
Sep 25, 2012, 7:06:31 PM9/25/12
to itecnodgo_nint...@googlegroups.com

Bases de Datos que Intervienen en DWH y DM

 

 

Bases de datos que intervienen en DataWarehouse

 

Las bases de  datos que pueden conformar los DataWarehouse son:

 

·          Integradas: Deben constituir un conjunto de datos y metadatos perfectamente integrados con respecto al nombre de las variables, formatos de los distintos campos, medida de los atributos, codificación, etc.

 

·          Temáticas: Las bases de datos deben conformarse hacia materias o temas, como clientes, productos, campañas, etc., a diferencia de las bases de datos de los sistemas operacionales, más orientados a procesos administrativos. 

 

·          Históricas: Este es un factor clave en la toma de decisiones, contar con información histórica para comparar datos en distintos períodos e identificar tendencias. El tiempo debe estar en todos y cada uno de los registros del DW, de manera que, cuando un dato entra en el DW se sepa en qué momento tenía ese valor.

 

·          No Volátiles: La información una vez incorporada al DW debe mantenerse, en general, invariable, cargándose una vez en el tiempo y no permitiendo actualizaciones de los datos. [1]

 

 

 

Bases de datos que intervienen en Data Mart

 

Las bases de datos que pueden intervenir en un DataMart son:

 

·          Base de Datos Multidimensional:

Llamada DATAMART en la cual se guardan los datos históricos correspondientes a los indicadores de gestión de calidad de DB Access. Todas las bases de dato se construyeron con SQL Server 2000.

Modelo Estrella de la Base de Datos Multidimensional

En la fase de análisis y diseño se realizaron los modelos estrellas, constituidos por las tablas de hecho y tablas de dimensiones para los indicadores de gestión de calidad de DB Access: Satisfacción del Cliente y Porcentaje de Utilización de Planta.

 

·          Queries Básicas y Reporting:

En este tipo de herramientas el usuario accede directamente a la estructura de las bases de datos relacionales para construir consultas e informes, vía SQL (estándar para el acceso a las bases de datos relacionales).

El SQL es un lenguaje muy extendido entre los programadores, pero no tanto entre los usuarios finales. Aunque estas herramientas escondan en cierta forma los comandos del SQL, sigue siendo necesario tener claro el modelo relacional en cuanto se quiere hacer algún informe complejo, por lo que su utilización directa no está recomendada a usuarios finales.

 

·          Queries y Reporting Avanzado:

Estas herramientas aportan una visión temática de las bases de datos relacionales (visión de negocio), mediante la cual el usuario final tiene una visión menos “técnica” del DataMart.

Este tipo de herramientas pone una capa de términos que le son más familiares a los usuarios finales y establece, las interrelaciones de las tablas del DataMart, de forma que sea más sencillo. Aun así, sigue siendo la estructura relacional básica la que subyace en estas herramientas.

 

·          Cognos:

A través de su interfaz simple al estilo de asistente, Cognos integra bases de datos y aplicaciones de Lotus Notes, el único producto de inteligencia de negocios que ofrece toda la gama de capacidades de inteligencia de negocios en una arquitectura única y probada. [2]

 

Fuentes:

josedejesus.santes.palacios

unread,
Sep 25, 2012, 8:25:41 PM9/25/12
to ITecnoDgo_NInteligentes_ad_12
*DWH
En las bases de datos utilizadas en (data warehousing), un esquema en
copo de nieve es una estructura algo más compleja que el esquema en
estrella. Se da cuando alguna de las dimensiones se implementa con más
de una tabla de datos. La finalidad es normalizar las tablas y así
reducir el espacio de almacenamiento al eliminar la redundancia de
datos; pero tiene la contrapartida de generar peores rendimientos al
tener que crear más tablas de dimensiones y más relaciones entre las
tablas (JOINS) lo que tiene un impacto directo sobre el rendimiento.
En las aplicaciones OLAP implementadas sobre bases de datos
relacionales (ROLAP), un elemento clave es el Cubo OLAP. Estos cubos
(también llamados hipercubos) almacenan grandes volúmenes de datos que
posteriormente deben ser analizados en función de unos determinados
parámetros. Al diseñar las tablas en las que se han de almacenar estos
datos y parámetros, si se aplican las técnicas de Normalización de
bases de datos para optimizar el espacio requerido para guardar estos
datos eliminando las redundancias, es habitual que se termine
obteniendo un esquema en copo de nieve; en este tipo de esquemas se
tiene una tabla central de hechos en la que se guardan las medidas del
negocio que se quiere analizar, y en las tablas adyacentes se tendrán
las dimensiones (parámetros) de que dependen los datos del negocio. Si
por alguna dimensión se requiere más de una tabla se dice que el
esquema resultante es un esquema en copo de nieve.
http://es.wikipedia.org/wiki/Esquema_en_copo_de_nieve

*Datamart
El datamart se orienta hacia el sujeto o el tema y puede ser utilizado
por ejemplo para aplicaciones de CRM (Custom Relationship Manager) o
de Data Mining. Tanto el data warehouse como el datamart son
alimentados por la herramienta de ETL (Extract Transform Load).

Distribuir los datos : Portal decisional EIP
(EIP Enterprise Information Portal)
El aplastamiento de la pirámide y la multiplicación de los puntos de
toma de decisión modifican de manera fundamental la gestión de la
información. La información será percibida en término de flujo y no de
unidad de almacenaje.
Con el fin de dinamizar la reactividad global, la información será
ampliamente distribuida junto al conjunto de los socios. El portal,
EIP Enterprise Information Portal, cumple esa función esencial.
Explotar : Cuadro de mando, analisis OLAP, datamining...
Una vez los datos almacenados, limpiados, consolidados y accesibles,
pueden ser utilizados. Según las necesidades, diverso tipos de
herramientas de extracción y de explotación son considerados.
Analizar los datos con las herramientas de tipo OLAP para los analisis
multidimensionales.
Buscar las correlaciones poco visibles con el Data Mining
Asistir los responsables en situación, con los cuadros de mando
presentando los indicadores claves de la actividad
Comunicar el rendimiento con el Reporting
http://www.cuadro-de-mando.org/business-intelligence2.htm



isaiasj.nunez.glez

unread,
Sep 27, 2012, 3:13:12 AM9/27/12
to itecnodgo_nint...@googlegroups.com

BASES DE DATOS Y DATA WAREHOUSE:

En el marco actual de la empresa, la confluencia de nuevas infraestructuras de comunicación con potentes y flexibles herramientas de tratamiento de información (bases de datos, Data Warehouse −DW−, Data Mining,...) mejoran la calidad, cantidad y eficiencia de los datos comerciales, así como el análisis, procesamiento y comunicación de los mismos. En otras palabras, pueden aportar a las corporaciones la base tecnológica necesaria para afrontar los nuevos retos de la situación actual y las perspectivas de futuro de la gestión comercial. De ahí, que en este trabajo, se resalte el hecho de que las bases de datos y el DW permiten en primera instancia el almacenamiento adecuado de los datos obtenidos de las actividades habituales de organización, producción, control de gestión, marketing, planificación estratégica etc.. Pero, además se incide en otro hecho, que es el que a  través de dichas herramientas las corporaciones pueden extraer de dichos datos, la información y el conocimiento que necesitan para identificar y responder estratégicamente a las necesidades de su actividad comercial. Permitiendo un mejor conocimiento del cliente para poder desarrollar productos y/o servicios enfocados a sus expectativas.

Ayudando a desarrollar campañas basadas en perfiles con productos, ofertas y mensajes dirigidos específicamente a ciertos tipos de clientes. Como resultado se mejora el proceso de comunicación entre la empresa y el cliente, hecho que redunda en la fidelización de los clientes y en el aumento drástico de la eficacia de las acciones de comunicación.[1]

BASE DE DATOS DATAMART

Actualmente la mayor parte de las empresas cuenta con sistemas de información atomizados respondiendo cada cual a un uso diferente. En el momento de la toma de decisiones, las áreas de estadística y economía destinan gran parte de su tiempo a la recolección y homogeneización de los datos y normalmente estos son utilizados solo una vez y con un fin especifico. Como consecuencia, si en un futuro se necesita ver la información obtenida con datos actualizados, hay que repetir el proceso de obtención y proceso de datos.[2]

 

[2] http://segunda-wiki.wikispaces.com/file/view/USO+DEL+DATAMART.pdf

[1] http://lsi.ugr.es/rosana/investigacion/papers/bd_efsi04.pdf

cesar.monarrez.a

unread,
Sep 28, 2012, 6:18:01 PM9/28/12
to itecnodgo_nint...@googlegroups.com
Bases de datos que intervienen en DWH y DM

Data WareHouse.

Las bases de datos que conforman el componente de almacenamiento físico del DW se caracterizan por los siguientes aspectos:
  • Integradas: deben constituir un conjunto de datos y metadatos perfectamente integrados con respecto al nombre de las variables, formatos de los distintos campos, medida de los atributos, codificación, etc.
  • Temáticas: las bases de datos deben conformarse hacia materias o temas, como clientes, productos, campañas, etc., a diferencia de las bases de datos de los sistemas operacionales, más orientadas a procesos administrativos.
  • Históricas: éste es un factor clave en la toma de decisiones, contar con información histórica para comparar datos en distintos períodos e identificar tendencias. El tiempo debe estar en todos y cada uno de los registros del DW, de manera que, cuando un dato entra en el DW se sepa en qué momento tenía ese valor.
  • No Volátiles: la información una vez incorporada al DW debe mantenerse, en general, invariable, cargándose una vez en el tiempo y no permitiendo actualizaciones de los datos. [1]

Datamart.

Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información.Por tanto, para crear el datamart de un área funcional de la empresa es preciso encontrar la estructura óptima para el análisis de su información, estructura que puede estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designación de una u otra dependerá de los datos, los requisitos y las características específicas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts:

  • Datamart OLAP: Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creación, explotación y mantenimiento de los cubos OLAP es muy heterogéneo, en función de la herramienta final que se utilice.
  • Datamart OLTP:Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD avanzados, como Oracle). [2]

Referencias bibliograficas.

[1] http://lsi.ugr.es/rosana/investigacion/papers/bd_efsi04.pdf

[2] http://definiciondeconceptos.blogspot.mx/



Reply all
Reply to author
Forward
0 new messages