3 Data Warehouse y DataMart 3.8 Modelo de definición de Bases de Datos estratégicas.(27 09 2012)

420 views
Skip to first unread message

Administrador Grupo

unread,
Sep 18, 2012, 11:36:48 AM9/18/12
to itecnodgo_nint...@googlegroups.com
Investigue los modelos de definición de Bases de Datos Estrategicas.

FE 27 09 2012

luis.galindo.ortega

unread,
Sep 24, 2012, 4:19:21 PM9/24/12
to itecnodgo_nint...@googlegroups.com
Modelado de un datawarehouse

Una vez presentado el datawarehouse en cuanto a su definición,utilidad y procesos, este apartado presenta las particularidades del mismo en cuanto a su estructura de base de datos. Para esto analizaremos los dos componentes del modelo de un datawarehouse:
  • el modelado lógico
  • el modelado físico
Modelo lógico

Un modelo lógico es similar a lo que es un mapa cuando uno deciderealizar un viaje. Uno necesita saber donde va y como llegar allí. Senecesita un plan, uno que sea visible y correcto.

El modelo lógico es un esquema de todas las piezas de información necesarias para entender los datos y como se relacionan con el negocio. Es una técnica fundamentalmente gráfica que resulta en un modelo de datos representando la definición, características y relaciones de los datos en un ambiente de negocios, técnico o conceptual. En términos simples, un modelo de datos lógico es unborrador de alto nivel de los datos.

Los modelos lógicos de datos son independientes de los dispositivosfísicos de almacenamiento de datos. Esta es la clave del modeladológico. La razón por la cual un modelo lógico de datos debe serindependiente de la tecnología es simplemente porque la tecnologíacambia muy rápidamente. Lo que ocurre por debajo del modelológico de datos puede cambiar con la tecnología, pero el esquema delos datos debe permanecer igual.

Un modelo de datos lógico es un arreglo de los datos orientados alusuario general, opuesto al módelo físico, el cual arregla los datospensando en el uso eficiente de la base de datos. El ámbito y complejidad de un modelo de datos lógico depende de los requerimientos de los usuarios y la disponibilidad de los datosfuente. Cuanto más sofisticados y complejos sean los requerimientosde reportes por parte de los usuarios, probablemente más complejoserá el modelo lógico de datos.

Componentes de un modelo lógico
Un modelo de datos lógico es una representación de los siguientes conceptos derivados de los enunciados en el apartado anterior:

  • Facts
  • Atributos
  • Jerarquías

Modelo físico

Un modelo físico está basado en el modelo de datos lógico. El modelo lógico concierne a objetos lógicos del modelo de negociostales como día, ítem, sucursal o cuenta.

Mientras que el modelo lógico de datos dice qué facts y atributoscrear, el modelo físico dice dónde van a ubicarse físicamente losdatos de esos objetos. El esquema físico describe cómo los datos sealmacenarán en el datawarehouse. Dos componentes claves conforman el esquema físico de undatawarehouse:
  • tablas 
  • columnas. 
Las columnas y tablas de undatawarehouse físico representan facts y atributos de un modelo dedatos lógico. Las filas de una tabla representan los elementos de losatributos y los datos fact propiamente dichos. [1]

Modelo Multidimensional

Los datos en un DW se modelan en data cubes (“cubos de datos” sería su traducción literal), estructuras multidimensionales (hipercubos, en concreto) cuyas operaciones más comunes son:
  • Roll up (incremento en el nivel de agregación de los datos).
  • Drill down (incremento en el nivel de detalle, opuesto a roll up).
  • Slice (reducción de la dimensionalidad de los datos mediante selección).
  • Dice (reducción de la dimensionalidad de los datos mediante proyeccción).
  • Pivotaje o rotación (reorientación de la visión multidimensional de los datos).
Modelos de datos como conjuntos de medidas descritas por dimensiones.


  • Adecuado para resumir y organizar datos (p.ej. hojas de cálculo).
  • Enfocado para trabajar sobre datos de tipo numérico.
  • Más simple: Más fácil de visualizar y entender que el modelado E/R.  [2] 
Bibliografia

francisco.gonzalez.cassio

unread,
Sep 25, 2012, 12:26:17 AM9/25/12
to itecnodgo_nint...@googlegroups.com
Modelo de Definicion de Base de Datos.

El producto del proceso de diseño de base de datos, que tiene como objetivo identificar y organizar los datos requeridos lógicamente y físicamente. Un modelo de datos dice qué información ha de ser contenida en una base de datos, como la información se utilizará, y cómo los elementos de la base de datos se relacionan entre sí. Por ejemplo, un modelo de datos puede especificar que un cliente está representada por un nombre de cliente y el número de tarjeta de crédito y un producto en forma de un código de producto y el precio, y que existe una relación de uno a muchos entre un cliente y un producto. Puede ser difícil cambiar un diseño de base de datos una vez que el código se ha escrito y se insertan datos. Un bien pensado modelo de datos reduce la necesidad de tales cambios. El modelado de datos mejora la capacidad de mantenimiento de aplicaciones y sistemas del futuro puede volver a utilizar partes de los modelos existentes, lo que debería reducir los costes de desarrollo. Un lenguaje de modelado de datos es un formalismo matemático con una notación para describir estructuras de datos y un conjunto de operaciones utilizadas para manipular y validar dichos datos. Uno de los métodos más utilizados para el desarrollo de modelos de datos es la entidad-relación {modelo}. El modelo relacional es el tipo más ampliamente utilizado de modelo de datos. 



El modelado de datos es un método utilizado para definir y analizar los requisitos de datos necesarios para apoyar la procesos de negocio de una organización y la definición de las estructuras de datos y las relaciones entre los elementos de datos. 

Técnicas de modelado de datos se utilizan: 

• gestionar los datos como un recurso (emigrar, fusionar, calidad de datos ...) 
• para el diseño de bases de datos informáticas. 
• hacer frente mejor a los cambios, por lo que permite realizar cambios en el modelo, que automáticamente inducir     cambios en la base de datos y programas .

Un modelo de datos se compone de tres niveles de modelado: 

• El modelo semántico describe la semántica de un dominio (por ejemplo, puede ser un modelo de la área de interés de una organización o industria), es decir, definir el significado de los datos en el contexto de sus interrelaciones y las limitaciones con otros datos. Es una abstracción que define cómo la símbolos almacenados relacionan con el mundo real. Así, el modelo semántico debe ser una representación verdadera del mundo real. Un modelo semántico consiste en clases de entidad, en representación de las clases de cosas de importancia en el dominio, y las relaciones afirmaciones sobre las asociaciones entre pares de clases de entidad. Un modelo semántico especifica los tipos de hechos o proposiciones que pueden ser expresa utilizando el modelo. En ese sentido, define las expresiones permitidas en un artificial "Lengua" con un ámbito que está limitada por el alcance del modelo; 

• El modelo lógico describe la información del sistema, como se representa por un conjunto de datos particulares manipulación de tipos de tecnología: por ejemplo, sistema de archivos planos, jerárquica DBMS (IMS, ...), la red de DBMS (IDMS, IDS2, ..), relacional DBMS (DB2, Oracle, SQL Server, ...). Una lógica modelo consiste en descripciones de entidades (llamada «segmentos» en DBMS jerárquico, «Registros» en la red de DBMS, «tablas» en los SGBD relacionales) y atributos (llamados «datos» en DBMS jerárquicos y de red, «columnas» de DBMS relacional), las claves de acceso a datos, el tipo de enlaces beetween entidades (denominadas «conjuntos» de la red de DBMS, «llaves Extranjeros» en relacional DBMS), entre otras cosas;

• El modelo físico describe el medio físico mediante el cual los datos son almacenados en una determinada DBMS producto (archivos planos, archivos XML, IMS, IDMS, IDS2, Oracle, DB2, ...). Es que ver con particiones, CPU, tablespaces, y similares. 

La importancia de este enfoque, es que permite a los tres puntos de vista a ser relativamente independientes entre sí. La tecnología de almacenamiento puede cambiar sin afectar la lógica o la modelo semántico. La estructura (entidades / attibutes) pueden cambiar sin (necesariamente) que afectan a la modelo semántico. En cada caso, por supuesto, las estructuras deben seguir siendo compatibles con el otro modelo. La estructura empleada en una DB particular, pueden ser diferentes de una traducción directa de la clases de entidad y atributos, pero en última instancia, deben llevar a cabo los objetivos de la entidad semántica estructura de clases. Las fases tempranas de los proyectos de desarrollo de software hincapié en el diseño de un modelo de datos semántico. Este tipo de diseño se puede detallar en un modelo de datos lógico. En etapas posteriores, este modelo puede ser traducido en modelo físico de datos.

Fuente:

jgerardo.felixo

unread,
Sep 26, 2012, 1:45:36 PM9/26/12
to itecnodgo_nint...@googlegroups.com

Modelos de Definición de Bases de Datos Estratégicas

 

Los principales modelos que se utilizan en BD Estratégicas de acuerdo a su definición, utilidad y procesos son:

 

 

Modelado Lógico

 

·          El  modelado lógico es similar a lo que es un mapa cuando uno decide realizar un viaje. Uno necesita saber donde va y como llegar allí. Se necesita un plan, uno que sea visible y correcto.

 

·          Es un esquema de todas las piezas de información necesarias para entender los datos y como se relacionan con el negocio. Es una técnica fundamentalmente gráfica que resulta en un modelo de datos representando la definición, características y relaciones de los datos en un ambiente de negocios, técnico o conceptual. En términos simples, un modelo de datos lógico es un borrador de alto nivel de los datos.

 

·          Son independientes de los dispositivos físicos de almacenamiento de datos. Esta es la clave del modelado lógico. La razón por la cual un modelo lógico de datos debe ser independiente de la tecnología es simplemente porque la tecnología cambia muy rápidamente. Lo que ocurre por debajo del modelo lógico de datos puede cambiar con la tecnología, pero el esquema delos datos debe permanecer igual.

 

·          Es un arreglo de los datos orientados al usuario general, opuesto al modelo físico, el cual arregla los datos pensando en el uso eficiente de la base de datos. El ámbito y complejidad de un modelo de datos lógico depende de los requerimientos de los usuarios y la disponibilidad de los datos fuente. Cuanto más sofisticados y complejos sean los requerimientos de reportes por parte de los usuarios, probablemente más complejo será el modelo lógico de datos. [1]

 

 

Modelado Físico

 

·          El modelado  físico está basado en el modelo de datos lógico. El modelo lógico concierne a objetos lógicos del modelo de negocios tales como día, ítem, sucursal o cuenta.

 

·          Nos dice dónde van a ubicarse físicamente los datos de esos objetos. El esquema físico describe cómo los datos se almacenarán en el Data Warehouse. Dos componentes claves conforman el esquema físico de un Data Warehouse: Tablas y Columnas

 

Las columnas y tablas de un Data Warehouse físico representan facts y atributos de un modelo de datos lógico. Las filas de una tabla representan los elementos de los atributos y los datos fact propiamente dichos. [1]

 

·          Describe el medio físico mediante el cual los datos son almacenados en una determinada DBMS producto (archivos planos, archivos XML, IMS, IDMS, IDS2, Oracle, DB2, ...). Es que ver con particiones, CPU, tablespaces, y similares. 

 

·          La importancia de este enfoque, es que permite a los tres puntos de vista a ser relativamente independientes entre sí. La tecnología de almacenamiento puede cambiar sin afectar la lógica o el modelo semántico. La estructura (entidades / attibutes) pueden cambiar sin (necesariamente) que afectan a la modelo semántico. En cada caso, por supuesto, las estructuras deben seguir siendo compatibles con el otro modelo. La estructura empleada en una DB particular, pueden ser diferentes de una traducción directa de la clases de entidad y atributos, pero en última instancia, deben llevar a cabo los objetivos de la entidad semántica estructura de clases. Las fases tempranas de los proyectos de desarrollo de software hincapié en el diseño de un modelo de datos semántico. Este tipo de diseño se puede detallar en un modelo de datos lógico. En etapas posteriores, este modelo puede ser traducido en modelo físico de datos. [2]

 

 

 

Modelado Semántico

 

·          Describe la semántica de un dominio (por ejemplo, puede ser un modelo de la área de interés de una organización o industria), es decir, definir el significado de los datos en el contexto de sus interrelaciones y las limitaciones con otros datos.

 

·          Es una abstracción que define cómo la símbolos almacenados relacionan con el mundo real. Así, el modelo semántico debe ser una representación verdadera del mundo real. Un modelo semántico consiste en clases de entidad, en representación de las clases de cosas de importancia en el dominio, y las relaciones afirmaciones sobre las asociaciones entre pares de clases de entidad.

 

·           Un modelo semántico especifica los tipos de hechos o proposiciones que pueden ser expresa utilizando el modelo. En ese sentido, define las expresiones permitidas en un artificial "Lengua" con un ámbito que está limitada por el alcance del modelo. [2]

 

Fuentes:

[1] http://es.scribd.com/doc/52613114/31/Modelado-de-un-datawarehouse

[2] http://www.rever.eu/white-papers/data_model_definition.pdf

 

 

jmanuelgarciaaragon

unread,
Sep 26, 2012, 4:37:38 PM9/26/12
to itecnodgo_nint...@googlegroups.com

3.8 Modelo de Definición de Bases de Datos Estratégicas.

 

Un modelo de datos para las bases de datos es una colección de conceptos que se emplean para describir la estructura de una base de datos. Esa colección de conceptos incluye entidades, atributos y relaciones.

La mayoría de los modelos de datos poseen un conjunto de operaciones básicas para especificar consultas  y actualizaciones de la base de datos.


Los modelos de datos pueden clasificarse en:

 

Modelos de datos de alto nivel o conceptuales: disponen de conceptos cercanos a la forma en que los usuarios finales perciben una base de datos.

Modelos de datos de bajo nivel o físicos: disponen de conceptos que describen detalles sobre el almacenamiento de los datos en la computadora.

Modelos de datos de representación (o de implementación): disponen de conceptos que pueden entender los usuarios finales, pero que no están alejados de la forma en que se almacenan los datos en la computadora.

 

Clasificación de los modelos de datos

Los modelos de datos sirven para clasificar los distintos tipos de SGBD.

Existen diferentes modelos de datos para bases de datos como ser:

·         Modelo relacional

·         Modelo orientado a objetos

·         Modelo relacional-objeto

·         Modelo jerárquico

·         Modelo de red [1]

[1] http://www.alegsa.com.ar/Dic/modelo%20de%20datos%20de%20base%20de%20datos.php

cipriano hernandez

unread,
Sep 27, 2012, 4:42:53 PM9/27/12
to itecnodgo_nint...@googlegroups.com

josedejesus.santes.palacios

unread,
Sep 27, 2012, 10:48:12 PM9/27/12
to itecnodgo_nint...@googlegroups.com
Modelo de un Data Warehouse

Modelo de Negocio
Realizar Análisis Estratégico.
Crear el Modelo de Negocio
Documentar los Metadatos

Análisis Estratégico
Identificar los procesos cruciales del negocio
Entender los procesos del negocio
Prioriza y seleccionar los procesos de negocio a implementar

Crear el Modelo de Negocios
Definir los requerimientos el negocio:
-Identificar las medidas del negocio
-Identificar las dimensiones
-Identificar las definiciones del negocio y las reglas
Verificar las fuentes de los datos

Documentación de Metadatos
Documentación del diseño de los procesos
Documentación del procesos de desarrollo
Dar un registro de los cambios
Mejoras en el tiempo de grabación

Modelo Dimensional
-Identificar las tablas de hecho
-Identificar las tablas de dimensión
-Enlazar las tablas de hecho a las tablas de dimensión
-Modelar la dimensión temporal

Características
Contiene métricas numéricas del negocio
Puede contener grandes volúmenes de datos
Puede crecer rápidamente
Puede contener datos base, derivados y resumidos
Son típicamente aditivos
Unidos a las tablas de dimensión a través de llaves foráneas que hacen referencia a llaves primarias de las tablas de dimensión

Modelo Físico
Traducir el diseño dimensional en un modelo físico para implementación 
Definir la estrategia de almacenamiento para tablas e índices
Realizar el dimensionaimento de la BD
Definir la estrategia inicial de indexado
Definir la estrategia del particionamiento
Actualizar el documento de metadatos con información física


cesar.monarrez.a

unread,
Sep 28, 2012, 9:42:38 PM9/28/12
to itecnodgo_nint...@googlegroups.com
Modelos de definición de Bases de Datos Estrategicas

Existen diferentes modelos de Data Warehouse: desintegrado, mixto y de integración total.

Independientemente del modelo implantado, algunas de las características de las DW son: mayor acercamiento al gestor, interacción más amable, mejor comprensión y justificación de la información, explicitación de los métodos de elaboración, y mayor riqueza en información histórica y de detalle.

Bajo el nombre de Data Warehouse se han desarrollado los primeros grandes sistemas de integración, imprescindibles para la construcción armónica de un Sistema global de Información de gestión.

Con el DW se tiene una visión homogénea sobre todos los objetos del modelo de negocio, de modo que los informes y cuadros diseñados para una parte puedan ser trasladados al resto consistentemente. La información contenida en el DW se captura una sola vez y la clasificación y descripción de la misma es conocida por todas las áreas, independientemente de los objetos que analizan y de la actividad a la que dan soporte, y de un Diccionario en el que toda la información se encuentre perfectamente descrita y relacionada. Estas características no son réplica de la situación del lado operativo, sino que se consiguen específicamente por el DW.

Someramente, describiremos los tres modelos de Data Warehouse más frecuentes:

Modelo uno. De máxima desintegración

Es el modelo más primitivo, consiste en crear múltiples Data Warehouses, prácticamente uno por cada problema de negocio al que se le va a dar solución. 

La construcción se hace muy sencilla para los primeros Data Warehouse desintegrados, pues basta con reunir algunos ficheros operacionales y explotarlos con una máquina de Queries y una herramienta gráfica de consulta. Algunas de estas componentes, más o menos evolucionadas, ya existen antes de iniciar la construcción. Por ejemplo, es habitual que exista un Centro de Información tradicional y un gestor de base de datos relacional anteriores al DW, que se puedan aprovechar utilizando alguna herramienta gráfica de presentación. La primera inversión es pequeña y el plazo de obtención de resultados es muy rápido.

Los problemas de este modelo se plantean cuando se quiere tener una visión integrada de la realidad. La multiplicidad de implantaciones de DW nos devuelve al caos informacional de partida pero agravado, pues no se trata de normalizar información ya elaborada con distintas visiones de negocio y diferentes métodos de transformación y cálculo. Proliferarán plataformas intermedias, cada vez más pesadas, pues cada vez estas plataformas desintegradas tendrán mayor ambición de plataforma global, con lo que la inversión, inicialmente menor, se disparará tanto en recursos hardware como en software de aprovisionamiento y normalización.

Modelo dos. De integración absoluta

Es el extremo opuesto al anterior. Consiste en crear un Data Warehouse único, capaz de resolver las necesidades de todas las áreas de negocio.
Es una arquitectura simple y, por consiguiente, sólida. Requiere un análisis sumamente preciso de las necesidades de la organización y una adecuada modelización y selección de plataforma.
Su principal debilidad es la falta de flexibilidad en caso de plantearse necesidades no contempladas en el diseño inicial. La plataforma está configurada para atender muy bien a un tipo de problema, pero la aparición de nuevos objetos o nuevas funciones de negocio puede requerir cambios incluso de hardware o el rediseño general de las bases de datos y su reflejo en el software que las explota, perdiéndose una de las principales características funcionales perseguidas: la reducción de plazos y costes de puesta en producción.

Modelo tres. Modelo Mixto

El modelo mixto, como su nombre indica, es una mezcla de los dos anteriores. Consiste en la creación de un gran Data Warehouse central y la obtención, a partir del mismo, de los Data Marts o Bancos de Datos Departamentales, particularizados para cada departamento gestor, cliente del sistema, sobre el cual se instrumentarán las aplicaciones, herramientas precisas para ese dominio.
Sobre este modelo se construyen los DW de propósito general, pues es universal en cuanto a su información y modelo de negocio, y particular y personalizado en cuanto a su aplicación. Sus puntos fuertes son la reutilización y la integridad, y, como consecuencia, la reducción de plazos, costes y aumento de la coherencia.
Las fases de elaboración y presentación son propias para cada área gestora, tras una modelización de su problema específico. Es una arquitectura que, tras la inversión inicial, es más rápida y barata incluso que el modelo 1 y robusta como el modelo 2.
El trabajo realizado para la construcción del primer Data Mart, semilla del gran Data Warehouse común, se reutiliza en la construcción del segundo, la del primero y el segundo en la del tercero, etc... Si, como se suele admitir, las fases de captura y normalización suponen el ochenta y cinco por ciento del trabajo en Data Warehouse, esto es precisamente lo que se reutiliza con el modelo mixto.
Asimismo, las fases de elaboración y presentación también se acortan y abaratan con el modelo mixto, pues si bien no se reutilizan en su totalidad, los métodos de elaboración son comunes a diferentes procesos de negocios. En cualquier caso, es seguro que las bases de partida son las mismas por construcción, con lo que se eliminan todos los procesos de conciliación e integridad.
Hoy se admite, con bastante unanimidad por parte de los más reputados expertos en DW, que el modelo mixto es el único que garantiza el retorno de la inversión por su capacidad de evolución y adaptación al mercado.

Reply all
Reply to author
Forward
0 new messages