5 Modelado Multidimensional 5.1 Modelado multidimensional

3,849 views
Skip to first unread message

Administrador Grupo

unread,
Nov 5, 2012, 9:43:20 AM11/5/12
to itecnodgo_nint...@googlegroups.com
Investigue todo lo relacionado con modelado multidimensional.

Fecha de entrega 6 11 12

deyci Rutiaga

unread,
Nov 5, 2012, 10:59:00 AM11/5/12
to itecnodgo_nint...@googlegroups.com
MODELO MULTIDIMENSIONAL

LA LÓGICA DEL MODELO DE DATOS MULTIDIMENSIONAL

El modelo de datos multidimensional es una parte integral de On-Line Analytical Processing, OLAP . Porque OLAP es en línea, debe proporcionar respuestas rápidas, los analistas plantean consultas iterativas durante las sesiones interactivas, no en trabajos por lotes que se ejecutan durante la noche. Y como OLAP es también analítico, las consultas son complejas. El modelo de datos multidimensional está diseñado para resolver consultas complejas en tiempo real.

El modelo de datos multidimensional es importante porque hace cumplir simplicidad. Como afirma Ralph Kimball en su excelente libro, The Data Warehouse Toolkit:

"La atracción central del modelo tridimensional de una empresa es su simplicidad .... que la simplicidad es la clave fundamental que permite a los usuarios a entender las bases de datos, y permite que el software para navegar por bases de datos de manera eficiente."

El modelo de datos multidimensional se compone de cubos lógicos, medidas, dimensiones, jerarquías, niveles y atributos. La simplicidad del modelo es inherente debido a que define los objetos que representan entidades del mundo real de negocios. Los analistas saben que los negocios son las medidas que están interesados en el examen, cuyas dimensiones y atributos que los datos sean significativos, y cómo las dimensiones de su negocio se organizan en los niveles y jerarquías.

LÓGICA DE LOS CUBOS

Cubos lógicos proporcionan un medio de organizar las medidas que tienen la misma forma, es decir, que tienen las mismas dimensiones exactas. Las medidas en el mismo cubo tiene las mismas relaciones con otros objetos lógicos y pueden ser analizados y presentados conjuntamente.

MEDIDAS

Las medidas rellenan las celdas de un cubo de lógica con los hechos recogidos sobre las operaciones empresariales. Las medidas están organizados por dimensiones, que típica mente incluyen una dimensión de tiempo.
Las medidas son estáticas y constantes mientras que los analistas las están usando para informar sus decisiones. Se actualizan en una ventana de proceso por lotes a intervalos regulares: semanal, diario, o periódicamente durante todo el día.

DIMENSIONES

Las dimensiones contienen un conjunto de valores únicos que identifican y clasifican los datos. Ellos forman los bordes de un cubo lógico, y por lo tanto de la medida dentro del cubo. Dado que las medidas suelen ser multidimensional, un solo valor de una medida debe ser calificada por un miembro de cada dimensión para que tenga sentido. Por ejemplo, la medida de Ventas tiene cuatro dimensiones: tiempo, cliente, producto y canal. Un valor de ventas en particular (43,613.50) sólo tiene sentido cuando es calificado por un período de tiempo específico (Feb-01), un cliente (Sistemas de Warren), un producto (ordenadores portátiles), y un canal (Catálogo).

fuente:
El 5 de noviembre de 2012 08:43, Administrador Grupo <joseramo...@gmail.com> escribió:
Investigue todo lo relacionado con modelado multidimensional.

Fecha de entrega 6 11 12

--
 
 

luis.galindo.ortega

unread,
Nov 5, 2012, 4:57:10 PM11/5/12
to itecnodgo_nint...@googlegroups.com
Modelado Multidimensional

En un esquema multidimensional:
  • Se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). 
  • La información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho).
  • La información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
  • El modelado multidimensional se puede aplicar utilizando distintos modelos de datos (conceptuales o lógicos).
  • La representación gráfica del esquema multidimensional dependerá del modelo de datos utilizado (relacional, ER, UML, OO, ...) [2]

El modelo multidimensional es una técnica de diseño que busca presentar los datos en un estándar, que permita una recuperación  adecuada de éstos. Los elementos básicos del modelo multidimensional son las tablas y los esquemas.  

Es posible encontrar 2 tipos de tablas:
 
•  Tablas Hechos: Componente básico de todo esquema de Data Warehouse y corresponde a lo que se desea medir a partir de los datos presentes en el Sistema. Es el objeto a analizar, además posee atributos llamados atributos de hechos o síntesis, estos atributos son de tipo cuantitativo, cuyos valores (cantidades) se obtienen, generalmente por aplicación de una función estadística que resume un conjunto de valores en un único valor. Además, contienen funciones resumen, funciones de tipo estadístico que se aplican a los atributos de hecho. 

•  Tablas Dimensiones: La dimensión de un hecho determina la granularidad con que el hecho podrá ser analizado. Las tablas de Dimensiones representan cada uno de los ejes en un espacio multidimensional. Como todas las tablas, también poseen atributos llamados dimensión o de clasificación, los que son de tipo cualitativo (sus valores son modalidades) que suministran el contexto en que  se obtienen las medidas en un esquema de hecho. Las dimensiones poseen jerarquías, que son varios atributos unidos mediante una relación de tipo jerárquico. 

Para el caso de los esquemas, existen 3 representaciones comunes: 

•  Esquema estrella (o star schema): corresponde al esquema más simple para un Data Warehouse. Esta formado por una (o más) tabla de hechos con una 
única tabla por cada dimensión. Su nombre deriva del hecho de que su diagrama forma una estrella, con la tabla fact al centro y las tablas lock – up como puntas de la estrella. 

•  Esquema Copo de nieve (o snowflake): la principal diferencia entre este esquema y el esquema estrella es que las tablas de  dimensiones en este modelo representan relaciones normalizadas. Cada tabla lock_up contiene sólo el nivel en que es clave primaria en la tabla  y la foreign key de su parentesco del nivel más cercano del diagrama. 

•  Constelación de Esquemas (o fact constellation schema): corresponde a un conjunto de tablas de hechos que comparten una o más tablas de 
dimensiones. [1]

Bibliografia

jgerardo.felixo

unread,
Nov 5, 2012, 7:22:17 PM11/5/12
to itecnodgo_nint...@googlegroups.com

Modelado Multidimensional

Introducción.

 

La tecnología Datawarehousing debido a su orientación analítica, impone un procesamiento y pensamiento distinto, la cual se sustenta por un modelamiento de Bases de Datos propio, conocido como Modelamiento Multidimensional, el cual busca ofrecer al usuario su visión respecto de la operación del negocio.

 

Modelamiento Dimensional es una técnica para modelar bases de datos simples y entendibles al usuario final. La idea fundamental es que el usuario visualice fácilmente la relación que existe entre las distintas componentes del modelo.

Consideremos un punto en el espacio. El espacio se define a través de sus ejes coordenados (por ejemplo X, Y, Z). Un punto cualquiera de este espacio quedará determinado por la intersección de tres valores particulares de sus ejes.

 

Si se le asignan valores particulares a estos ejes. Digamos que el eje X representa Productos, el eje Y representa el Mercado y, el eje Z corresponde al Tiempo. Se podría tener por ejemplo, la siguiente combinación: producto = madera, mercado = Concepción, tiempo = diciembre-1998. La intersección de estos valores nos definirá un solo punto en nuestro espacio. Si el punto que buscamos, lo definimos como la cantidad de madera vendida, entonces se tendrá un valor específico y único para tal combinación.

 

En el modelo multidimensional cada eje corresponde a una dimensión particular. Entonces la dimensionalidad de nuestra base estará dada por la cantidad de ejes (o dimensiones) que le asociemos.

 

Cuando una base puede ser visualizada como un cubo de tres o más dimensiones, es más fácil para el usuario organizar la información e imaginarse en ella cortando y rebanando el cubo a través de cada una de sus dimensiones, para buscar la información deseada.

 

Para entender más el concepto, retomemos el ejemplo anterior. La descripción de una organización típica es: “Nosotros vendemos productos en varios mercados, y medimos nuestro desempeño en el tiempo”: Un diseñador dimensional lo verá como: “Nosotros vendemos productos en varios mercados, y medimos nuestro desempeño en el tiempo. Donde cada palabra subrayada corresponde a una dimensión.

 

Esto puede visualizarse como un cubo (Figura 3), donde cada punto dentro del cubo es una intersección de coordenadas definidas por los lados de éste (dimensiones). Ejemplos de medidas son: unidades producidas, unidades vendidas, costo de unidades producidas, ganancias ($) de unidades vendidas, etc.

 

Modelamiento multidimensional

 

Modelos de Datos

Un factor clave presente durante todo el diseño de un DW, fue expresado por Codd en 1983: “Ustedes pueden pensar que el significado de los datos es simple...pero no es así”. [Oviedo98]

Para construir un DW se debe primero tener claro que existe una diferencia entre la estructura de la información y la semántica de la información, y que esta última es mucho más difícil de abarcar y que también es precisamente con ella con la que se trabaja en la construcción de un DW.

Aquí se encuentra la principal diferencia entre los sistemas operacionales y el DW: Cada uno de ellos es sostenido por un modelo de datos diferente. Los sistemas operacionales se sustentan en el Modelo

Entidad Relación (MER) y DDW trabaja con el Modelo Multidimensional.

 

Características del MER

l Maneja la redundancia fuera de los datos. Por lo tanto realizar un cambio en la base significa tocarla en un solo lugar.

l Divide los datos en entidades, las que son representadas como tablas en una base de datos.

l Los MER crecen fácilmente, haciéndose más y más complejos.

l Se puede apreciar la existencia de muchos caminos para ir de una tabla a otra. Sería natural pensar que al tener diversos caminos para llegar desde una tabla a otra, cualquiera de ellos entregaría el mismo resultado, pero lamentablemente esto no siempre sucede así.

l El diagrama se visualiza simétrico, donde todas las tablas se parecen, sin distinguir a priori la importancia de unas respecto a otras. No es fácil de entender tanto para usuarios como para los diseñadores.

 

Características del Modelo Multidimensional

En general, la estructura básica de un DW para el Modelo Multidimensional está definida por dos elementos: esquemas y tablas.

 

Tablas DW: como cualquier base de datos relacional, un DW se compone de tablas.

Hay dos tipos básicos de tablas en el Modelo Multidimensional:

 

Tablas Fact: contienen los valores de las medidas de negocios, por ejemplo: ventas promedio en dólares, número de unidades vendidas, etc.

 

Tablas Lock_up: contienen el detalle de los valores que se encuentran asociados a la tabla Fact.

 

Esquemas DW: la colección de tablas en el DW se conoce como Esquema. Los esquemas caen dentro de dos categorías básicas: esquemas estrellas y esquemas snowflake.

 

Conceptos asociados al DDW

 

Esquema Estrella.

En general, el modelo multidimensional también se conoce con el nombre de esquema estrella, pues su estructura base es similar: una tabla central y un conjunto de tablas que la atienden radialmente.

 

El esquema estrella deriva su nombre del hecho que su diagrama forma una estrella, con puntos radiales desde el centro. El centro de la estrella consiste de una o más tablas fact, y las puntas de la estrella son las tablas lock_up.

 

Este modelo entonces, resulta ser asimétrico, pues hay una tabla dominante en el centro con varias conexiones a las otras tablas. Las tablas Lock-up tienen sólo la conexión a la tabla fact y ninguna más.

 

 

Esquema Snowflake.

La diferencia del esquema snowflake comparado con el esquema estrella, está en la estructura de las tablas lock_up: las tablas lock_up en el esquema snowflake están normalizadas. Cada tabla lock_up contiene sólo el nivel que es clave primaria en la tabla y la foreign key de su parentesco del nivel más cercano del diagrama.

 

 

Tabla Fact o de Hechos.

Es la tabla central en un esquema dimensional. Es en ella donde se almacenan las mediciones numéricas del negocio. Estas medidas se hacen sobre el grano, o unidad básica de la tabla.

 

El grano o la granularidad de la tabla queda determinada por el nivel de detalle que se almacenará en la tabla. Por ejemplo, para el caso de producto, mercado y tiempo antes visto, el grano puede ser la cantidad de madera vendida ‘mensualmente’. El grano revierte las unidades atómicas en el esquema dimensional.

 

Cada medida es tomada de la intersección de las dimensiones que la definen. Idealmente está compuesta por valores numéricos, continuamente evaluados y aditivos. La razón de estas características es que así se facilita que los miles de registros que involucran una consulta sean comprimidos en unas pocas l líneas en un set de respuesta.

 

La clave de la tabla fact recibe el nombre de clave compuesta o concatenada debido a que se forma de la composición (o concatenación) de las llaves primarias de las tablas dimensionales a las que está unida.

 

Así entonces, se distinguen dos tipos de columnas en una tabla fact: columnas fact y columnas key.

Donde la columna fact es la que almacena alguna medida de negocio y una columna key forma parte de la clave compuesta de la tabla.

 

Tablas Lock-up o Dimensionales

 

Estas tablas son las que se conectan a la tabla fact, son las que alimentan a la tabla fact. Una tabla lock_up almacena un conjunto de valores que están relacionados a una dimensión particular. Tablas lock_up no contienen hechos, en su lugar los valores en las tablas lock_up son los elementos que determinan la estructura de las dimensiones. Así entonces, en ellas existe el detalle de los valores de la dimensión respectiva.

 

Una tabla lock_up está compuesta de una primary key que identifica unívocamente una fila en la tabla junto con un conjunto de atributos, y dependiendo del diseño del modelo multidimensional puede existir una foreign key que determina su relación con otra tabla lock_up.

 

Para decidir si un campo de datos es un atributo o un hecho se analiza la variación de la medida a través del tiempo. Si varía continuamente implicaría tomarlo como un hecho, caso contrario será un atributo.

 

Los atributos dimensionales son un rol determinante en un DDW. Ellos son la fuente de todas las necesidades que debieran cubrirse. Esto significa que la base de datos será tan buena como lo sean los atributos dimensionales, mientras más descriptivos, manejables y de buena calidad, mejor será el DDW.

 

Pasos básicos del Modelamiento Multidimensional

 

1. Decidir cuáles serán los procesos de negocios a modelar, basándose en el conocimiento de éstos y de los datos disponibles. Ejemplo: Gastos realizados por cada mercado para cada ítem a nivel mensual. Productos vendidos por cada mercado según el precio en cada mes.

 

2. Decidir el Grano de la tabla Fact de cada proceso de negocio. Ejemplo: Producto x mercado x tiempo. En este punto se debe tener especial cuidado con la magnitud de la base de datos, con la información que se tiene y con las preguntas que se quiere responder. El grano decidirá las dimensiones del DDW. Cada dimensión debe tener el grano más pequeño que se pueda puesto que las preguntas que se realicen necesitan cortar la base en caminos precisos (aunque las preguntas no lo pidan explícitamente).

 

3. Decidir las dimensiones a través del grano. Las dimensiones presentes en la mayoría de los DDW son: tiempo, mercado, producto, cliente. Un grano bien elegido determina la dimensionalidad primaria de la tabla fact. Es posible usualmente agregar dimensiones adicionales al grano básico de la tabla fact, donde estas dimensiones adicionales toman un solo valor para cada combinación de las dimensiones primarias.

Si se reconoce que una dimensión adicional deseada viola el grano por causar registros adicionales a los generados, entonces el grano debe ser revisado para acomodar esta dimensión adicional.

 

4. Elegir las mediciones del negocio para la tabla fact. Se deben establecer los ítems que quedarán determinados por la clave compuesta de la tabla fact.

 

Profundizaciones de Diseño. La Dimensión Tiempo

Virtualmente se garantiza que cada DDW tendrá una tabla dimensional de tiempo, debido a la perspectiva de almacenamiento histórica de la información. Usualmente es la primera dimensión en definirse, con el objeto de establecer un orden, ya que la inserción de datos en la base de datos multidimensional se hace por intervalos de tiempo, lo cual asegura un orden implícito.

 

Dimensiones que varían lentamente en el tiempo

Son aquellas dimensiones que se mantienen “casi” constantes en el tiempo y que pueden preservar la estructura dimensional independiente del tiempo, con sólo agregados menores relativos para capturar la naturaleza cambiante del tiempo.

Cuando se encuentra una de estas dimensiones se está haciendo una de las siguientes fundamentales tres elecciones. Cada elección resulta en un diferente grado de seguimiento sobre el tiempo:

 

Tipo 1: Sobre escribir el viejo valor en el registro dimensional y por lo tanto perder la capacidad de seguir la vieja historia.

 

Tipo 2: Crear un registro dimensional adicional (con una nueva llave) que permita registrar el cambio presentado por el valor del atributo. De esta forma permanecerían en la base tanto el antiguo como el nuevo valor del registro con lo cual es posible segmentar la historia de la ocurrencia.

 

Tipo 3: Crear un campo “actual” nuevo en el registro dimensional original el cual almacene el valor del nuevo atributo, manteniendo el atributo original también. Cada vez que haya un nuevo cambio en el atributo, se modifica el campo “actual” solamente. No se mantiene un registro histórico de los cambios intermedios.

 

Niveles

Un nivel representa un nivel particular de agregación dentro de una dimensión; cada nivel sobre el nivel base representa la sumarización total de los datos desde el nivel inferior. Para un mejor entendimiento, veamos el siguiente ejemplo: consideremos una dimensión Tiempo con tres niveles: Mes, Semestre,

Año. El nivel Mes representa el nivel base, el nivel Semestre representa la sumarización de los totales por Mes y el nivel Año representa la sumarización de los totales para los Semestres.

Agregar niveles de sumarización otorga flexibilidad adicional a usuarios finales de aplicaciones EIS/ DSS para analizar los datos.

 

Sobre Jerarquías

A nivel de dimensiones es posible definir jerarquías, las cuales son grupos de atributos que siguen un orden pre establecido.

Una jerarquía implica una organización de niveles dentro de una dimensión, con cada nivel representando el total agregado de los datos del nivel inferior. Las jerarquías definen cómo los datos son sumarizados desde los niveles más bajos hacia los más altos. Una dimensión típica soporta una o más jerarquías naturales. Una jerarquía puede pero no exige contener todos los valores existentes en la dimensión.

Se debe evitar caer en la tentación de convertir en tablas dimensionales separadas cada una de las relaciones muchos-a-uno presentes en las jerarquías. Esta descomposición es irrelevante en el planeamiento del espacio ocupado en disco y sólo dificulta el entendimiento de la estructura para el usuario final, además de destruir el desempeño del browsing.

 

Fuentes:

www.inf.udec.cl/~revista/ediciones/edicion4/modmulti.PDF

cipriano.hernadez.alanis

unread,
Nov 6, 2012, 2:26:05 AM11/6/12
to itecnodgo_nint...@googlegroups.com
5 Modelado Multidimensional 5.1 Modelado multidimensional

Un modelo de datos multidimensional contiene un conjunto de medidas numéricas objeto de análisis.
Dichas medidas dependen de una serie de dimensiones.
Cada medida particular es un punto en un espacio multidimensional, en el que los valores de cada dimensión se suelen jerarquizar.

Los datos en un DW se modelan en data cubes (cubos de datos), estructuras multidimensionales (hipercubos).
Cuyas operaciones más comunes son:
  * Roll up (incremento en el nivel de agregación de los datos).
  * Drill Down (incremento en el nivel de detalle, opuesto a roll up).
  * Slice (reducción de la dimensionalidad de los datos mediante selección).
  * Dice (reducción de la dimensionalidad de los datos mediante proyección).
  * Pivotaje o rotación (reorientación de la visión multidimensional de los datos).

Modelos de Datos

Para construir un DW se debe primero tener claro que existe una diferencia entre la estructura de la información y la semántica de la información, y que esta última es mucho más difícil de abarcar y que también es precisamente con ella con la que se trabaja en la construcción de un DW.

Modelos de datos como conjuntos de medidas descritas por dimensiones.
  * Adecuado para resumir y organizar datos (p.ej. hojas de cálculo).
  * Enfocado para trabajar sobre datos de tipo numérico.
  * Más simple: Más fácil de visualizar y entender que el modelado E/R.

Existen una diferencia entre los sistemas operacionales y el SW, y esta es que cada tiene su propio modelo:
  * Sistemas Operacionales tienen el Modelo Entidad Relación (MER) y
  * DDW trabajan con el Modelo Multidimensional.

Características del MER
  * Maneja la redundancia fuera de los datos.
  * Divide los datos en entidades, son representadas como tablas.
  * Se puede apreciar la existencia de muchos caminos para ir de una tabla a otra.

http://www.buenastareas.com/ensayos/Modelo-Multidimensional/901230.html

francisco.gonzalez.cassio

unread,
Nov 6, 2012, 11:24:00 AM11/6/12
to itecnodgo_nint...@googlegroups.com

Modelado Dimensional.

Básicamente el Modelado Dimensional es el nombre que se le da a una técnica utilizada especialmente en Data Warehouses. Este modelo difiere bastante del modelo Entidad-Relación que normalmente conocemos.

El Modelo Dimensional busca presentar la información de una manera estándar, sencilla y sobre todo intuitiva para los usuarios, además de que permite accesos a la información mucho más rápida por parte de los manejadores de bases de datos.

Cada Modelo Dimensional esta compuesto por una tabla llamada "de hechos" y por un conjunto de pequeñas tablas llamadas "dimensiones". Cada dimensión contiene una llave primaria que se "conecta" a la tabla de hechos manteniendo una relación de 1 a muchos (1 a N).

La tabla de hechos contiene incluso varias llaves foráneas, cada una de ellas hacia una dimensión, es por eso que contiene una llave primaria compuesta, es decir, que se compone de varias columnas. Además las tablas de hecho típicamente incluyen otras columnas numéricas llamadas "métricas" o "hechos", por ejemplo en la figura anterior las métricas son "Ventas en Pesos" y "Ventas en Cantidad".

La información contenida en una tabla de hechos por si sola no nos dice nada, la mayoría de las veces contiene únicamente números.

Por otro lado las dimensiones comúnmente contienen información descriptiva. Los atributos de las dimensiones muchas veces serán los encabezados de las columnas en los reportes.

Lo bonito del modelo dimensional es que fácilmente los usuarios pueden intuir el contenido de la información y sobre todo permite a las aplicaciones de inteligencia de negocios extraer la información increíblemente rápido.

Fuente:
http://inparatodos.blogspot.mx/2010/09/que-es-un-modelo-dimensional.html

Se compone de 2 tipos de tablas que son:

1.-Tabla Fact o de Hechos.

Es la tabla central en un esquema dimensional. Es en ella donde se almacenan las mediciones
numéricas del negocio. Estas medidas se hacen sobre el grano, o unidad básica de la tabla.
El grano o la granularidad de la tabla queda determinada por el nivel de detalle que se almacenará en la
tabla. Por ejemplo, para el caso de producto, mercado y tiempo antes visto, el grano puede ser la
cantidad de madera vendida ‘mensualmente’. El grano revierte las unidades atómicas en el esquema
dimensional.
Cada medida es tomada de la intersección de las dimensiones que la definen. Idealmente está
compuesta por valores numéricos, continuamente evaluados y aditivos. La razón de estas características es que así

se facilita que los miles de registros que involucran una consulta sean

comprimidos en unas pocas l íneas en un set de respuesta.


La clave de la tabla fact recibe el nombre de clave compuesta o concatenada debido a que se forma de

la composición (o concatenaci ón) de las llaves primarias de las tablas dimensionales a las que está


unida.
Así entonces, se distinguen dos tipos de columnas en una tabla fact: columnas fact y columnas key.
Donde la columna fact es la que almacena alguna medida de negocio y una columna key forma parte
de la clave compuesta de la tabla.


2.-Tablas Lock-up o Dimensionales.

Estas tablas son las que se conectan a la tabla fact, son las que alimentan a la tabla fact. Una tabla
lock_up almacena un conjunto de valores que están relacionados a una dimensión particular. Tablas
lock_up no contienen hechos, en su lugar los valores en las tablas lock_up son los elementos que
determinan la estructura de las dimensiones. Así entonces, en ellas existe el detalle de los valores de la
dimensión respectiva.
Una tabla lock_up está compuesta de una primary key que identifica unívocamente una fila en la tabla
junto con un conjunto de atributos, y dependiendo del diseño del modelo multidimensional puede existir
una foreign key que determina su relación con otra tabla lock_up.
Para decidir si un campo de datos es un atributo o un hecho se analiza la variación de la medida a
través del tiempo. Si varía continuamente implicaría tomarlo como un hecho, caso contrario será un
atributo.

Los atributos dimensionales son un rol determinante . Ellos son la fuente de todas las


necesidades que debieran cubrirse. Esto significa que la base de datos será tan buena como lo sean los

atributos dimensionales, mientras más descriptivos, manejables y de buena calidad, mejor será la BD.


Pasos básicos del Modelamiento Multidimensional:

1. Decidir cuáles serán los procesos de negocios a modelar, basándose en el conocimiento de éstos y
de los datos disponibles. Ejemplo: Gastos realizados por cada mercado para cada ítem a nivel
mensual. Productos vendidos por cada mercado según el precio en cada mes.

2. Decidir el Grano de la tabla Fact de cada proceso de negocio.
Ejemplo : Producto x mercado x tiempo. En este punto se debe tener especial cuidado con la
magnitud de la base de datos, con la información que se tiene y con las preguntas que se quiere
responder. El grano decidirá las dimensiones del DDW. Cada dimensión debe tener el grano m ás
pequeño que se pueda puesto que las preguntas que se realicen necesitan cortar la base en
caminos precisos (aunque las preguntas no lo pidan expl ícitamente).

3. Decidir las dimensiones a través del grano. Las dimensiones presentes en la mayoría de los DDW
son: tiempo, mercado, producto, cliente. Un grano bien elegido determina la dimensionalidad
primaria de la tabla fact. Es posible usualmente agregar dimensiones adicionales al grano básico
de la tabla fact, donde estas dimensiones adicionales toman un solo valor para cada combinación
de las dimensiones primarias. Si se reconoce que una dimensión adicional deseada viola el grano
por causar registros adicionales a los generados, entonces el grano debe ser revisado para
acomodar esta dimensión adicional.

4. Elegir las mediciones del negocio para la tabla fact. Se deben establecer los ítemes que quedarán

determinados por la clave compuesta de la tabla fact.


Profundizaciones de Diseño:

1.-La Dimensión Tiempo.


Virtualmente se garantiza que cada DDW tendrá una tabla dimensional de tiempo, debido a la
perspectiva de almacenamiento histórica de la información. Usualmente es la primera dimensión en
definirse, con el objeto de establecer un orden, ya que la inserción de datos en la base de datos
multidimensional se hace por intervalos de tiempo, lo cual asegura un orden implícito.

2.- Dimensiones que varían lentamente en el tiempo.


Son aquellas dimensiones que se mantienen “casi” constantes en el tiempo y que pueden preservar la

estructura dimensional independiente del tiempo, con s ólo agregados menores relativos para capturar


la naturaleza cambiante del tiempo.


3.- Niveles


Un nivel representa un nivel particular de agregación dentro de una dimensión; cada nivel sobre el nivel
base representa la sumarización total de los datos desde el nivel inferior. Para un mejor entendimiento,
veamos el siguiente ejemplo: consideremos una dimensión Tiempo con tres niveles: Mes, Semestre,
Año. El nivel Mes representa el nivel base, el nivel Semestre representa la sumarización de los totales

por Mes y el nivel A ño representa la sumarización de los totales para los Semestres.


Agregar niveles de sumarización otorga flexibilidad adicional a usuarios finales de aplicaciones EIS/ DSS
para analizar los datos.

4.- Sobre Jerarquías


A nivel de dimensiones es posible definir jerarquías, las cuales son grupos de atributos que siguen un
orden preestablecido.
Una jerarquía implica una organización de niveles dentro de una dimensión, con cada nivel
representando el total agregado de los datos del nivel inferior. Las jerarquías definen cómo los datos
son sumarizados desde los niveles más bajos hacia los más altos. Una dimensión típica soporta una o
más jerarquías naturales. Una jerarquía puede pero no exige contener todos los valores existentes en la
dimensión .

Fuente:
http://www.inf.udec.cl/~revista/ediciones/edicion4/modmulti.PDF

silvia.flores.andrade

unread,
Nov 7, 2012, 12:44:00 AM11/7/12
to itecnodgo_nint...@googlegroups.com

Modelado Multidimensional 


La inteligencia de negocios se basa en almacenes de datos. Los almacenes de datos utilizan un modelo multidimensional, lo que representa hechos relevantes y sus medidas de acuerdo a las diferentes dimensiones. Basándose en este modelo, los cubos OLAP se puede definir, permitiendo a los tomadores de decisiones para analizar y sintetizar los datos. Ontologías (y, más específicamente, ontologías OWL) son una clave componente de la Web semántica. [1]

 

¿Qué es un modelo multidimensional?

 

Un modelo multidimensional es un modelo de la actividad empresarial en términos de hechos y dimensiones.

Un modelo multidimensional organiza los datos empresariales en una u otra de estas categorías. Los valores numéricos o medidas, tales como los totales de ventas, límites presupuestarios, etc, son los hechos de un negocio. El área cubierta por una empresa, en términos de geografía, tiempo, productos, etc, son las dimensiones de un negocio.

 

Mediante la creación de un modelo multidimensional y lo conecta a un modelo físico se puede ver en los datos en múltiples dimensiones, por ejemplo, las ventas de un producto, por región a través del tiempo, o la venta de un producto por el color, por región a través del tiempo, y así sucesivamente.[2]

 

 

Referencias

1.- http://translate.google.com.mx/translate?hl=es&langpair=en%7Ces&u=http://cedric.cnam.fr/fichiers/art_2507.pdf&ei=lPGZUL-IJ5DY9QSUnoH4DQ

 

2.- http://translate.google.com.mx/translate?hl=es&langpair=en%7Ces&u=http://manuals.sybase.com/onlinebooks/group-wa/wag0320e/waug/%40Generic__BookTextView/30045%3Bpt%3D28735&ei=BPKZUK6eBIbq9AS774CIBA






El lunes, 5 de noviembre de 2012 08:43:20 UTC-6, Administrador Grupo escribió:

jmanuelgarciaaragon

unread,
Nov 7, 2012, 10:04:53 AM11/7/12
to itecnodgo_nint...@googlegroups.com

5.1 Modelado multidimensional 

Modelamiento Dimensional es una técnica para modelar bases de datos simples y entendibles al usuario final. La idea fundamental es que el usuario visualice fácilmente la relación que existe entre las distintas componentes del modelo.

Consideremos un punto en el espacio. El espacio se define a través de sus ejes coordenados (por ejemplo X, Y, Z). Un punto cualquiera de este espacio quedará determinado por la intersección de tres valores particulares de sus ejes.

Si se le asignan valores particulares a estos ejes. Digamos que el eje X representa Productos, el eje Y representa el Mercado y, el eje Z corresponde al Tiempo. Se  podría tener por ejemplo, la siguiente combinación: producto = madera, mercado = Concepción, tiempo = diciembre-1998. La intersección de estos valores nos definirá un solo punto en nuestro espacio. Si el punto que buscamos, lo definimos como la cantidad de madera vendida, entonces se tendrá un valor específico y único para tal combinación.

En el modelo multidimensional cada eje corresponde a una dimensión particular . Entonces la dimensionalidad de nuestra base estará dada por la cantidad de ejes (o dimensiones) que le asociemos. Cuando una base puede ser visualizada como un cubo de tres o más dimensiones, es más fácil para el usuario organizar la información e imaginarse en ella cortando y rebanando el cubo a través de cada una de sus dimensiones, para buscar la información deseada.

Para entender más el concepto, retomemos el ejemplo anterior. La descripción de una organización típica es: “Nosotros vendemos productos en varios mercados, y medimos nuestro desempeño en el tiempo”: Un diseñador dimensional lo verá como: “Nosotros vendemos productos en varios mercados, y medimos nuestro desempeño en el tiempo. Donde cada palabra subrayada corresponde a una dimensión.

Esto puede visualizarse como un cubo (Figura 3), donde cada punto dentro del cubo es una intersección de coordenadas definidas por los lados de éste (dimensiones). Ejemplos de medidas son: unidades producidas, unidades vendidas, costo de unidades producidas, ganancias ($) de unidades vendidas, etc.

FIGURA  1: CUBO DIMENSIONAL PARA LA COMBINACIÓN DE PRODUCTO, MERCADO Y TIEMPO.

Victor Manuel Niebla Romero

unread,
Nov 7, 2012, 4:56:02 PM11/7/12
to itecnodgo_nint...@googlegroups.com
Modelado Multidimensional
La tecnología Datawarehousing debido a su orientación analítica, impone un procesamiento y 
pensamiento distinto, la cual se sustenta por un modelamiento de Bases de Datos propio, conocido 
como Modelamiento Multidimensional, el cual busca ofrecer al usuario su visión respecto de la operación 
del negocio.

Características del Modelo Multidimensional
En general, la estructura básica de un DW para el Modelo Multidimensional está definida por dos 
elementos: esquemas y tablas.
  • Tablas DW: como cualquier base de datos relacional, un DW se compone de tablas. Hay dos tipos básicos de tablas en el Modelo Multidimensional:
  • Tablas Fact : contienen los valores de las medidas de negocios, por ejemplo: ventas promedio en dólares, número de unidades vendidas, etc.
  • Tablas Lock_up: contienen el detalle de los valores que se encuentran asociados a la tabla Fact.
  • Esquemas DW: la colección de tablas en el DW se conoce como Esquema. Los esquemas caen dentro de dos categorías básicas: esquemas estrellas y esquemas snowflake. [1]
Referencias


cubo.png

José de Jesús Santes Palacios

unread,
Nov 8, 2012, 12:00:30 AM11/8/12
to itecnodgo_nint...@googlegroups.com
Modelado multidimensional.

Una solución multidimensional de Analysis Services usa estructuras de cubierta para analizar datos de negocio en varias dimensiones. El modo multidimensional es el modo de servidor predeterminado de Analysis Services. Incluye un motor de cálculo y consulta de datos OLAP, con los modos de almacenamiento MOLAP, ROLAP y ROLAP para equilibrar el rendimiento con los requisitos de datos escalables. El motor OLAP de Analysis Services es un servidor OLAP principal del sector que funciona con una amplia variedad de herramientas de BI. La mayoría de las implementaciones de Analysis Services se instalan como servidores OLAP clásicos.


Ventajas de usar soluciones multidimensionales.

La razón principal para generar un modelo multidimensional de Analysis Services es lograr el rendimiento rápido de consultas ad hoc en los datos empresariales. Un modelo multidimensional se compone de cubos y dimensiones que se pueden anotar y ampliar para admitir construcciones de consultas complejas. Los desarrolladores de BI crean cubos para admitir tiempos de respuesta rápida y para proporcionar un único origen de datos para informes empresariales. Debido a la mayor importancia de business intelligence en todos los niveles de una organización, el hecho de tener un solo origen de datos analíticos se garantiza que las discrepancias se mantienen al mínimo, si no se eliminan por completo.

Otra ventaja importante del uso de las bases de datos multidimensionales de Analysis Services es la integración con las herramientas de informes BI utilizadas habitualmente, como Excel, Reporting Services y PerformancePoint, así como las aplicaciones personalizadas y las soluciones de terceros.


Modelado de datos multidimensional.


Una base de datos multidimensional es un sistema de software diseñado para permitir el almacenamiento y la recuperación eficiente de grandes volúmenes de datos íntimamente relacionados y almacenados, vistos y analizados desde diferentes perspectivas (llamadas dimensiones).El componente fundamental de una base de datos multidimensional es un arreglo o matriz de n dimensiones. Este componente se representa como una estrella.

Una estrella o cubo multidimensional se compone de una tabla de hechos y de n tablas de dimensiones, donde n es la dimensión del cubo en cuestión.Los principales beneficios de este modelo son su facilidad de presentación, navegación y mantenimiento, así como su rapidez de acceso. Cabe hacer notar, que la tecnología multidimensional no está orientada para tomar el lugar de la tecnología relacional. Ambas tienen ventajas y desventajas, al igual que campos de aplicación convenientes como son  

para toma de decisiones o para desarrollo de tecnología de procesamiento de imágenes, etc. El campo de aplicación natural del modelo multidimensional de datos es el de los almacenes de datos.


Referencias:

http://msdn.microsoft.com/es-es/library/hh230904.aspx

http://es.scribd.com/doc/51439827/Herramientas-de-Modelado-Multidimensional

rodolfo.cabrales.barrios

unread,
Nov 8, 2012, 12:53:28 PM11/8/12
to itecnodgo_nint...@googlegroups.com

Introducción a los Modelos Multidimensionales.
Estructuras Básicas: Cubos, Dimensiones y Medidas.
En una base de datos multidimensional, la información se representa como
matrices  multidimensionales,  cuadros  de  múltiples  entradas  o  funciones  de
varias  variables sobre  conjuntos  finitos.  Cada  una de estas  matrices se
denomina Cubo .
El esquema de un cubo queda determinado dando a conocer sus ejes con
sus respectivas  estructuras y  la estructura  de  los  datos  que  se  presentan  en
cada  celda de la  matriz.  Se asume  que  los  datos  en  todas  las  celdas  son
uniformes,  es  decir, todas  las  posiciones  de  la matriz  tienen datos con  igual
estructura.
A los ejes se les llama Dimensiones  y al dato que se presenta en la matriz,
se  le  llama  Medida.  A  los  elementos  del  producto  cartesiano de los  ejes
(dimensiones)  se  le  llama  Coordenadas.  La  matriz  definida,  puede  ser
dispersa. (Es una función parcial).
Dimensiones con Jerarquías.
Generalmente, las dimensiones se estructuran en jerarquías de agregación.
Una dimensión puede tener más de una jerarquía. Un ejemplo típico, es una
dimensión que representa tiempo . En este caso, los niveles bimestre y
trimestre no están  relacionados  entre  sí,  a pesar  de  que  ambos  están
relacionados con mes y año.
Si  existe más  de  una  jerarquía,  la relación  que une  datos  de un nivel  con
datos  de  otro nivel  superior  debe  ser  confluente.  Esto  significa  que
todos  los caminos  que  parten  de  un elemento  e del  nivel E,  llegan al mismo
elemento  d del  nivel  D superior  a  E,  independientemente  de  la  jerarquía
recorrida. 
Operaciones Multidimensionales y Espacios de Cubos.
Las  operaciones  multidimensionales se  pueden agrupar  en  tres  conjuntos
básicos:
• De selección y visualización o Slice & Dice.
• De Agregación.
• De Relacionamiento.
En la bibliografía revisada, no se ha encontrado consenso en la definición de
Slice & Dice. Sin embargo,  se acepta  en  general,  que  hay  tres  operaciones
asociadas a Slice & Dice: Una que selecciona “dimensiones de trabajo” de un
cubo mayor, otra que selecciona “secciones” del cubo en función de valores de
las dimensiones y otra que permite “presentar” diferentes planos de un cubo. A
la primera  se  le  llama  Slice,  a  la  segunda  Dice o  Filtrado y  a  la  tercera
Rotación.
El  grupo de  las  operaciones  de  Agregación  está  constituido,  por
operaciones  que  surgen de realizar “movimientos”  en  las  jerarquías  de  las
dimensiones. Cuando se “sube” de nivel por una jerarquía,  se agrupan todos
los valores del nivel original que están relacionados con el mismo valor del nivel
superior, mientras que al “bajar”  por la jerarquía se produce la desagregación
de dichos valores. La primera operación se conoce como DrillUp y la segunda,
su inversa, como DrillDown.
Cuando se realiza un DrillUp, se debe calcular una nueva medida en función
del conjunto de los valores de  las medidas que se agrupan. A esta operación
se le llama Roll-up o Consolidación. Esta última operación también pertenece al
grupo de operaciones de Agregación  y su aplicación se traduce, típicamente,
en funciones de agregación como las presentes en SQL  (sum, avg, etc.).
A  partir  de  un  cubo,  mediante  las  operaciones  de  Relacionamiento,  se
puede acceder a otros datos. Si éstos últimos están en un cubo, la operación
se suele llamar de Drill-Across, mientras que si están en el Data Warehouse o
en la base operacional, la operación se suele llamar Drill-Through.

http://www.fing.edu.uy/inco/pedeciba/bibliote/tesis/tesis-carpani.pdf

cesar.monarrez.a

unread,
Nov 16, 2012, 10:23:32 PM11/16/12
to itecnodgo_nint...@googlegroups.com

Modelado multidimensional

Para el diseño de un DW, en general, se emplea la representación de un modelo multidimensional. El modelado multidimensional es una técnica de diseño lógico que busca presentar los datos en un estándar, que permita una recuperación adecuada de estos.

El modelo multidimensional es un modelo adecuado que provee un camino viable para agregar hechos a lo largo de múltiples atributos, llamados dimensiones. Los datos son almacenados como hechos y dimensiones en un modelo de datos relacional. Para poder entender la definición presentada así como el modelo multidimensional se deben
comprender tres conceptos: cubo, medida, dimensión.

Cubo
Un modelo de datos multidimensional soporta el manejo de una basta cantidad de datos empresariales y temporales. De esta forma surge la instancia del modelo multidimensional, también conocido como cubo o hipercubo, en cual podemos encontrar en interacción los conceptos mencionados en estos párrafos.

Para clarificarlo un poco se puede imaginar un cubo con tres dimensiones: producto, tiempo, región; donde cada dimensión tiene diferentes niveles o hechos, para finalmente intersectar estos valores y obtener una medida. La medida es el índice de un producto como puede ser el huevo en el mes de mayo y en la zona centro del país.

Dimensión
Las dimensiones son un concepto esencial de bases de datos multidimensionales. Las dimensiones son usadas para seleccionar y agregar datos a un cierto nivel deseado de detalle. Cada instancia de una dimensión o valor de una dimensión, corresponde a un nivel particular.

Viendo los datos dentro de un cubo se tiene la ventaja de que se puede manejar cualquier número de dimensiones. Sin embargo, usualmente un cubo tiene entre 4 y 12 dimensiones. Generalmente, un cubo soporta una vista de dos o tres dimensiones simultáneamente.

Medida
La medida o hecho es un dato numérico que representa una actividad especifica de un negocio, mientras que una dimensión representa una perspectiva de los datos. Cada dimensión está descrita por un conjunto de atributos (datos agregados). A su vez se pueden intersectar estas dimensiones para obtener un valor, llamado medida.

Los hechos representan el patrón de interés o el evento dentro de una empresa que necesita ser analizado. Los hechos son implícitamente definidos por la combinación de valores de las dimensiones. Un DW comúnmente maneja tres tipos de hechos:
  • Eventos: Con la granularidad más fina, típicamente modela eventos del mundo real.
  • Fotos fijas (snapshots): Modelan entidades en un punto dado en el tiempo.
  • Fotos fijas acumulativas: Modelan actividades en un punto dato en el tiempo.

Una medida contiene una propiedad numérica y una fórmula. Existen tres clases de medidas:
  • Medidas aditivas: Pueden ser combinadas a lo largo de cualquier dimensión.
  • Medidas semi-aditivas: No pueden ser combinadas a lo largo de una o más dimensiones.
  • Medidas no aditivas: No pueden ser combinadas a lo largo de ninguna dimensión.
Esquema relacional de un Data Warehouse

El modelo multidimensional de datos se puede instrumentar por un esquema relacional, donde las dimensiones del cubo son modeladas como relaciones de dimensiones. Los cubos son modelados como funciones del producto cartesiano sobre las dimensiones de las medidas de los datos.

Este esquema relacional almacena datos en tablas relacionales especializadas, llamadas tablas de hechos y de dimensiones. Este provee una vista multidimensional de los datos usando un modelo relacional como soporte. Los hechos son almacenados en la tabla de hechos así como las dimensiones en una tabla de dimensiones. Los hechos en la tabla de hechos están ligados a sus dimensiones.


Esquema en estrella

En el esquema en estrella, una sola tabla de hechos está relacionada a cada tabla de dimensión. Las tablas de dimensiones son enlazadas a la tabla de hechos mediante referencias de una llave foránea. La llave primaria en la tabla de hechos se compone de una relación de las llaves primarias de las tablas de dimensiones. El esquema en estrella puede ser redefinido en el esquema copo de nieve con un soporte para jerarquía de atributos, permitiendo que las tablas de dimensiones tengas tablas de sub-dimensiones.

Esquema copo de nieve

En el esquema copo de nieve las tablas de dimensiones son normalizadas para simplificar las operaciones de selección de datos, con lo que logra presentar la información sin redundancia, evitando así las anomalías. Este esquema representa mejor la semántica de las dimensiones del ambiente de los negocios, ya que tiene un acceso más directo a los datos, lo cuál se traduce en una eficiente recuperación de la información que manipulan las tablas.

Referencias Bibliograficas:


Reply all
Reply to author
Forward
0 new messages