4 Análisis Multidimensional 4.4 Definición de tablas de dimensiones (18 Octubre)

766 views
Skip to first unread message

Administrador Grupo

unread,
Oct 15, 2012, 11:57:18 AM10/15/12
to itecnodgo_nint...@googlegroups.com
Investigue como se definen las tablas de dimensiones.

Fecha de entrega 18 10 2012

francisco.gonzalez.cassio

unread,
Oct 16, 2012, 2:40:51 AM10/16/12
to itecnodgo_nint...@googlegroups.com

Tabla Dimensional.

En la construcción de cubos OLAP, las tablas de dimensiones son elementos que contienen atributos (o campos) que se utilizan para restringir y agrupar los datos almacenados en una tabla de hechos cuando se realizan consultas sobre dicho datos en un entorno de almacén de datos o data mart.
 
Estos datos sobre dimensiones son parámetros de los que dependen otros datos que serán objeto de estudio y análisis y que están contenidos en la tabla de hechos. Las tablas de dimensiones ayudan a realizar ese estudio/análisis aportando información sobre los datos de la tabla de hechos, por lo que puede decirse que en un cubo OLAP, la tabla de hechos contiene los datos de interés y las tablas de dimensiones contienen metadatos sobre dichos hechos.
Cada tabla unida ala tabla principal de hechos se le llama tabla dimensional.

Metodologia de Elaboracion de Tablas Dimensionales.

1. Seleccionar el proceso a modelar, es conocido como el HECHO de la base de datos dimensional.

Ejemplo: Venta de productos, Pedidos, Envíos, Inventario, ...

2. Establecer la granularidad del proceso y nivel Jerarquico.

Granularidad es el nivel de detalle al cual se identifican los componentes de un documento o una estructura de una base de datos.,En muchas ocasiones interesa disponer de los datos a varios niveles de granularidad, es decir, es importante para el negocio poder consultar los datos, en estos casos se crea una jerarquía con la dimensión, ya que tenemos varios niveles de asociación de los datos (Un ejemplo de  tiempo, se podrían crear niveles jerárquicos del tipo 'días', 'semanas', 'meses', ...).

¿Qué representa exactamente cada fila de la tabla de hechos?
Ejemplo: Venta diaria de productos, Venta diaria de productos por
ticket, ...
Tratar de elegir siempre el máximo nivel de detalle posible para ordenar nuestros datos.

 

3. Elegir las DIMENSIONES de análisis aplicables a cada hecho.

Las dimensiones permiten la organizacion de informacion dependiendo de la forma en que se vaya ingresando en la bd multidimensional, y sirben para clasificar la informacion ingresada de acuerdo a los factores que estemos definiendo como ejemplo: tenemos una conjunto de productos vendidos a cierto cliente en cierto dia, entonces al ingresar la informacion de venta al cubo se organizara esta informacion en las dimensiones establecidas como las siguientes: Día, Producto, Cliente, Tipo de transacción,esto facilita las categorias de clasificacion podriamos buscar la informacion de la venta por dia de la venta, a quien se la vendimos las dimensiones permiten crear categorias de clasificacion.

4. Identificar MEDIDAS numéricas de la tabla de hechos.

Las medidas son los valores, normalmente numéricos, que proporcionan resúmenes en diferentes niveles de agregación. Por ejemplo, Número de elementos de trabajo es una medida que muestra el número total de elementos de trabajo. Cuando se complementa con dimensiones como Prioridad, Asignado a, Fecha o Estado, la medida se puede utilizar para contestar una gran variedad de preguntas.

Dentro del cubo, las medidas se organizan en grupos de medidas. Cada grupo está asociado a un evento o hecho único del que la base de datos OLAP realiza un seguimiento. Asimismo, las medidas se pueden resumir según varias dimensiones, algunas de las cuales son comunes a los distintos grupos de medidas. Por ejemplo, Fecha, Generación, Proyecto, Persona, Área e Iteración son comunes a todos los grupos de medidas.


Ejemplo de tabla dimensional abajo.


http://indalog.ual.es/mtorres/cursodw/DisDimensional.pdf
http://ar.answers.yahoo.com/question/index?qid=20080330165731AAtsump
http://es.wikipedia.org/wiki/Tabla_de_dimensi%C3%B3n
http://msdn.microsoft.com/es-es/library/ms244710(v=vs.80).aspx

Tablas de dimension.png

Victor Manuel Niebla Romero

unread,
Oct 17, 2012, 4:00:57 PM10/17/12
to itecnodgo_nint...@googlegroups.com
Tablas de Dimensiones

En la construcción de cubos OLAP, las tablas de dimensiones son elementos que contienen atributos (o campos) que se utilizan para restringir y agrupar los datos almacenados en una tabla de hechos cuando se realizan consultas sobre dicho datos en un entorno de almacén de datos o data mart.
Estos datos sobre dimensiones son parámetros de los que dependen otros datos que serán objeto de estudio y análisis y que están contenidos en la tabla de hechos. Las tablas de dimensiones ayudan a realizar ese estudio/análisis aportando información sobre los datos de la tabla de hechos, por lo que puede decirse que en un cubo OLAP, la tabla de hechos contiene los datos de interés y las tablas de dimensiones contienen metadatos sobre dichos hechos. 

Cada dimensión puede referirse a conceptos como 'tiempo', 'productos', 'clientes', 'zona geográfica', etc. Ahora bien, cada dimensión puede estar medida de diferentes maneras según la granularidad deseada, por ejemplo, para la dimensión "zona geográfica" podríamos considerar 'localidades', 'provincias', 'regiones', 'países' o 'continentes'[Imagen 1 "dimensión"].

En cualquier Dataware house se pueden encontrar varios cubos con sus tablas de hechos repletas de registros sobre alguna variable de interés para el negocio que debe ser estudiada. Como ya se ha comentado, cada tabla de hechos estará rodeada de varias tablas de dimensiones, según que parámetros sirvan mejor para realizar el análisis de los hechos que se quieren estudiar. Un parámetro que casi con toda probabilidad será común a todos los cubos es el tiempo, ya que lo habitual es almacenar los hechos conforme van ocurriendo a lo largo del tiempo, obteniéndose así una serie temporal de la variable a estudiar.
Dado que el tiempo es una dimensión presente en prácticamente cualquier cubo de un sistema OLAP merece una atención especial. Al diseñar la dimensión tiempo (tanto para un esquema en estrella como para un esquema en copo de nieve) hay que prestar especial cuidado, ya que puede hacerse de varias maneras y no todas son igualmente eficientes. La forma más común de diseñar esta tabla es poniendo como clave principal (PK) de la tabla la fecha o fecha/hora. Este diseño no es de los más recomendables, ya que a la mayoría de los sistemas de gestión de bases de datos les resulta más costoso hacer búsquedas sobre campos de tipo "date" o "datetime", estos costes se reducen si el campo clave es de tipo entero, además, un dato entero siempre ocupa menos espacio que un dato de tipo fecha (el campo clave se repetirá en millones de registros en la tabla de hechos y eso puede ser mucho espacio), por lo que se mejorará el diseño de la tabla de tiempos si se utiliza un campo "TiempoID" de tipo entero como clave principal. [1]

Referencias Bibliográficas

dimension.png

luis.galindo.ortega

unread,
Oct 17, 2012, 4:58:28 PM10/17/12
to itecnodgo_nint...@googlegroups.com
Tabla de dimensiones. 

En el modelo de almacén de datos multidimensional, se representan cada una de las posibles clasificaciones que se pueden aplicar a filas o columnas. Estas son tablas de doble entrada. A los datos almacenados de esta manera se les suele llamar cubos. Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. [1] 

Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio.Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. [2] 

Al momento de añadir la clave principal a una tabla de dimensión, se puede establecer:
  1. Una única columna que sea clave primaria e identifique unívocamente cada registro.
  2. Varias columnas que sean clave primaria e identifiquen en conjunto, unívocamente cada registro.
La primera opción requiere menos espacio de almacenamiento en el DW y permite que las consultas SQL sean más sencillas. La segunda opción requiere más espacio de almacenamiento en el DW, provoca que las consultas SQL sean más complejas y por consiguiente hace que se demore más tiempo en procesar los resultados. Sin embargo, esta última alternativa hace que los procesos ETL sean menos complejos y más eficientes. [3] 

Bibliografia

jgerardo.felixo

unread,
Oct 17, 2012, 6:07:36 PM10/17/12
to itecnodgo_nint...@googlegroups.com

Tabla Dimensional

Una tabla de dimensiones es una tabla en un esquema en estrella de un almacén de datos. Una tabla de dimensión tiendas atributos o dimensiones, que describen los objetos en una tabla de hechos.

In data warehousing, a dimension is a collection of reference information about a measurable event. En el almacenamiento de datos, una dimensión es una recopilación de información de referencia acerca de un evento mensurable. These events are known as facts and are stored in a fact table. Estos eventos son conocidos como datos y se almacenan en una tabla de hechos. Dimensions categorize and describe data warehouse facts and measures in ways that support meaningful answers to business questions. Dimensiones clasificar y describir hechos de almacenamiento de datos y medidas de manera que apoyen respuestas significativas a preguntas de negocios. They form the very core of dimensional modeling. Ellos forman el núcleo de modelado dimensional.

A data warehouse organizes descriptive attributes as columns in dimension tables. Un almacén de datos organiza los atributos descriptivos como columnas en las tablas de dimensiones. For example, a customer dimension's attributes could include first and last name, birth date, gender, etc., or a website dimension would include site name and URL attributes. Por ejemplo, los atributos de una dimensión del cliente puede incluir nombre y apellido, fecha de nacimiento, género, etc, o una dimensión sitio web incluirá el nombre del sitio y los atributos de URL.

A dimension table has a primary key column that uniquely identifies each dimension record (row). Una tabla de dimensiones tiene una columna de clave principal que identifica de forma única cada registro dimensión (fila). The dimension table is associated with a fact table using this key. La tabla de dimensión se asocia con una tabla de hechos mediante esta tecla. Data in the fact table can be filtered and grouped (“sliced and diced”) by various combinations of attributes. Los datos en la tabla de datos pueden ser filtrados y agrupados ("rodajas y cubitos") por varias combinaciones de atributos. For example, a Login fact with Customer, Website, and Date dimensions can be queried for “number of males age 19-25 who logged in to funsportsite.com more than once during the last week of September 2010, grouped by day.” Por ejemplo, un hecho Acceda con dimensiones de clientes, Website, fecha y puede ser consultada por "número de varones de 19 a 25 que iniciar sesión para funsportsite.com más de una vez durante la última semana de septiembre de 2010, agrupadas por día."

Dimension tables are referenced by fact tables using keys. Las tablas de dimensiones se hace referencia a las tablas de hechos con las teclas. When creating a dimension table in a data warehouse, a system-generated key is used to uniquely identify a row in the dimension. Cuando se crea una tabla de dimensiones en un almacén de datos, una clave generada por el sistema se utiliza para identificar de forma única una fila de la dimensión. This key is also known as a surrogate key. Esta clave es también conocida como una clave sustituta. The surrogate key is used as the primary key in the dimension table. La clave sustituta se utiliza como la clave principal de la tabla de dimensiones. The surrogate key is placed in the fact table and a foreign key is defined between the two tables. La clave sustituta se coloca en la tabla de hechos y una clave externa se define entre las dos tablas. When the data is joined, it does so just as any other join within the database. Cuando los datos se unió, lo hace al igual que cualquier otra combinación dentro de la base de datos.

Like fact tables, dimension tables are often highly de-normalized, because these structures are not built to manage transactions they are built to enable users to analyze data as easily as possible. Al igual que las tablas de datos, tablas de medidas son a menudo muy de-normalizada, debido a que estas estructuras no están diseñadas para gestionar las transacciones que se construyen para permitir a los usuarios analizar los datos de forma más fácil posible. [1]

 

Fuente:

[1] http://searchdatamanagement.techtarget.com/definition/dimension-table

silvia.flores.andrade

unread,
Oct 18, 2012, 12:31:41 AM10/18/12
to itecnodgo_nint...@googlegroups.com

Tablas dimensionales

Las tablas de dimensiones contienen atributos que describen los registros hechos en la tabla de hechos. Algunos de estos atributos proporcionan información descriptiva, mientras que otros se utilizan para especificar cómo los datos de la tabla de hechos deben resumirse para proporcionar información útil al analista. Las tablas de dimensiones contienen jerarquías de atributos que ayuda en resumen. [1]

Ejemplo:

Una dimensión que contiene información sobre los productos a menudo contienen una jerarquía que separa los productos en categorías como alimentos, bebidas, y artículos no consumibles, con cada una de estas categorías subdivide en varias ocasiones hasta que el individuo SKU producto se alcanza en el nivel más bajo 

Las tablas de dimensiones.

Normalmente las tablas de dimensiones contienen un conjunto de atributos repetitivos usados ​​para restringir los datos sobre un hecho particular o medida. Las tablas de dimensiones también pueden contener jerarquías de atributos. Por ejemplo, en el día dimensión fecha enrolla en mes, mes y trimestre a trimestre en año.[2]

 

Referencias:

1.- http://translate.google.com.mx/translate?hl=es&langpair=en%7Ces&u=http://msdn.microsoft.com/en-us/library/aa905979(v%3Dsql.80).aspx

2.- https://uisapp2.iu.edu/.../Draft+Proposal+for+Conformed+Dimension.

cipriano.hernadez.alanis

unread,
Oct 18, 2012, 11:03:26 PM10/18/12
to itecnodgo_nint...@googlegroups.com
 tablas de dimensiones.
En un almacén de datos o un sistema OLAP, la construcción de Cubos OLAP requiere de una tabla de hechos y varias tablas de dimensiones, éstas acompañan a la tabla de hechos y determinan los parámetros (dimensiones) de los que dependen los hechos registrados en la tabla de hechos.

La unidad de medida (por localidades, provincias, etc.) determinará esa granularidad, cuanto más pequeña sea esta unidad de medida más fina será esta granularidad (grano fino); si las unidades de medida son mayores, entonces hablaremos de granularidad gruesa (grano grueso).

En muchas ocasiones interesa disponer de los datos a varios niveles de granularidad, es decir, es importante para el negocio poder consultar los datos (siguiendo el ejemplo de las zonas) por localidades, provincias, etc., en estos casos se crea una jerarquía con la dimensión, ya que tenemos varios niveles de asociación de los datos (con otras dimensiones como el tiempo, se podrían crear niveles jerárquicos del tipo 'días', 'semanas', 'meses', ...).

Cuando las tablas de dimensión asociadas a una tabla de hechos no reflejan ninguna jerarquía (por ejemplo: Las zonas siempre son 'provincias' y sólo provincias, el tiempo se mide en 'días' y sólo en días, etc.) el cubo resultante tendrá forma de estrella, es decir, una tabla de hechos central rodeada de tantas tablas como dimensiones, y sólo habrá, además de la tabla de hechos, una tabla por cada dimensión.

Cuando una o varias de las dimensiones del cubo refleja algún tipo de jerarquía existen dos planteamientos con respecto a la forma que deben ser diseñadas las tablas de dimensión. El primero consiste en reflejar todos los niveles jerárquicos de una dimensión dentro de una única tabla, en este caso también tendríamos un esquema en estrellacomo el que se ha descrito anteriormente.

El otro planteamiento consiste en aplicar a las dimensiones las reglas de normalización de las bases de datos relacionales. Estas normas están ideadas para evitar redundancias en los datos aumentando el número de tablas, de esta forma se consigue almacenar la información en menos espacio. Este diseño da como resultado en esquema en copo de nieve. Este modo de organizar las dimensiones de un cubo OLAP tiene un inconveniente respecto al modelo en estrella que no compensa el ahorro de espacio de almacenamiento. En las aplicaciones OLAP el recurso crítico, no es tanto el espacio para almacenamiento como el tiempo de respuesta del sistema ante consultas del usuario, y está constatado que los modelos en copo de nieve tienen un tiempo de respuesta mayor que los modelos en estrella.[1]


FUENTE DE INFORMACIÓN.

[1]http://es.wikipedia.org/wiki/Tabla_de_dimensi%C3%B3n


El lunes, 15 de octubre de 2012 10:57:18 UTC-5, Administrador Grupo escribió:

Guillermo Lopez Angulo

unread,
Oct 19, 2012, 10:04:38 PM10/19/12
to itecnodgo_nint...@googlegroups.com
Tabla de dimensión


En un almacén de datos o un sistema OLAP, la construcción de Cubos OLAP requiere de una tabla de hechos y varias tablas de dimensiones, éstas acompañan a la tabla de hechos y determinan los parámetros (dimensiones) de los que dependen los hechos registrados en la tabla de hechos.

En la construcción de cubos OLAP, las tablas de dimensiones son elementos que contienen atributos (o campos) que se utilizan para restringir y agrupar los datos almacenados en una tabla de hechos cuando se realizan consultas sobre dicho datos en un entorno de almacén de datos o data mart.

Estos datos sobre dimensiones son parámetros de los que dependen otros datos que serán objeto de estudio y análisis y que están contenidos en la tabla de hechos. Las tablas de dimensiones ayudan a realizar ese estudio/análisis aportando información sobre los datos de la tabla de hechos, por lo que puede decirse que en un cubo OLAP, la tabla de hechos contiene los datos de interés y las tablas de dimensiones contienen metadatos sobre dichos hechos.

Granularidad de dimensión y jerarquías

Cada dimensión puede referirse a conceptos como 'tiempo', 'productos', 'clientes', 'zona geográfica', etc. Ahora bien, cada dimensión puede estar medida de diferentes maneras según la granularidad deseada, por ejemplo, para la dimensión "zona geográfica" podríamos considerar 'localidades', 'provincias', 'regiones', 'países' o 'continentes'.


La unidad de medida (por localidades, provincias, etc.) determinará esa granularidad, cuanto más pequeña sea esta unidad de medida más fina será esta granularidad (grano fino); si las unidades de medida son mayores, entonces hablaremos de granularidad gruesa (grano grueso).

En muchas ocasiones interesa disponer de los datos a varios niveles de granularidad, es decir, es importante para el negocio poder consultar los datos (siguiendo el ejemplo de las zonas) por localidades, provincias, etc., en estos casos se crea una jerarquía con la dimensión, ya que tenemos varios niveles de asociación de los datos (con otras dimensiones como el tiempo, se podrían crear niveles jerárquicos del tipo 'días', 'semanas', 'meses', ...).

Cuando las tablas de dimensión asociadas a una tabla de hechos no reflejan ninguna jerarquía (por ejemplo: Las zonas siempre son 'provincias' y sólo provincias, el tiempo se mide en 'días' y sólo en días, etc.) el cubo resultante tendrá forma de estrella, es decir, una tabla de hechos central rodeada de tantas tablas como dimensiones, y sólo habrá, además de la tabla de hechos, una tabla por cada dimensión.

Cuando una o varias de las dimensiones del cubo refleja algún tipo de jerarquía existen dos planteamientos con respecto a la forma que deben ser diseñadas las tablas de dimensión. El primero consiste en reflejar todos los niveles jerárquicos de una dimensión dentro de una única tabla, en este caso también tendríamos un esquema en estrella como el que se ha descrito anteriormente.

El otro planteamiento consiste en aplicar a las dimensiones las reglas de normalización de las bases de datos relacionales. Estas normas están ideadas para evitar redundancias en los datos aumentando el número de tablas, de esta forma se consigue almacenar la información en menos espacio. Este diseño da como resultado en esquema en copo de nieve. Este modo de organizar las dimensiones de un cubo OLAP tiene un inconveniente respecto al modelo en estrella que no compensa el ahorro de espacio de almacenamiento. En las aplicaciones OLAP el recurso crítico, no es tanto el espacio para almacenamiento como el tiempo de respuesta del sistema ante consultas del usuario, y está constatado que los modelos en copo de nieve tienen un tiempo de respuesta mayor que los modelos en estrella.


En cualquier Dataware house se pueden encontrar varios cubos con sus tablas de hechos repletas de registros sobre alguna variable de interés para el negocio que debe ser estudiada. Como ya se ha comentado, cada tabla de hechos estará rodeada de varias tablas de dimensiones, según que parámetros sirvan mejor para realizar el análisis de los hechos que se quieren estudiar. Un parámetro que casi con toda probabilidad será común a todos los cubos es el tiempo, ya que lo habitual es almacenar los hechos conforme van ocurriendo a lo largo del tiempo, obteniéndose así una serie temporal de la variable a estudiar.

Dado que el tiempo es una dimensión presente en prácticamente cualquier cubo de un sistema OLAP merece una atención especial.


Granularidad_geografica.png
images.jpg

José de Jesús Santes Palacios

unread,
Oct 20, 2012, 6:02:48 PM10/20/12
to itecnodgo_nint...@googlegroups.com
Tablas de dimensiones

Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio.
Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.
Los datos dentro de estas tablas, que proveen información del negocio o que describen alguna de sus características, son llamados datos de referencia. Entonces, se puede afirmar que una tabla de dimensión posee una clave primaria y uno o más datos de referencia.[1]

Referencia:


jmanuelgarciaaragon

unread,
Oct 22, 2012, 9:30:53 PM10/22/12
to itecnodgo_nint...@googlegroups.com

Tabla de dimensiones. 

 

En un almacén de datos multidimensional, se representan cada una de las posibles clasificaciones que se pueden aplicar a filas o columnas. Estas son tablas de doble entrada. A los datos almacenados de esta manera se les suele llamar cubos. Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. [1] 

 

Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. [2] 

 

Al momento de añadir la clave principal a una tabla de dimensión, se puede establecer:

  1. Una única columna que sea clave primaria e identifique unívocamente cada registro.
  2. Varias columnas que sean clave primaria e identifiquen en conjunto, unívocamente cada registro.

La primera opción requiere menos espacio de almacenamiento en el DW y permite que las consultas SQL sean más sencillas. La segunda opción requiere más espacio de almacenamiento en el DW, provoca que las consultas SQL sean más complejas y por consiguiente hace que se demore más tiempo en procesar los resultados. Sin embargo, esta última alternativa hace que los procesos ETL sean menos complejos y más eficientes. [3] 

 

Fuente

cesar.monarrez.a

unread,
Nov 6, 2012, 8:10:17 PM11/6/12
to itecnodgo_nint...@googlegroups.com

Tablas Dimensionales (Tablas Lock-up)


Estas tablas son las que se conectan a la tabla fact, son las que alimentan a la tabla fact. Una tabla lock_up almacena un conjunto de valores que están relacionados a una dimensión particular.


Tablas lock_up no contienen hechos, en su lugar los valores en las tablas lock_up son los elementos que determinan la estructura de las dimensiones. Así entonces, en ellas existe el detalle de los valores de la dimensión respectiva.


Una tabla lock_up está compuesta de una primary key que identifica unívocamente una fila en la tabla junto con un conjunto de atributos, y dependiendo del diseño del modelo multidimensional puede existir una foreign key que determina su relación con otra tabla lock_up.


Para decidir si un campo de datos es un atributo o un hecho se analiza la variación de la medida a través del tiempo. Si varía continuamente implicaría tomarlo como un hecho, caso contrario será un atributo.


Los atributos dimensionales son un rol determinante en un DDW. Ellos son la fuente de todas las necesidades que debieran cubrirse. Esto significa que la base de datos será tan buena como lo sean los atributos dimensionales, mientras más descriptivos, manejables y de buena calidad, mejor será el DDW.


Referencias Blbliograficas
Reply all
Reply to author
Forward
0 new messages