Tabla Dimensional.
En la construcción de cubos OLAP, las tablas de dimensiones son elementos que contienen atributos (o campos) que se utilizan para restringir y agrupar los datos almacenados en una tabla de hechos cuando se realizan consultas sobre dicho datos en un entorno de almacén de datos o data mart.
Estos datos sobre dimensiones son parámetros de los que dependen otros datos que serán objeto de estudio y análisis y que están contenidos en la tabla de hechos. Las tablas de dimensiones ayudan a realizar ese estudio/análisis aportando información sobre los datos de la tabla de hechos, por lo que puede decirse que en un cubo OLAP, la tabla de hechos contiene los datos de interés y las tablas de dimensiones contienen metadatos sobre dichos hechos.
Cada tabla unida ala tabla principal de hechos se le llama tabla dimensional.
Metodologia de Elaboracion de Tablas Dimensionales.
1. Seleccionar el proceso a modelar, es conocido como el HECHO de la base de datos dimensional.
Ejemplo: Venta de productos, Pedidos, Envíos, Inventario, ...
2. Establecer la granularidad del proceso y nivel Jerarquico.
Granularidad es el nivel de detalle al cual se identifican los componentes de un documento o una estructura de una base de datos.,En muchas ocasiones interesa disponer de los datos a varios niveles de granularidad, es decir, es importante para el negocio poder consultar los datos, en estos casos se crea una jerarquía con la dimensión, ya que tenemos varios niveles de asociación de los datos (Un ejemplo de tiempo, se podrían crear niveles jerárquicos del tipo 'días', 'semanas', 'meses', ...).
¿Qué representa exactamente cada fila de la tabla de hechos?
Ejemplo: Venta diaria de productos, Venta diaria de productos por
ticket, ...
Tratar de elegir siempre el máximo nivel de detalle posible para ordenar nuestros datos.
3. Elegir las DIMENSIONES de análisis aplicables a cada hecho.
Las dimensiones permiten la organizacion de informacion dependiendo de la forma en que se vaya ingresando en la bd multidimensional, y sirben para clasificar la informacion ingresada de acuerdo a los factores que estemos definiendo como ejemplo: tenemos una conjunto de productos vendidos a cierto cliente en cierto dia, entonces al ingresar la informacion de venta al cubo se organizara esta informacion en las dimensiones establecidas como las siguientes: Día, Producto, Cliente, Tipo de transacción,esto facilita las categorias de clasificacion podriamos buscar la informacion de la venta por dia de la venta, a quien se la vendimos las dimensiones permiten crear categorias de clasificacion.
4. Identificar MEDIDAS numéricas de la tabla de hechos.
Las medidas son los valores, normalmente numéricos, que proporcionan resúmenes en diferentes niveles de agregación. Por ejemplo, Número de elementos de trabajo es una medida que muestra el número total de elementos de trabajo. Cuando se complementa con dimensiones como Prioridad, Asignado a, Fecha o Estado, la medida se puede utilizar para contestar una gran variedad de preguntas.
Dentro del cubo, las medidas se organizan en grupos de medidas. Cada grupo está asociado a un evento o hecho único del que la base de datos OLAP realiza un seguimiento. Asimismo, las medidas se pueden resumir según varias dimensiones, algunas de las cuales son comunes a los distintos grupos de medidas. Por ejemplo, Fecha, Generación, Proyecto, Persona, Área e Iteración son comunes a todos los grupos de medidas.
Ejemplo de tabla dimensional abajo.
http://indalog.ual.es/mtorres/cursodw/DisDimensional.pdf
http://ar.answers.yahoo.com/question/index?qid=20080330165731AAtsump
http://es.wikipedia.org/wiki/Tabla_de_dimensi%C3%B3n
http://msdn.microsoft.com/es-es/library/ms244710(v=vs.80).aspx
Tabla Dimensional
Una tabla de dimensiones es una tabla en un esquema en estrella de un almacén de datos. Una tabla de dimensión tiendas atributos o dimensiones, que describen los objetos en una tabla de hechos.
En el almacenamiento de datos, una dimensión es una recopilación de información de referencia acerca de un evento mensurable. Estos eventos son conocidos como datos y se almacenan en una tabla de hechos. Dimensiones clasificar y describir hechos de almacenamiento de datos y medidas de manera que apoyen respuestas significativas a preguntas de negocios. Ellos forman el núcleo de modelado dimensional.
Un almacén de datos organiza los atributos descriptivos como columnas en las tablas de dimensiones. Por ejemplo, los atributos de una dimensión del cliente puede incluir nombre y apellido, fecha de nacimiento, género, etc, o una dimensión sitio web incluirá el nombre del sitio y los atributos de URL.
Una tabla de dimensiones tiene una columna de clave principal que identifica de forma única cada registro dimensión (fila). funsportsite.com más de una vez durante la última semana de septiembre de 2010, agrupadas por día." La tabla de dimensión se asocia con una tabla de hechos mediante esta tecla. Los datos en la tabla de datos pueden ser filtrados y agrupados ("rodajas y cubitos") por varias combinaciones de atributos. Por ejemplo, un hecho Acceda con dimensiones de clientes, Website, fecha y puede ser consultada por "número de varones de 19 a 25 que iniciar sesión para
Las tablas de dimensiones se hace referencia a las tablas de hechos con las teclas. Cuando se crea una tabla de dimensiones en un almacén de datos, una clave generada por el sistema se utiliza para identificar de forma única una fila de la dimensión. Esta clave es también conocida como una clave sustituta. La clave sustituta se utiliza como la clave principal de la tabla de dimensiones. La clave sustituta se coloca en la tabla de hechos y una clave externa se define entre las dos tablas. Cuando los datos se unió, lo hace al igual que cualquier otra combinación dentro de la base de datos.
Al igual que las tablas de datos, tablas de medidas son a menudo muy de-normalizada, debido a que estas estructuras no están diseñadas para gestionar las transacciones que se construyen para permitir a los usuarios analizar los datos de forma más fácil posible. [1]
Fuente:
[1] http://searchdatamanagement.techtarget.com/definition/dimension-table
Tablas dimensionales
Las tablas de dimensiones contienen atributos que describen los registros hechos en la tabla de hechos. Algunos de estos atributos proporcionan información descriptiva, mientras que otros se utilizan para especificar cómo los datos de la tabla de hechos deben resumirse para proporcionar información útil al analista. Las tablas de dimensiones contienen jerarquías de atributos que ayuda en resumen. [1]
Ejemplo:
Una dimensión que contiene información sobre los productos a menudo contienen una jerarquía que separa los productos en categorías como alimentos, bebidas, y artículos no consumibles, con cada una de estas categorías subdivide en varias ocasiones hasta que el individuo SKU producto se alcanza en el nivel más bajo
Las tablas de dimensiones.
Normalmente las tablas de dimensiones contienen un conjunto de atributos repetitivos usados para restringir los datos sobre un hecho particular o medida. Las tablas de dimensiones también pueden contener jerarquías de atributos. Por ejemplo, en el día dimensión fecha enrolla en mes, mes y trimestre a trimestre en año.[2]
Referencias:
2.- https://uisapp2.iu.edu/.../Draft+Proposal+for+Conformed+Dimension.
La unidad de medida (por localidades, provincias, etc.) determinará esa granularidad, cuanto más pequeña sea esta unidad de medida más fina será esta granularidad (grano fino); si las unidades de medida son mayores, entonces hablaremos de granularidad gruesa (grano grueso).
En muchas ocasiones interesa disponer de los datos a varios niveles de granularidad, es decir, es importante para el negocio poder consultar los datos (siguiendo el ejemplo de las zonas) por localidades, provincias, etc., en estos casos se crea una jerarquía con la dimensión, ya que tenemos varios niveles de asociación de los datos (con otras dimensiones como el tiempo, se podrían crear niveles jerárquicos del tipo 'días', 'semanas', 'meses', ...).
Cuando las tablas de dimensión asociadas a una tabla de hechos no reflejan ninguna jerarquía (por ejemplo: Las zonas siempre son 'provincias' y sólo provincias, el tiempo se mide en 'días' y sólo en días, etc.) el cubo resultante tendrá forma de estrella, es decir, una tabla de hechos central rodeada de tantas tablas como dimensiones, y sólo habrá, además de la tabla de hechos, una tabla por cada dimensión.
Cuando una o varias de las dimensiones del cubo refleja algún tipo de jerarquía existen dos planteamientos con respecto a la forma que deben ser diseñadas las tablas de dimensión. El primero consiste en reflejar todos los niveles jerárquicos de una dimensión dentro de una única tabla, en este caso también tendríamos un esquema en estrellacomo el que se ha descrito anteriormente.
El otro planteamiento consiste en aplicar a las dimensiones las reglas de normalización de las bases de datos relacionales. Estas normas están ideadas para evitar redundancias en los datos aumentando el número de tablas, de esta forma se consigue almacenar la información en menos espacio. Este diseño da como resultado en esquema en copo de nieve. Este modo de organizar las dimensiones de un cubo OLAP tiene un inconveniente respecto al modelo en estrella que no compensa el ahorro de espacio de almacenamiento. En las aplicaciones OLAP el recurso crítico, no es tanto el espacio para almacenamiento como el tiempo de respuesta del sistema ante consultas del usuario, y está constatado que los modelos en copo de nieve tienen un tiempo de respuesta mayor que los modelos en estrella.[1]
FUENTE DE INFORMACIÓN.
[1]http://es.wikipedia.org/wiki/Tabla_de_dimensi%C3%B3n
FUENTE DE INFORMACIÓN.
Tabla de dimensiones.
En un almacén de datos multidimensional, se representan cada una de las posibles clasificaciones que se pueden aplicar a filas o columnas. Estas son tablas de doble entrada. A los datos almacenados de esta manera se les suele llamar cubos. Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. [1]
Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. [2]
Al momento de añadir la clave principal a una tabla de dimensión, se puede establecer:
La primera opción requiere menos espacio de almacenamiento en el DW y permite que las consultas SQL sean más sencillas. La segunda opción requiere más espacio de almacenamiento en el DW, provoca que las consultas SQL sean más complejas y por consiguiente hace que se demore más tiempo en procesar los resultados. Sin embargo, esta última alternativa hace que los procesos ETL sean menos complejos y más eficientes. [3]
Fuente
Estas tablas son las que se conectan a la tabla fact, son las que alimentan a la tabla fact. Una tabla lock_up almacena un conjunto de valores que están relacionados a una dimensión particular.
Tablas lock_up no contienen hechos, en su lugar los valores en las tablas lock_up son los elementos que determinan la estructura de las dimensiones. Así entonces, en ellas existe el detalle de los valores de la dimensión respectiva.
Una tabla lock_up está compuesta de una primary key que identifica unívocamente una fila en la tabla junto con un conjunto de atributos, y dependiendo del diseño del modelo multidimensional puede existir una foreign key que determina su relación con otra tabla lock_up.
Para decidir si un campo de datos es un atributo o un hecho se analiza la variación de la medida a través del tiempo. Si varía continuamente implicaría tomarlo como un hecho, caso contrario será un atributo.
Los
atributos dimensionales son un rol determinante en un DDW. Ellos son
la fuente de todas las necesidades que debieran cubrirse. Esto
significa que la base de datos será tan buena como lo sean los
atributos dimensionales, mientras más descriptivos, manejables
y de buena calidad, mejor será el DDW.