6 Procesamiento Analítico en Línea. OLAP. 6.1 Conceptos de tecnología OLAP.

885 views
Skip to first unread message

Administrador Grupo

unread,
Nov 12, 2012, 10:08:41 AM11/12/12
to itecnodgo_nint...@googlegroups.com
Investigue sobre conceptos básicos sobre tecnología OLAP.

Fecha de entrega 13 11 2012

deyci Rutiaga

unread,
Nov 12, 2012, 11:36:22 AM11/12/12
to itecnodgo_nint...@googlegroups.com
TECNOLOGÍA OLAP

En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de categorías descriptivas (dimensiones) y valores cuantitativos (medidas). El modelo de datos multidimensional simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos significativos.

Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas incluirían: tiempo, región, producto, canal, organización y escenario (planeado o real). Las medidas típicas incluirían: ventas en dólares (u otra moneda), unidades vendidas, número de personas, ingresos y gastos.

Aunque en ocasiones se utilizan indistintamente, los términos almacén de datos y proceso analítico en línea (OLAP, Online Analytical Processing) se aplican a diferentes componentes de sistemas conocidos como sistemas de ayuda a la toma de decisiones o sistemas de inteligencia empresarial. Los componentes de estos tipos de sistemas incluyen bases de datos y aplicaciones que proporcionan las herramientas que necesitan los analistas para tomar decisiones en relación con el soporte técnico de la organización.

Un almacén de datos es una base de datos que contiene la información que, normalmente, representa el historial empresarial de una organización. Estos datos históricos se utilizan para realizar análisis que apoyen las decisiones empresariales a diferentes niveles, desde el diseño estratégico a la evaluación del rendimiento de una unidad determinada de la organización. Los datos contenidos en un almacén de datos se encuentran organizados para permitir el análisis más que para procesar transacciones en tiempo real como ocurre en los sistemas de proceso de transacciones en línea (OLTP, Online Transaction Processing).

La tecnología OLAP permite un uso más eficaz de los almacenes de datos para el análisis en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas. Los modelos de datos multidimensionales de OLAP y las técnicas de agregados de datos organizan y resumen grandes cantidades de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas. La respuesta a una consulta realizada sobre datos históricos a menudo suele conducir a consultas posteriores en las que el analista busca respuestas más concretas o explora posibilidades. Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias para dar apoyo al analista en tiempo real.

Cabe indicar que la Tecnología OLAP tiene como base el proceso de transacciones en línea (OLTP). A continuación veremos una breve definición del concepto OLTP y sus diferencias marcadas con la tecnología OLAP que desarrollaremos en el curso.

FUENTE

http://www.eumed.net/libros-gratis/2009c/574/INTRODUCCION%20A%20LA%20TECNOLOGIA%20OLAP.htm



El 12 de noviembre de 2012 09:08, Administrador Grupo <joseramo...@gmail.com> escribió:
Investigue sobre conceptos básicos sobre tecnología OLAP.

Fecha de entrega 13 11 2012

--
 
 

francisco.gonzalez.cassio

unread,
Nov 12, 2012, 10:00:26 PM11/12/12
to itecnodgo_nint...@googlegroups.com
OLAP

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución
utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la
consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de
negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.
 
En resumen es nuestro almacen de datos final donde tendremos toda la información a analizar y evaluar, para llegar
a este punto debimos haber extraido, transformado, homogenizado, depurado y cargada la información.
 
Cuando se tiene ya finalmente el Almacen de Datos Listo podemos pensar en opciones para evaluar y analizar la
información, ¿que se puede hacer ahi?
 
1.- Se pueden emplear diseñadores de Reportes (Cognos, Crystal Reports, Artus etc)
2.- Se puede diseñar un sistema para consultas en alguna plataforma (.Net, Java, LAMP)
3.- Se puede incluso consultar con una hoja de calculo empleando Pivots
4.- Se puede diseñar un Dashboard o tablon de indicadores con semaforos y tacometros
 
Lo importante antes de iniciar un proceso de este tipo es que se tenga en mente el objetivo de dicho proceso, ya
que es comun que por las modas muchos directores o gerentes se dejen convencer de algun producto que ofresca
realizar todo esto pero si no se sabe el uso final de la información muchas veces quedan perdidos o en el peor caso
decepcionados.

¿QUÉ ES OLAP?
 
OLAP simboliza On-Line Analytical Processing (Procesamiento Analítico en Línea). A diferencia del conocido OLTP
(On-Line Transaction Processing - Procesamiento Transaccional en Línea), OLAP describe una clase de tecnologías
diseñadas para mantener específicamente el análisis y acceso a datos. Mientras el procesamiento transaccional
generalmente confía solamente en las bases de datos relacionales, OLAP viene a ser un sinónimo con vistas
multidimensionales de los datos del negocio. Estas vistas multidimensionales se apoyan en la tecnología de bases de
datos multidimensionales. Estas vistas multidimensionales proporcionan la base técnica para cálculos y análisis
requeridos por las Aplicaciones del Negocio Inteligente.
Concepto de OLAP

Significa "Procesamiento analítico en línea". OLAP permite a los usuarios analizar la información de base de datos
de los sistemas de base de datos de múltiples al mismo tiempo. Mientras que las bases de datos relacionales se
consideran dos dimensiones, OLAP datos es multidimensional, es decir, la información puede ser comparada de muchas
maneras diferentes. Por ejemplo, una empresa puede comparar sus ventas de ordenadores en junio, con ventas en
julio, y luego comparar los resultados con las ventas de otro lugar, lo que puede ser almacenada en una base de
datos diferente.
 
Con el fin de procesar la información de base de datos con OLAP, un servidor OLAP está obligado a organizar y
comparar la información. Los clientes pueden analizar diferentes conjuntos de datos utilizando las funciones
integradas en el servidor OLAP. Algunos populares programas de software OLAP servidor incluyen Oracle Express
Server e Hyperion Essbase Solutions. Debido a sus potentes capacidades de análisis de datos, el procesamiento OLAP
se utiliza a menudo para la minería de datos, que tiene como objetivo descubrir nuevas relaciones entre los
diferentes conjuntos de datos.

Eduardo Sanchez

unread,
Nov 13, 2012, 10:12:46 AM11/13/12
to itecnodgo_nint...@googlegroups.com
¿Qué es OLAP?

• OLAP (Online Analytical Processing)

• OLAP es una tecnología que procesa información de una bodega de datos en estructuras multidimensionales que proporcionan una respuesta rápida a consultas complejas.
• El objetivo de OLAP es resumir y organizar grandes cantidades de datos para ser analizados y evaluados rápidamente.
 
OLAP simboliza On−Line Analytical Processing (Procesamiento Analítico en Línea). A diferencia del
conocido OLTP (On−Line Transaction Processing − Procesamiento Transaccional en Línea), OLAP describe
una clase de tecnologías diseñadas para mantener específicamente el análisis y acceso a datos. Mientras el
procesamiento transaccional generalmente confía solamente en las bases de datos relacionales, OLAP viene a
ser un sinónimo con vistas multidimensionales de los datos del negocio. Estas vistas multidimensionales se
apoyan en la tecnología de bases de datos multidimensionales. Estas vistas multidimensionales proporcionan
la base técnica para cálculos y análisis requeridos por las Aplicaciones del Negocio Inteligente.
Tener un RDBMS no significa tener el nirvana inmediato para el soporte de decisiones. Al permitir que los
RDBMS estuvieran cerca de los usuarios, nunca se pensaba que los RDBMS proporcionaban funciones
poderosas para síntesis, análisis y consolidación de datos (funciones colectivamente conocidas como análisis
de datos multidimensional).

− E. F. Codd, Computerworld

José de Jesús Santes Palacios

unread,
Nov 13, 2012, 11:47:38 AM11/13/12
to itecnodgo_nint...@googlegroups.com
Conceptos básicos de tecnología OLAP.

OLAP (Online Analitical Processing) desarrollan un análisis multidimensional (también denominado análisis del hipercubo) de los datos, que consiste en organizar la información según los parámetros que la alta dirección considere oportunos para darles un sentido y llevar a cabo el análisis de los mismos. Los datos que maneja esta técnica son importados tanto de fuentes externas como de las bases de datos productivas de la empresa. Estas bases de datos productivas son alimentadas por los llamados sistemas OLTP (Online Transactional Processing), entendiendo como tales el concepto tradicional que manejamos de bases de datos relacionales con las que las distintas unidades empresariales van trabajando diariamente. [1]

El término OLAP, que proviene de Online Analitical Processing (Procesamiento Analítico en Línea), define a una tecnología que se basa en el análisis multidimensional de los datos y que le permite al usuario tener una visión más rápida e interactiva de los mismos.
Este análisis, también conocido como análisis del hipercubo, organiza la información según los parámetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendrá la información requerida. [2]

Referencias:


rodolfo.cabrales.barrios

unread,
Nov 13, 2012, 12:17:05 PM11/13/12
to itecnodgo_nint...@googlegroups.com

Los cubos son elementos claves en OLAP (online analytic processing), una tecnología que provee rápido acceso a datos en un almacén de datos (data warehouse). Los cubos proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda.

Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveiendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas. 
  
La definición del cubo, es el primero de tres pasos en la creación de un cubo. Los otros pasos son, el especificar la estrategia de sumarización diseñando las agregaciones (elementos precalculados de datos), y la carga del cubo para procesarlo. Para definir un cubo, seleccione una tabla objetivo y seleccione las medidas (columnas numéricas de interés a los usuarios del cubo) dentro de esta tabla. Entonces seleccione las dimensiones, cada compuesta de una o mas columnas de otra tabla. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo. 
Dimensiones 
  
Las Dimensiones son categorías descriptivas por los cuales los datos numéricos (Las Mediciones) en un cubo, son separados para su análisis. Por ejemplo, si una medición de un cubo es el conteo de la producción, y las dimensiones son Tiempo, localización de la fábrica y el producto, los usuarios del cubo, podrán separar el conteo de la producción, dentro de varias categorías de tiempo, localización de la fábrica y productos.


Una dimensión puede ser creada para usarse en un cubo individual o en múltiples cubos. Una dimensión creada para un cubo individual, es llamada dimensión privada. Por el contrario si esta puede ser usada por múltiples cubos, se le llama dimensión compartida. Estas podrán ser usadas dentro de todo cubo, en la base de datos, así se optimiza el tiempo y se evita el andar duplicando dimensiones privadas. 

Las dimensiones compartidas, también habilitan la estandarización de las métricas de negocios entre cubos. Por ejemplo, el estandarizar las dimensiones compartidas para el tiempo y localización geográfica, aseguran que los datos analizados, desde diferentes cubos, estén organizados similarmente. 

Medidas 
  
Las Medidas, son datos numéricos de interés primario para los usuarios del cubo. Algunas medidas comunes son Ventas en unidades, ventasen pesos, costo de ventas, gastos, conteo de la producción, presupuesto, etc. Estas son usadas por el procedimiento de agregación de los servicios de OLAP y almacenadas para su rápida respuesta a las peticiones de los usuarios. 

Se puede crear una medida calculada y calcular mienbros de dimensiones, combinando expresiones multidimensionales ( MDX ), fórmulas matemáticas y funciones definidas por el usuario (UDFs). Esta facilidad, habilita a usted a definir nuevas medidas y miembros de dimensión, basados sobre una sintaxis de fórmulas sencillas. Se pueden registrar adicionales bibliotecas de UDFs, para utilizarse en la definición de miembros calculados. 

Propiedades de Miembros 

Usted puede definir propiedades para los miembros de dimensión y usar datos para estas propiedades dentro de un cubo. Por ejemplo, si los miembros de la dimensión producto son sus número de partes, es lo mismo hacer varias propiedades asociadas con este número de parte tales como, el tamaño, color, etc. Usted puede especificar tales propiedades, como una propiedad miembro y utilizarla en las búsquedas analíticas. 

Cubos Virtuales 
  
Usted puede juntar cubos, dentro de cubos virtuales, muy parecido al proceso de juntar tablas con vistas en las bases de datos relacionales. Un cubo virtual, provee acceso a los datos en los cubos combinados, si la necesidad de construir un nuevo cubo, mientras permite que se mantenga en mejor diseño en cada cubo individual. 

Un cubo podrá ser actualizado, procesando solo los datos que han sido añadidos, en vez de hacerlo con el cubo entero, se puede usar la actualización incremental para actualizar un cubo mientras se este usando. 

Agregaciones 

Así se le llama al proceso de precalcular sumas de datos, para ayudar a disminuir los tiempos de respuestas, en los procesos de búsquedas de información. 

Seguridad 

Usando las facilidades de seguridad manejadas por Microsoft SQL Server OLAP services, usted puede controlar quien accesa los datos y los tipos de operaciones que los usuarios pueden ejecutar con los datos. OLAP services soporta el sistema de seguridad integrado que ofrece el sistema operativo Windows NT y permite que usted asigne permisos de acceso, a la base de datos y al cubo incluyendo a los cubos virtuales. 
  
La seguridad es manejada via los derechos de control de acceso que son manejados por los Roles, estos determinan el tipo de acceso a los datos. Los Roles definen, categorías de usuarios con los mismos controles de acceso. 
Modos de Almacenaje 
  
Para los cubos, se ofrece tres formas de almacenar su información: 

1.- MOLAP - Multidimensional OLAP. 
2.- ROLAP - Relacional OLAP. 
3.- HOLAP - OLAP híbrido. 
  
MOLAP 
  
Los datos fuente del cubo son almacenados junto con sus agregaciones (sumarizaciones) en una estructura multidimensional de alto rendimiento. El almacenaje de MOLAP, provee excelente rendimiento y compresión de datos. Como se dice, todo va en el cubo. 
  
Tiene el mejor tiempo de respuesta, dependiendo solo en el porcentaje y diseño de las agregaciones del cubo. En general este método, es muy apropiado para cubos con uso frecuente por su rápida respuesta. 

ROLAP 
  
Toda la información del cubo, sus datos, su agregación, sumas etc., son almacenados en una base de datos relacional. ROLAP no almacena copia de la base de datos, accesa las tablas originales cuando necesita responder a preguntas, es generalmente, mucho mas lenta que las otras dos estrategias de almacenaje. 
  
Típicamente ROLAP se usa, para largos conjuntos de datos que no son frecuentemente buscados, tales como datos históricos de de los años mas recientes. 

HOLAP 
  
HOLAP combina atributos de MOLAP y ROLAP, la agregación de datos es almacenada en una estructura multidimensional usada por MOLAP, y la base de datos fuentes, en una base de datos relacional. Para procedimientos de búsqueda que accesan datos sumarizados, HOLAP es equivalente a MOLAP, por el contrario si estos procesos accesaran datos fuentes como los drill down, estos deben de buscar los datos en la base de datos relacional y esto no es tan rápido comparado a si los datos estuvieran almacenados en una estructura MOLAP. 
  
Los cubos almacenados en como HOLAP, son mas pequeños que los MOLAP y responden mas rápidos que los ROLAP.
 
http://www.gestiopolis.com/canales8/ger/olap-online-analytic-processing.htm


luis.galindo.ortega

unread,
Nov 13, 2012, 12:40:10 PM11/13/12
to itecnodgo_nint...@googlegroups.com
Conceptos Básicos sobre Tecnologia OLAP

OLAP
OLAP simboliza On-Line Analytical Processing (Procesamiento Analítico en Línea). OLAP viene a ser un sinónimo con vistas multidimensionales de los datos del negocio. Estas vistas multidimensionales se apoyan en la tecnología de bases de datos multidimensionales. Estas vistas multidimensionales proporcionan la base técnica para cálculos y análisis requeridos por las Aplicaciones del Negocio Inteligente. [1]

Bases de Datos Multidimensionales
Este tipo de base de datos se aplica sobre el sistema OLAP también llamado cubo multidimensional o hipervínculo. Se compone de hechos numéricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es creado típicamente apartar de un esquema en estrella o copo de nieve y utilizando tablas de una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones de cuadros. [2]

Cubo Multidimensional
También conocido como Cubo de Decisión, es una potente herramienta que permite distribuir las métricas y dimensiones en filas, columnas y páginas, mostrando agrupaciones de los resultados y permitiendo reorganizar la representación “en línea”. [3]

ROLAP
La implementación OLAP almacena los datos en un botón relacional llamado ROLAP los datos son detallados evitando las agregaciones y las tablas que se encuentran normalizadas, los esquemas más comunes son de estrella y copo de nieve aunque es posible de trabajar sobre cualquier base de datos relacional. La arquitectura de esta se compone de un servidor de banco de datos relacional y el botón OLAP se encuentra en el servidor dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme cantidad de datos.

MOLAP
Esta almacena los datos de una base de datos multidimensional. Para utilizar los tiempos de respuesta, hacer resúmenes de información calculados por adelantado y un sinfín de operaciones utilizadas de forma multidimensional para proporcionar el análisis su principal premisa es que OLAP esta mejor implantado almacenando los datos multidimensionales.
El sistema MOLAP utiliza una arquitectura de 2 niveles, la base de datos multidimensional y el motor analítico.

Jerarquias
Las jerarquías pueden contener muchos niveles. Por ejemplo: las ciudades se acomodan a los estados, los estados a las regiones, y así sucesivamente. Si su servidor OLAP no soportara niveles múltiples de jerarquía dentro de una dimensión, tendría que expresar ciudades, estados y regiones como dimensiones separadas en la base de datos.

Variables
Las variables son las medidas numéricas, similares a los campos valor en una base de datos relacional, como “Ventas”, “Costos”, “Precio” y afines. Algunos servidores OLAP tratan las variables como una dimensión especial

Medidas
Constituyen el que analizar y son numéricas y sumarizables a diferente nivel de detalle.

Dimensiones
Son perspectivas de análisis y determinan el como analizar a las dimensiones [4]

Bibliografia

jgerardo.felixo

unread,
Nov 13, 2012, 11:22:03 PM11/13/12
to itecnodgo_nint...@googlegroups.com

Tecnología OLAP

El término OLAP, que proviene de Online Analitical Processing (Procesamiento Analítico en Línea), define a una tecnología que se basa en el análisis multidimensional de los datos y que le permite al usuario tener una visión más rápida e interactiva de los mismos.

Este análisis, también conocido como análisis del hipercubo, organiza la información según los parámetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendrá la información requerida.


Es muy utilizado en el área de marketing, ventas, informes, etc., especialmente porque las respuestas a consultas complejas se obtienen muy rápidamente y además porque puede obtener los datos tanto de una fuente externa como de una base interna.

Hay diversos tipos de implementaciones de la tecnología OLAP, las que varían según el tipo de motor en el que se almacenan los datos. De esta manera, podemos clasificarlas como ROLAP, que almacena los datos en un motor relacional por lo que se puede tener un acceso veloz a ellos; MOLAP, que almacena los datos en una base de datos multidimensional y DOLAP, que guarda los datos en el escritorio, los que obtiene a partir de una base de datos relacional.[1]

 

Los cubos son elementos claves en OLAP (online analytic processing), una tecnología que provee rápido acceso a datos en un almacén de datos (data warehouse). Los cubos proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda.

Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas.


La definición del cubo, es el primero de tres pasos en la creación de un cubo. Los otros pasos son, el especificar la estrategia de sumarización diseñando las agregaciones (elementos precalculados de datos), y la carga del cubo para procesarlo. Para definir un cubo, seleccione una tabla objetivo y seleccione las medidas (columnas numéricas de interés a los usuarios del cubo) dentro de esta tabla. Entonces seleccione las dimensiones, cada compuesta de una o mas columnas de otra tabla. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.


Dimensiones

Las Dimensiones son categorías descriptivas por los cuales los datos numéricos (Las Mediciones) en un cubo, son separados para su análisis. Por ejemplo, si una medición de un cubo es el conteo de la producción, y las dimensiones son Tiempo, localización de la fábrica y el producto, los usuarios del cubo, podrán separar el conteo de la producción, dentro de varias categorías de tiempo, localización de la fábrica y productos.
[2]

 

Fuentes:

[1] http://www.mastermagazine.info/termino/6841.php

[2] http://www.gestiopolis.com/canales8/ger/olap-online-analytic-processing.htm

 

silvia.flores.andrade

unread,
Nov 13, 2012, 11:33:14 PM11/13/12
to itecnodgo_nint...@googlegroups.com

Tecnología OLAP

 

Los sistemas OLAP son una de las herramientas más utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento analítico de la información de manera online.

Con el paso de los años y el avance de las tecnologías informáticas al servicio de las empresas, que han logrado convertirse en la solución adecuada para la realización de negocios inteligentes, la herramienta OLAP ha dado lugar al nacimiento de diversos sistemas basados en su arquitectura que pueden ofrecer respuestas a las necesidades de las distintas compañías.

De acuerdo a su forma de funcionamiento y a su estructura, los sistemas OLAP han sido clasificados en distintas categorías, tales como ROLAP, MOLAP, HOLAP, WOLAP, DOLAP, RTOLAP y SOLAP.

Esto se debe a que la distintas aplicaciones en las que se ha utilizado el sistema OLAP requieren de servicios y funcionalidades precisas y concretas para tareas puntuales, relacionadas a determinadas compañías.

 

Distintos tipos de sistemas OLAP

ROLAP : Siglas que sintetizan su función de procesamiento analítico relacional online, es básicamente un sistema que ha sido construido utilizando las herramientas del OLAP y una base de datos relacional clásica.

Entre las grandes ventajas que ofrece el ROLAP, podemos mencionar que dicha herramienta es una de las más escalables en cuanto al manejo de importantes cantidades de información, además de que al permitir que los usuarios realicen los ajustes necesarios del código ETL según sus requerimientos, logra un tiempo de carga menor que otros métodos basados en OLAP.

 

Otra de las importantes ventajas de ROLAP reside en que cualquier usuario puede acceder fácilmente a la información que contiene la base de datos relacional, utilizando herramientas diseñadas para la creación de informes SQL, sin necesidad de requerir de aplicaciones del tipo OLAP.

 

Es por ello, que muchas compañías han decidido implementar el sistema ROLAP, ya que al introducir dicha herramienta, gracias a la flexibilidad que ofrece, han podido incorporar la información existente en la base de datos relacional de ROLAP sin inconvenientes.

 

Referencias

http://www.informatica-hoy.com.ar/informatica-tecnologia-empresas/Un-sistema-OLAP-para-cada-necesidad.php

Victor Manuel Niebla Romero

unread,
Nov 14, 2012, 2:25:56 PM11/14/12
to itecnodgo_nint...@googlegroups.com
Conceptos Básicos de OLAP

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.

La razón de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional.

La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE.
En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (también llamado cubo multidimensional o hipercubo). Se compone de hechos numéricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es típicamente creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensión de los cuadros.

Tradicionalmente, los sistemas OLAP se clasifican según las siguientes categorías:
  • ROLAP
Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme cantidad de datos.
  • MOLAP
Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.
  • HOLAP (Hybrid OLAP)
Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional.

Comparación

Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las características específicas de los beneficios entre los proveedores).
Algunas implementaciones MOLAP son propensas a la "explosión" de la base de datos; este fenómeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones: elevado número de dimensiones, resultados precalculados y escasos datos multidimensionales. Las técnicas habituales de atenuación de la explosión de la base de datos no son todo lo eficientes que sería deseable.
Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexación y a las optimizaciones de almacenamiento. MOLAP también necesita menos espacio de almacenamiento en comparación con los especializados ROLAP porque su almacenamiento especializado normalmente incluye técnicas de compresión.
ROLAP es generalmente más escalable. Sin embargo, el gran volumen de preprocesamiento es difícil de implementar eficientemente por lo que con frecuencia se omite; por tanto, el rendimiento de una consulta ROLAP puede verse afectado.
Desde la aparición de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar cálculos, las funciones especializadas que se pueden utilizar tienen más limitaciones.
HOLAP (OLAP Híbrido) engloba un conjunto de técnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible. Generalmente puede pre-procesar rápidamente, escala bien, y proporciona una buena función de apoyo.

Otros tipos
Los siguientes acrónimos a veces también se utilizan, aunque no son sistemas tan generalizados como los anteriores:
  • WOLAP o Web OLAP: OLAP basado u orientado para la web.
  • DOLAP o Desktop OLAP: OLAP de escritorio
  • RTOLAP o Real Time OLAP: OLAP en tiempo real
  • SOLAP o Spatial OLAP: OLAP espacial [1]

Referencias

jmanuelgarciaaragon

unread,
Nov 19, 2012, 4:56:39 PM11/19/12
to itecnodgo_nint...@googlegroups.com

6.1 Conceptos de tecnología OLAP.

 

·         Objetivos de las bases de datos OLAP. 

·         Tipos de tecnología OLAP (ROLAP,MOLAP,HOLAP) 

·         Conceptos Clave en OLAP (Dimensiones, Hechos,etc...) [1]

 

Los cubos, las dimensiones y las jerarquías son la esencia de la navegación multidimensional del OLAP. Al describir y representar la información en esta forma, los usuarios pueden navegar intuitivamente en un conjunto complejo de datos. Sin embargo, el solo describir el modelo de datos en una forma más intuitiva, hace muy poco para ayudar a entregar la información al usuario más rápidamente.

 

Un principio clave del OLAP es que los usuarios deberían obtener tiempos de respuesta consistentes para cada vista de datos que requieran. Dado que la información se colecta en el nivel de detalle solamente, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados son la base de las ganancias de desempeño del OLAP.
En los primeros días de la tecnología OLAP, la mayoría de las compañías asumía que la única solución para una aplicación OLAP era un modelo de almacenamiento no relacional. Después, otras compañías descubrieron que a través del uso de estructuras de base de datos (esquemas de estrella y de copo de nieve), índices y el almacenamiento de agregados, se podrían utilizar sistemas de administración de bases de datos relacionales (RDBMS) para el OLAP.
Estos vendedores llamaron a esta tecnología OLAP relacional (ROLAP). Las primeras compañías adoptaron entonces el término OLAP multidimensional (MOLAP), estos conceptos, MOLAP y ROLAP, se explican con más detalle en los siguientes párrafos. Las implementaciones MOLAP normalmente se desempeñan mejor que la tecnología ROLAP, pero tienen problemas de escalabilidad. Por otro lado, las implementaciones ROLAP son más escalables y son frecuentemente atractivas a los clientes debido a que aprovechan las inversiones en tecnologías de bases de datos relacionales preexistentes.

Sistemas MOLAP
La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el análisis, su principal premisa es que el OLAP está mejor implantado almacenando los datos multidimensionalmente. Por el contrario, la arquitectura ROLAP cree que las capacidades OLAP están perfectamente implantadas sobre bases de datos relacionales Un sistema MOLAP usa una base de datos propietaria multidimensional, en la que la información se almacena multidimensionalmente, para ser visualizada en varias dimensiones de análisis.
El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos multidimensionales y el motor analítico. La base de datos multidimensional es la encargada del manejo, acceso y obtención del dato.
El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El nivel de presentación se integra con el de aplicación y proporciona un interfaz a través del cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional.
La información procedente de los sistemas operacionales, se carga en el sistema MOLAP, mediante una serie de rutinas por lotes. Una vez cargado el dato elemental en la Base de Datos multidimensional (MDDB), se realizan una serie de cálculos por lotes, para calcular los datos agregados, a través de las dimensiones de negocio, rellenando la estructura MDDB.
Tras rellenar esta estructura, se generan unos índices y algoritmos de tablas hash para mejorar los tiempos de accesos a las consultas. Una vez que el proceso de compilación se ha acabado, la MDDB está lista para su uso. Los usuarios solicitan informes a través de la interfase, y la lógica de aplicación de la MDDB obtiene el dato.
La arquitectura MOLAP requiere unos cálculos intensivos de compilación. Lee de datos precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de hallar ratios que no se hayan precalculados y almacenados previamente.

Sistemas ROLAP
La arquitectura ROLAP, accede a los datos almacenados en un datawarehouse para proporcionar los análisis OLAP. La premisa de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales.
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analítica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las consultas multidimensionales de los usuarios.
El motor ROLAP se integra con niveles de presentación, a través de los cuáles los usuarios realizan los análisis OLAP. Después de que el modelo de datos para el datawarehouse se ha definido, los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases de datos para agregar el dato, si así es requerido por el modelos de datos. Se crean entonces los índices para optimizar los tiempos de acceso a las consultas.
Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor ROLAP, que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios.
La arquitectura ROLAP es capaz de usar datos precalculados si estos están disponibles, o de generar dinámicamente los resultados desde los datos elementales si es preciso. Esta arquitectura accede directamente a los datos del datawarehouse, y soporta técnicas de optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicación, soporte a la desnormalización y joins múltiples.

Sistemas MOLAP
Un desarrollo un poco más reciente ha sido la solución OLAP híbrida (HOLAP), la cual combina las arquitecturas ROLAP y MOLAP para brindar una solución con las mejores características de ambas: desempeño superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de detalle (los volúmenes más grandes) en la base de datos relacional, mientras que mantiene las agregaciones en un almacén MOLAP separado.

Fuente

[1]http://www.stratebi.es/workshops/docs/3_analisis_multidimensional_visores_olap.pdf

[2]http://topiavandebasedatos.wikispaces.com/1.2.1+Definici%C3%B3n+y+conceptos+de+las+BDM.

cesar.monarrez.a

unread,
Nov 23, 2012, 9:02:40 PM11/23/12
to itecnodgo_nint...@googlegroups.com

Conceptos básicos sobre tecnología OLAP

Una solución para el análisis de los datos almacenados en el DW son las técnicas OLAP Online Analytical Processing.
Es una categoría de tecnología de software que permite a los ejecutivos y analistas una vista rápida, consistente, con un acceso interactivo a una completa variedad de vistas posibles de la información que ha sido transformada de los registros de una empresa.

El objetivo de las herramientas OLAP es proveer un análisis multidimensional de la información. Para lograr esta meta, dichas herramientas emplean un modelo multidimensional para el almacenamiento y para la presentación de los datos. Los datos son almacenados en cubos que son definidos en un espacio multidimensional.

Las características de las técnicas OLAP son:
a) Recuperación rápida de datos, ya que la recuperación se puede realizar en una sola entrada y salida, los índices son pequeños, los datos se encuentran modelados en un esquema multidimensional.

b) El almacenamiento es muy eficiente, ya que los bloques sólo contienen datos y los índices son simples.

Operaciones

Las tareas de modelado en el mundo de las bases de datos, se realiza desde tres perspectivas diferentes. La conceptual, que lidia con un alto nivel de representación del mundo; la física, que lidia con los detalles de representación de la información; y la lógica que actúa como un intermediario entres los dos niveles anteriores, tratando de balancear el paradigma de almacenamiento independiente y una representación natural.

Los operadores relacionados con las técnicas OLAP son: Roll-up, Drill-down y Slice’n dice. Roll-up corresponde al acto de tomar datos y agruparlos en una dimensión, en otras palabras consiste en subir por los diferentes niveles de granularidad que presentan las dimensiones. Drill-down es exactamente la operación inversa, partiendo de un nivel de granularidad alto, esta operación se encarga de bajar de nivel. Y por último, Slice’n dice corresponde en reducir las dimensiones de los datos, es decir, tomando un subconjunto de dimensiones seleccionadas de todo el DW.

Técnicas existentes

Una posible arquitectura de implementación para las técnicas OLAP es, MOLAP (Multidimensional On-Line Analytical Processing). La ventaja de la arquitectura MOLAP, es que provee de una vista directamente multidimensional de los datos, mientras que ROLAP (Relational On-Line Analytical Processing), es sólo una interfaz multidimensional de datos relacionales. Por otro lado, la arquitectura ROLAP tiene dos ventajas: (a) puede ser fácilmente integrada en otro sistema de bases de datos relacional ya existente, y (b) los datos relacionales pueden ser almacenados más eficientemente que los datos multidimensionales.
En una arquitectura ROLAP, los datos son organizados es un esquema en estrella o copo de nieve. Un esquema en estrella consiste de una tabla central de hechos y de varias tablas de dimensiones no normalizadas. Las medidas de interés son almacenadas en la tabla de hechos. La versión normalizada del esquema en estrella es el esquema copo de nieve.

Las dimensiones proveen el contexto de información acerca de los datos que son analizados. Hablando técnicamente, las dimensiones del cubo constituyen un tramo del espacio multidimensional .
En los arreglos comunes de dimensiones de datos multidimensionales, el espacio de datos es solamente estructurado en un orden lineal de índices. En OLAP, esto no es suficiente, una dimensión no se encuentra linealmente ordenada. Jerarquías conteniendo niveles son usadas para estructurar las dimensiones. Cada nivel de jerarquía contiene distintos miembros.

Otra forma de estructurar las dimensiones desde el punto de vista del usuario es usar atributos de dimensiones. Estos atributos describen miembros de dimensiones, pero no definen jerarquías . Diferentes niveles de jerarquías pueden procesar diferentes atributos.

El contenido de una celda de un cubo multidimensional puede estar complejamente estructurada. Cada celda puede contener muchas medidas. Las aplicaciones OLAP usualmente contienen un gran número de medidas. Estas medidas no son atómicas en el sentido de que pueden ser calculadas a través de otras medidas en el cubo.
Un ambiente OLAP está también caracterizado por acceso de datos navegacional. Esto significa que el usuario formula consultas basadas en los resultados de consultas previas. [1]

Referencias Bibliograficas

Reply all
Reply to author
Forward
0 new messages