En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de categorías descriptivas (dimensiones) y valores cuantitativos (medidas). El modelo de datos multidimensional simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos significativos.
Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas incluirían: tiempo, región, producto, canal, organización y escenario (planeado o real). Las medidas típicas incluirían: ventas en dólares (u otra moneda), unidades vendidas, número de personas, ingresos y gastos.
Aunque en ocasiones se utilizan indistintamente, los términos almacén de datos y proceso analítico en línea (OLAP, Online Analytical Processing) se aplican a diferentes componentes de sistemas conocidos como sistemas de ayuda a la toma de decisiones o sistemas de inteligencia empresarial. Los componentes de estos tipos de sistemas incluyen bases de datos y aplicaciones que proporcionan las herramientas que necesitan los analistas para tomar decisiones en relación con el soporte técnico de la organización.
Un almacén de datos es una base de datos que contiene la información que, normalmente, representa el historial empresarial de una organización. Estos datos históricos se utilizan para realizar análisis que apoyen las decisiones empresariales a diferentes niveles, desde el diseño estratégico a la evaluación del rendimiento de una unidad determinada de la organización. Los datos contenidos en un almacén de datos se encuentran organizados para permitir el análisis más que para procesar transacciones en tiempo real como ocurre en los sistemas de proceso de transacciones en línea (OLTP, Online Transaction Processing).
La tecnología OLAP permite un uso más eficaz de los almacenes de datos para el análisis en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas. Los modelos de datos multidimensionales de OLAP y las técnicas de agregados de datos organizan y resumen grandes cantidades de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas. La respuesta a una consulta realizada sobre datos históricos a menudo suele conducir a consultas posteriores en las que el analista busca respuestas más concretas o explora posibilidades. Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias para dar apoyo al analista en tiempo real.
Cabe indicar que la Tecnología OLAP tiene como base el proceso de transacciones en línea (OLTP). A continuación veremos una breve definición del concepto OLTP y sus diferencias marcadas con la tecnología OLAP que desarrollaremos en el curso.
FUENTE
http://www.eumed.net/libros-gratis/2009c/574/INTRODUCCION%20A%20LA%20TECNOLOGIA%20OLAP.htm
Investigue sobre conceptos básicos sobre tecnología OLAP.Fecha de entrega 13 11 2012
--
OLAP
OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una soluciónutilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar laconsulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) quecontienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes denegocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.
En resumen es nuestro almacen de datos final donde tendremos toda la información a analizar y evaluar, para llegara este punto debimos haber extraido, transformado, homogenizado, depurado y cargada la información.
Cuando se tiene ya finalmente el Almacen de Datos Listo podemos pensar en opciones para evaluar y analizar lainformación, ¿que se puede hacer ahi?
1.- Se pueden emplear diseñadores de Reportes (Cognos, Crystal Reports, Artus etc)
2.- Se puede diseñar un sistema para consultas en alguna plataforma (.Net, Java, LAMP)
3.- Se puede incluso consultar con una hoja de calculo empleando Pivots
4.- Se puede diseñar un Dashboard o tablon de indicadores con semaforos y tacometros
Lo importante antes de iniciar un proceso de este tipo es que se tenga en mente el objetivo de dicho proceso, yaque es comun que por las modas muchos directores o gerentes se dejen convencer de algun producto que ofrescarealizar todo esto pero si no se sabe el uso final de la información muchas veces quedan perdidos o en el peor casodecepcionados.
¿QUÉ ES OLAP?
OLAP simboliza On-Line Analytical Processing (Procesamiento Analítico en Línea). A diferencia del conocido OLTP(On-Line Transaction Processing - Procesamiento Transaccional en Línea), OLAP describe una clase de tecnologíasdiseñadas para mantener específicamente el análisis y acceso a datos. Mientras el procesamiento transaccionalgeneralmente confía solamente en las bases de datos relacionales, OLAP viene a ser un sinónimo con vistasmultidimensionales de los datos del negocio. Estas vistas multidimensionales se apoyan en la tecnología de bases dedatos multidimensionales. Estas vistas multidimensionales proporcionan la base técnica para cálculos y análisisrequeridos por las Aplicaciones del Negocio Inteligente.Concepto de OLAP
Significa "Procesamiento analítico en línea". OLAP permite a los usuarios analizar la información de base de datosde los sistemas de base de datos de múltiples al mismo tiempo. Mientras que las bases de datos relacionales seconsideran dos dimensiones, OLAP datos es multidimensional, es decir, la información puede ser comparada de muchasmaneras diferentes. Por ejemplo, una empresa puede comparar sus ventas de ordenadores en junio, con ventas enjulio, y luego comparar los resultados con las ventas de otro lugar, lo que puede ser almacenada en una base dedatos diferente.
Con el fin de procesar la información de base de datos con OLAP, un servidor OLAP está obligado a organizar ycomparar la información. Los clientes pueden analizar diferentes conjuntos de datos utilizando las funcionesintegradas en el servidor OLAP. Algunos populares programas de software OLAP servidor incluyen Oracle ExpressServer e Hyperion Essbase Solutions. Debido a sus potentes capacidades de análisis de datos, el procesamiento OLAPse utiliza a menudo para la minería de datos, que tiene como objetivo descubrir nuevas relaciones entre losdiferentes conjuntos de datos.
Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveiendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas.
La definición del cubo, es el primero de tres pasos en la creación de un cubo. Los otros pasos son, el especificar la estrategia de sumarización diseñando las agregaciones (elementos precalculados de datos), y la carga del cubo para procesarlo. Para definir un cubo, seleccione una tabla objetivo y seleccione las medidas (columnas numéricas de interés a los usuarios del cubo) dentro de esta tabla. Entonces seleccione las dimensiones, cada compuesta de una o mas columnas de otra tabla. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.
Dimensiones
Las Dimensiones son categorías descriptivas por los cuales los datos numéricos (Las Mediciones) en un cubo, son separados para su análisis. Por ejemplo, si una medición de un cubo es el conteo de la producción, y las dimensiones son Tiempo, localización de la fábrica y el producto, los usuarios del cubo, podrán separar el conteo de la producción, dentro de varias categorías de tiempo, localización de la fábrica y productos.
Una dimensión puede ser creada para usarse en un cubo individual o en múltiples cubos. Una dimensión creada para un cubo individual, es llamada dimensión privada. Por el contrario si esta puede ser usada por múltiples cubos, se le llama dimensión compartida. Estas podrán ser usadas dentro de todo cubo, en la base de datos, así se optimiza el tiempo y se evita el andar duplicando dimensiones privadas.
Las dimensiones compartidas, también habilitan la estandarización de las métricas de negocios entre cubos. Por ejemplo, el estandarizar las dimensiones compartidas para el tiempo y localización geográfica, aseguran que los datos analizados, desde diferentes cubos, estén organizados similarmente.
Medidas
Las Medidas, son datos numéricos de interés primario para los usuarios del cubo. Algunas medidas comunes son Ventas en unidades, ventasen pesos, costo de ventas, gastos, conteo de la producción, presupuesto, etc. Estas son usadas por el procedimiento de agregación de los servicios de OLAP y almacenadas para su rápida respuesta a las peticiones de los usuarios.
Se puede crear una medida calculada y calcular mienbros de dimensiones, combinando expresiones multidimensionales ( MDX ), fórmulas matemáticas y funciones definidas por el usuario (UDFs). Esta facilidad, habilita a usted a definir nuevas medidas y miembros de dimensión, basados sobre una sintaxis de fórmulas sencillas. Se pueden registrar adicionales bibliotecas de UDFs, para utilizarse en la definición de miembros calculados.
Propiedades de Miembros
Usted puede definir propiedades para los miembros de dimensión y usar datos para estas propiedades dentro de un cubo. Por ejemplo, si los miembros de la dimensión producto son sus número de partes, es lo mismo hacer varias propiedades asociadas con este número de parte tales como, el tamaño, color, etc. Usted puede especificar tales propiedades, como una propiedad miembro y utilizarla en las búsquedas analíticas.
Cubos Virtuales
Usted puede juntar cubos, dentro de cubos virtuales, muy parecido al proceso de juntar tablas con vistas en las bases de datos relacionales. Un cubo virtual, provee acceso a los datos en los cubos combinados, si la necesidad de construir un nuevo cubo, mientras permite que se mantenga en mejor diseño en cada cubo individual.
Un cubo podrá ser actualizado, procesando solo los datos que han sido añadidos, en vez de hacerlo con el cubo entero, se puede usar la actualización incremental para actualizar un cubo mientras se este usando.
Agregaciones
Así se le llama al proceso de precalcular sumas de datos, para ayudar a disminuir los tiempos de respuestas, en los procesos de búsquedas de información.
Seguridad
Usando las facilidades de seguridad manejadas por Microsoft SQL Server OLAP services, usted puede controlar quien accesa los datos y los tipos de operaciones que los usuarios pueden ejecutar con los datos. OLAP services soporta el sistema de seguridad integrado que ofrece el sistema operativo Windows NT y permite que usted asigne permisos de acceso, a la base de datos y al cubo incluyendo a los cubos virtuales.
La seguridad es manejada via los derechos de control de acceso que son manejados por los Roles, estos determinan el tipo de acceso a los datos. Los Roles definen, categorías de usuarios con los mismos controles de acceso.
Modos de Almacenaje
Para los cubos, se ofrece tres formas de almacenar su información:
1.- MOLAP - Multidimensional OLAP.
2.- ROLAP - Relacional OLAP.
3.- HOLAP - OLAP híbrido.
MOLAP
Los datos fuente del cubo son almacenados junto con sus agregaciones (sumarizaciones) en una estructura multidimensional de alto rendimiento. El almacenaje de MOLAP, provee excelente rendimiento y compresión de datos. Como se dice, todo va en el cubo.
Tiene el mejor tiempo de respuesta, dependiendo solo en el porcentaje y diseño de las agregaciones del cubo. En general este método, es muy apropiado para cubos con uso frecuente por su rápida respuesta.
ROLAP
Toda la información del cubo, sus datos, su agregación, sumas etc., son almacenados en una base de datos relacional. ROLAP no almacena copia de la base de datos, accesa las tablas originales cuando necesita responder a preguntas, es generalmente, mucho mas lenta que las otras dos estrategias de almacenaje.
Típicamente ROLAP se usa, para largos conjuntos de datos que no son frecuentemente buscados, tales como datos históricos de de los años mas recientes.
HOLAP
HOLAP combina atributos de MOLAP y ROLAP, la agregación de datos es almacenada en una estructura multidimensional usada por MOLAP, y la base de datos fuentes, en una base de datos relacional. Para procedimientos de búsqueda que accesan datos sumarizados, HOLAP es equivalente a MOLAP, por el contrario si estos procesos accesaran datos fuentes como los drill down, estos deben de buscar los datos en la base de datos relacional y esto no es tan rápido comparado a si los datos estuvieran almacenados en una estructura MOLAP.
Los cubos almacenados en como HOLAP, son mas pequeños que los MOLAP y responden mas rápidos que los ROLAP.
http://www.gestiopolis.com/canales8/ger/olap-online-analytic-processing.htm
Tecnología OLAP
El término OLAP, que proviene de Online Analitical Processing (Procesamiento Analítico en Línea), define a una tecnología que se basa en el análisis multidimensional de los datos y que le permite al usuario tener una visión más rápida e interactiva de los mismos.
Este análisis, también conocido como análisis del hipercubo, organiza la información según los parámetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendrá la información requerida.
Es muy utilizado en el área de marketing, ventas, informes, etc., especialmente porque las respuestas a consultas complejas se obtienen muy rápidamente y además porque puede obtener los datos tanto de una fuente externa como de una base interna.Hay diversos tipos de implementaciones de la tecnología OLAP, las que varían según el tipo de motor en el que se almacenan los datos. De esta manera, podemos clasificarlas como ROLAP, que almacena los datos en un motor relacional por lo que se puede tener un acceso veloz a ellos; MOLAP, que almacena los datos en una base de datos multidimensional y DOLAP, que guarda los datos en el escritorio, los que obtiene a partir de una base de datos relacional.[1]
Los cubos son elementos claves en OLAP (online analytic processing), una tecnología que provee rápido acceso a datos en un almacén de datos (data warehouse). Los cubos proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda.
Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas.
La definición del cubo, es el primero de tres pasos en la creación de un cubo. Los otros pasos son, el especificar la estrategia de sumarización diseñando las agregaciones (elementos precalculados de datos), y la carga del cubo para procesarlo. Para definir un cubo, seleccione una tabla objetivo y seleccione las medidas (columnas numéricas de interés a los usuarios del cubo) dentro de esta tabla. Entonces seleccione las dimensiones, cada compuesta de una o mas columnas de otra tabla. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.
Dimensiones
Las Dimensiones son categorías descriptivas por los cuales los datos numéricos (Las Mediciones) en un cubo, son separados para su análisis. Por ejemplo, si una medición de un cubo es el conteo de la producción, y las dimensiones son Tiempo, localización de la fábrica y el producto, los usuarios del cubo, podrán separar el conteo de la producción, dentro de varias categorías de tiempo, localización de la fábrica y productos. [2]
Fuentes:
[1] http://www.mastermagazine.info/termino/6841.php
[2] http://www.gestiopolis.com/canales8/ger/olap-online-analytic-processing.htm
Tecnología OLAP
Los sistemas OLAP son una de las herramientas más utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento analítico de la información de manera online.
Con el paso de los años y el avance de las tecnologías informáticas al servicio de las empresas, que han logrado convertirse en la solución adecuada para la realización de negocios inteligentes, la herramienta OLAP ha dado lugar al nacimiento de diversos sistemas basados en su arquitectura que pueden ofrecer respuestas a las necesidades de las distintas compañías.
De acuerdo a su forma de funcionamiento y a su estructura, los sistemas OLAP han sido clasificados en distintas categorías, tales como ROLAP, MOLAP, HOLAP, WOLAP, DOLAP, RTOLAP y SOLAP.
Esto se debe a que la distintas aplicaciones en las que se ha utilizado el sistema OLAP requieren de servicios y funcionalidades precisas y concretas para tareas puntuales, relacionadas a determinadas compañías.
Distintos tipos de sistemas OLAP
ROLAP : Siglas que sintetizan su función de procesamiento analítico relacional online, es básicamente un sistema que ha sido construido utilizando las herramientas del OLAP y una base de datos relacional clásica.
Entre las grandes ventajas que ofrece el ROLAP, podemos mencionar que dicha herramienta es una de las más escalables en cuanto al manejo de importantes cantidades de información, además de que al permitir que los usuarios realicen los ajustes necesarios del código ETL según sus requerimientos, logra un tiempo de carga menor que otros métodos basados en OLAP.
Otra de las importantes ventajas de ROLAP reside en que cualquier usuario puede acceder fácilmente a la información que contiene la base de datos relacional, utilizando herramientas diseñadas para la creación de informes SQL, sin necesidad de requerir de aplicaciones del tipo OLAP.
Es por ello, que muchas compañías han decidido implementar el sistema ROLAP, ya que al introducir dicha herramienta, gracias a la flexibilidad que ofrece, han podido incorporar la información existente en la base de datos relacional de ROLAP sin inconvenientes.
Referencias
6.1 Conceptos de tecnología OLAP.
· Objetivos de las bases de datos OLAP.
· Tipos de tecnología OLAP (ROLAP,MOLAP,HOLAP)
· Conceptos Clave en OLAP (Dimensiones, Hechos,etc...) [1]
Los cubos, las dimensiones y las jerarquías son la esencia de la navegación multidimensional del OLAP. Al describir y representar la información en esta forma, los usuarios pueden navegar intuitivamente en un conjunto complejo de datos. Sin embargo, el solo describir el modelo de datos en una forma más intuitiva, hace muy poco para ayudar a entregar la información al usuario más rápidamente.
Un principio clave del OLAP es que los usuarios
deberían obtener tiempos de respuesta consistentes para cada vista de datos que
requieran. Dado que la información se colecta en el nivel de detalle solamente,
el resumen de la información es usualmente calculado por adelantado. Estos
valores precalculados son la base de las ganancias de desempeño del OLAP.
En los primeros días de la tecnología OLAP, la
mayoría de las compañías asumía que la única solución para una aplicación OLAP
era un modelo de almacenamiento no relacional. Después, otras compañías
descubrieron que a través del uso de estructuras de base de datos (esquemas de
estrella y de copo de nieve), índices y el almacenamiento de agregados, se
podrían utilizar sistemas de administración de bases de datos relacionales
(RDBMS) para el OLAP.
Estos vendedores llamaron a esta tecnología OLAP
relacional (ROLAP). Las primeras compañías adoptaron entonces el término OLAP
multidimensional (MOLAP), estos conceptos, MOLAP y ROLAP, se explican con más
detalle en los siguientes párrafos. Las implementaciones MOLAP normalmente se
desempeñan mejor que la tecnología ROLAP, pero tienen problemas de
escalabilidad. Por otro lado, las implementaciones ROLAP son más escalables y
son frecuentemente atractivas a los clientes debido a que aprovechan las
inversiones en tecnologías de bases de datos relacionales preexistentes.
Sistemas MOLAP
La arquitectura MOLAP usa unas bases de datos
multidimensionales para proporcionar el análisis, su principal premisa es que
el OLAP está mejor implantado almacenando los datos multidimensionalmente. Por
el contrario, la arquitectura ROLAP cree que las capacidades OLAP están
perfectamente implantadas sobre bases de datos relacionales Un sistema MOLAP
usa una base de datos propietaria multidimensional, en la que la información se
almacena multidimensionalmente, para ser visualizada en varias dimensiones de
análisis.
El sistema MOLAP utiliza una arquitectura de dos
niveles: la bases de datos multidimensionales y el motor analítico. La base de
datos multidimensional es la encargada del manejo, acceso y obtención del dato.
El nivel de aplicación es el responsable de la
ejecución de los requerimientos OLAP. El nivel de presentación se integra con
el de aplicación y proporciona un interfaz a través del cual los usuarios
finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite
a varios usuarios acceder a la misma base de datos multidimensional.
La información procedente de los sistemas
operacionales, se carga en el sistema MOLAP, mediante una serie de rutinas por
lotes. Una vez cargado el dato elemental en la Base de Datos multidimensional
(MDDB), se realizan una serie de cálculos por lotes, para calcular los datos
agregados, a través de las dimensiones de negocio, rellenando la estructura
MDDB.
Tras rellenar esta estructura, se generan unos
índices y algoritmos de tablas hash para mejorar los tiempos de accesos a las
consultas. Una vez que el proceso de compilación se ha acabado, la MDDB está
lista para su uso. Los usuarios solicitan informes a través de la interfase, y
la lógica de aplicación de la MDDB obtiene el dato.
La arquitectura MOLAP requiere unos cálculos
intensivos de compilación. Lee de datos precompilados, y tiene capacidades
limitadas de crear agregaciones dinámicamente o de hallar ratios que no se
hayan precalculados y almacenados previamente.
Sistemas ROLAP
La arquitectura ROLAP, accede a los datos
almacenados en un datawarehouse para proporcionar los análisis OLAP. La premisa
de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las
bases de datos relacionales.
El sistema ROLAP utiliza una arquitectura de
tres niveles. La base de datos relacional maneja los requerimientos de
almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analítica.
El nivel de base de datos usa bases de datos relacionales para el manejo,
acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las
consultas multidimensionales de los usuarios.
El motor ROLAP se integra con niveles de presentación,
a través de los cuáles los usuarios realizan los análisis OLAP. Después de que
el modelo de datos para el datawarehouse se ha definido, los datos se cargan
desde el sistema operacional. Se ejecutan rutinas de bases de datos para
agregar el dato, si así es requerido por el modelos de datos. Se crean entonces
los índices para optimizar los tiempos de acceso a las consultas.
Los usuarios finales ejecutan sus análisis
multidimensionales, a través del motor ROLAP, que transforma dinámicamente sus
consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de
datos relacionales, y sus resultados se relacionan mediante tablas cruzadas y
conjuntos multidimensionales para devolver los resultados a los usuarios.
La arquitectura ROLAP es capaz de usar datos
precalculados si estos están disponibles, o de generar dinámicamente los
resultados desde los datos elementales si es preciso. Esta arquitectura accede
directamente a los datos del datawarehouse, y soporta técnicas de optimización
de accesos para acelerar las consultas. Estas optimizaciones son, entre otras,
particionado de los datos a nivel de aplicación, soporte a la desnormalización
y joins múltiples.
Sistemas MOLAP
Un desarrollo un poco más reciente ha sido la
solución OLAP híbrida (HOLAP), la cual combina las arquitecturas ROLAP y MOLAP
para brindar una solución con las mejores características de ambas: desempeño
superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de
detalle (los volúmenes más grandes) en la base de datos relacional, mientras
que mantiene las agregaciones en un almacén MOLAP separado.
Fuente
[1]http://www.stratebi.es/workshops/docs/3_analisis_multidimensional_visores_olap.pdf
[2]http://topiavandebasedatos.wikispaces.com/1.2.1+Definici%C3%B3n+y+conceptos+de+las+BDM.