哈哈,谈了这么长时间,终于挤出一点意思来,原来说了半天,你在还讲为什么在CIF架构EDW组件和MD架构中Staging Area组件中需要一个
CDW组件?,我印象中这是IBM Insurance Information Warehouse 中提出.这个不需要再你讲了,TTNN的人基本
都清楚了,因为CDW组件的作用在IBM这么大厂商的10年的推广下已经被业绩认可了,但IBM并没有因为提出CDW组件而产生独立于2大理论性架构的
第三个理论架构,为什么呢.
说的也巧,我在SYBASE工作的时候搞数据仓库就是2个产品:SYBASE IQ和IWS,SYBASE IWS for Finance很
多情况下是写到这样的话: The CDW runs the Sybase IQ database in the IBM UNIX (AIX)
operating system environment. 当时SYBASE负责数据仓库的高手就告诉我:SYBASE IQ最适合CDW,而
TereData最适合EDW,其他RDB(当然包括SYBASE ASE)只能适合在Staging Area或者DM上.
所以对于CDW,我还是很有自己深刻的认识和想法,CDW只所以最早被IBM提出,决不是IBM因为2大架构之争为了取得平衡为起点,是因为
Data from corporate systems are extracted and loaded into the CDW on a
periodic basis depending on the system in question,也就是说IBM接了某金融机构的BI项目,
需要从该金融机构corporate systems中直接extracted and loaded到Corporate Data
Warehouse (CDW被定义了),CDW is an environment for storage and retrieval of
corporate systems data, both current and historical. The goal of the
CDW is to provide easy access to integrated, accurate, and timely
information through interfaces that facilitate querying and reporting
by end users(CDW的原始功能是什么,清楚了吧). 而SYBASE IQ为什么最适合CDW,是因为CDW的本质是希望把基础数据尽
可能的多放在CDW中,又让最终用户可以直接在CDW中快速做查询,而这种CDW组件在DW架构中近乎无理的要求(因为如果选RDB做CDW组件的数据
库,一直存在时间和空间的矛盾,既然存储数据量大又要快速查询),却由于SYBASE IQ最独立的列存储机制变的可行了.这就是CDW的起点,但当时
作为SYBASE的DW高手非常不屑IBM的做法,利用SYBASE IQ软件产品的特性,把corporate systems中的基础数据全部放在
所谓的CDW上,同时直接就在CDW出查询报表,和2大架构的经典理论不符合.
可惜,历史的真相就是因为IBM的强势被修改了,一个美丽的谎话出来了,为了弥补EDW组件和Staging Area组件,IBM搞出了CDW
组件.并把他们做的体系叫"Spoke and Hub"体系. 我真不知道发明bitewise位索引机制的那个技术人员会不会苦笑. 这几年来,随
着其他RDB都开始支持列存储,CDW组件以后可以选择更多的RDB被别人记住
原来,innovate一直非常神秘的以"混合架构"面貌出现,是为了向TTNN的人们深刻介绍CDW的组件功能呀,哎,你早说呀,我把CDW出
现的历史一讲,TTNN就深刻记住了,CDW组件就是IBM在做金融机构的DW项目时,搞了一个叫corporate Data Warehouse的
数据库,该数据库的功能是为了直接放基于四种模型的海量数据(当然以雪花,雪暴,星型,星座模型存放,这其实是IQ讲数据模型的时候最早讲的),又想直
接让最终用户做查询.一举2得.而IQ太独特了,就是一个列存储机制,完全不符合2位大师的架构模式和组件,所以为了掩盖真相,IBM就定义了CDW.
为什么呢,就是应该数据库技术的发展使符合DW的数据库逐步由传统行存储变成了列存储,这样导致海量和查询的矛盾逐渐被解决,使2大架构产生的RBD技
术矛盾(就是时间和空间矛盾)被缓解,这样现在很多的DW建设不在遵守2大架构了.因为数据库产品的技术发展了.
OK,原来innovate给我们TTNN开了一个玩笑,是为了更好的介绍CDW,看来就不是架构之争了.以后直接说,别在搞复杂的理论做帽子
了.