1. 拓扑图早就有了, 在公司规划讨论会上经过多次修改已经取得了一致的意见,不过详细的图是公司财富, 不能外漏. 粗略的图可能讲不太清楚, 因
为考虑到不能和公司的版本有明显重复, 有机会讨论的时候再讲,而且我还不知道这个群怎么发图. CIF、MD当然使用成熟思想了,自己研究出路的话,
等于本来可以站在别人肩膀人看更远的,结果你想自己跳起来看更远,当然不够好,也不够现实了。
混合架构其实没有象Inmon,Kimball那样的明显定义, 只是现实项目中潜移默化地使用这个架构越来越多, 只是没有足够总结和归纳. 从一开
始来看,他们要么选择Inmon方案, 要么是Kimball方案, 但当需求满足不了后, 自然会想到一些补充方案来补充原来的不足, 比如
Inmon派的项目在几年之后可能潜移默化地将MD数据仓库化,同时企业统一维度模型化, 就用了Kimball派的思想. 反之, 当Kimball
派项目早期MD模型不够完善, 后来几年客户不但需要企业级细节数据查询需求,而且MD模型后期无法承受, 就会考虑EDW建设起来, 并支持MD的架
构重组. IBM公司是一直坚持混合架构的派系(和我说的这个不同,他们建议架构组件都同时上,而我的想法是架构升级到虚拟化,逐步实现,毕竟多数公司
现实情况不允许这样), 只是还未形成那么明显的理论.
2. 松偶合是指组件之间的相对独立性,他们的功能不同、不重复、各自完成自己分工。很多BIer喜欢灵活性架构,想怎么建就怎么建,到最后架构会怎
样?因为架构是管理方案,后来当然是没法管理了。ODS根据其模型特点:业务系统模型一致,那么可以充分做各种和业务系统相关的事情,并做一定的清洗并
为DW服务,也能EDI工作。EDW功能属于较长期的考虑,模型方面虽然设计方法接近ODS,当并不等于ODS,EDW需要行业标准化,也就是说你的模
型不符合行业标准,那么这个EDW就失去了基础架构的作用,迟早要做大修改,基础就跨掉了。CDW需要考虑企业统一维度,标准度量,但要考虑到数据集市
那边部门级个性化需求,于是辅助架构成为必然,有稳定的多维架构体系,才能更好为DM服务。DM属于面向最终使用的需求,于是模型会更多样性、维需求、
度量可能在不同部门之间有很多不同、退化维的产生、星型模型标准、为了满足效率,还需要汇总、建宽表等动作。是不是符合SOA精神,在建设更合理后,自
己就能体会到。如果很多朋友说我的各个组件的模型设计方案可以根据需求而随意变化,比如他想在CDW不统一维度建模,或者没有辅助架构体系,或者在
CDW就有大量汇总模型,那么当过多模型重复、功能不明确,1、2年就会陷入自己不标准的麻烦。至于其中很多细节,当然得自己去思考了。
3。紧偶合的定义很简单,内部模型之间功能标准化,不能随便变,上面提到过了。其次有的组件内部也需要分层或分域才方便管理,比如CDW的辅助模型最好
独立分一个域管理,这样既方便管理也方便以模型技术去思考。但辅助模型在统一维度模型里有关键作用,它是决定多维模型适应变化能力且是否坚固的关键因素
之一,他们和主题模型,维表、事实表紧密关联,当维定义和维组织层次变化时,是辅助模型去管理,而不是靠维表象变化维那样自己管理。总之,这里的辅助模
型不能和主题模型独立开来,因为一分开两者在整体看来,就什么都不是了,所以我说属于紧偶合,而四大组件之间可以独立分开地建设。
4. 如果说架构是立体的管理方案,那么行业模型属于平面的,以描述业务为主题的模型。无论是Teradata为代表的EDW模型,还是
Oracle,Sybase为代表的多维模型,他们都是面向主题的,这样才符合数据仓库定义嘛。至于他们是否跨不同组件,要看你的架构怎么设计。比如多
维的行业模型,如果你直接拿来用,你可以把行业模型直接拿来做CDW,甚至一个主题的话,数据集市也集成在这里。但当你有需求建统一的维度模型,有更多
主题需要建设,那么你的行业模型肯定不是万能的,需要扩展,于是行业模型需要经过一段时间认识到其业务本质后,分别分散到CDW和DM,根据多年总结出
来的CDW、DM的功能划分,将他们不同模型块按照他们的功能,分别放到CDW和DM,但别忘了模型的扩展哦,特别是我看了他们的辅助架构,明显不能满
足企业高速发展多变的需求,之后重新ETL并形成新的技术元数据(所以ETL工具还是很有优势,长远来看,手工编写ETL会遇到架构重组、模型变化等多
种元数据管理问题,较难管理)。