huangkan:
您好!非常感谢您的回复。虽然没有见过您本人,但是您离开的时候应该正是我们入司的时候,听同事介绍过您的名气,挺敬仰您的!希望将来有更多、更有价值
的问题求教于您。
在这个帖子中,我很幼稚的一点想法是:在现有的正确架构下(毕竟改变是需要时间和成本的),即便在寿险的一个现有模块内部,还是可以有更好的架构的,相
当于是集市中同主题的小摊点会很好地汇集在一块一样----这个相当于是对现在架构的一个优化,是在没有架构好实用的DW之前也可以逐步实现的,成本和时间
预计在可以接受范围内;考虑到DW成熟完全取代现有架构还有待时日,这种模块(不太标准的集市)内部的优化还是有相当明显的价值。
往回看,我很感激过往同事们(虽然大多未曾谋面)的智慧和努力,否则,像我这样的一个还不算入门的新人怎么会有机会在此"品头论足"呢!所以,我在为了
自己的开发理解方便而整理的模块架构文档封面加了一句话:"本文档是在试图理解前人智慧!"
再一次谢谢huangkan,还有Qing等其他所有为本帖出谋划策的ttnn前辈们!
Regards,
daiyan 2007-12-12
On 12月11日, 下午5时35分, huangkan <
erichuangta...@gmail.com> wrote:
> 我想我应该知道你是哪个公司。对你们来说,建立DW是一件势在必行的事情。你说的困惑其实追根溯源是由于这个问题造成的。MIS还会在相当一段时间内存在下去,-我的建议是MIS应该和DW
> Team联合起来做一些事情,其实现在MIS做的事情是在做一些DataMart,需要慢慢融入到DW体系中去。另外,题外话,首先不必求把所有业务大融合,找-到切入点,比如产险+寿险,半年前我曾经帮你们做个这个规划。
>
> On 11/24/07, raullew <
raul...@hotmail.com> wrote:
>
>
>
>
>
> > 不敢。。。
> > 我把OLAP理解为MART的一种存储和展现方式
> > MART的表结构根据需求来做(是从DW到MART还是从OLTP到MART取决于你们的DW整合进度),整理过报表需求后,MART的设计可以比较稳
> > 定,很多维度派生字段和疙瘩的统计指标在这里做掉,存在关系型数据库里
> > 一个主题的业务可能可以整合为一个MART,也许是几个事实表,多个维表
> > 然后可以从MART拖拉多个CUBE和报表,从数据源到MART的逻辑可能时常要修改(DW上线后也可能会全盘改掉),但MART的设计不用改,而从
> > MART到OLAP的逻辑会很简练
>
> > On 11月23日, 下午10时06分, daiyan <
daiyani...@gmail.com> wrote:
> > > 从你的话里,看得出来你在这方面经验丰富、理解颇深啊。
> > > 我觉得这种水平是不可能持久的,我们内部也在主动寻求突破,但绝大多数的时间和精力被复杂多变的业务需求所占用了,很难的静下心来想问题,想如何突
> > > 破。
> > > 不知道raullew在这方面有什么建议呢?
> > > Thanks
>
> > > On 11月22日, 下午10时27分, raullew <
raul...@hotmail.com> wrote:
>
> > > > 恩,主要在于面对复杂业务的应变能力
> > > > 业务对数据支持的需求高了,涉及种种不同维度指标与统计计算方法,就需要更多的数据处理过程了
>
> > > > On 11月22日, 下午10时20分, daiyan <
daiyani...@gmail.com> wrote:
>
> > > > > 逻辑上应该与你所说无明显差别,差别在于规模、复杂度和对业务的支持能力----当然,这个在本质上是由业务决定的。
>
> > > > > On 11月22日, 下午9时43分, "Delin He" <
beiji...@gmail.com> wrote:
>
> > > > > > 明白你们怎么搞的了,
>
> > 从实时备份库抽数据,ETL到OLAP数据库,然后就从这个OLAP数据库出固定报表,每天抽,每天报表不断刷新,这个玩意用了几年,报表每天也能看数据,可能---领导觉得暂时也能满足固定的报表需求。
>
> > 俺暑期是就这样搞了差不多一样的东西。我刚入职,上头要看报表,我们当时的基础为0,我就用开源工具加代码搞了这样一套东西,领导每天都能看到数据,网站的运营---情况一目了然,说"干的不错"
> > > > > > 我心里想,就着玩意,唉!我以后再也不干这样的事了
>
> > > > > > 在07-11-22,daiyan <
daiyani...@gmail.com> 写道:
>
> > > > > > > 谢谢Qing和其它几位朋友的分析。
>
> > > > > > > 可能我还需要提供更多的信息,才能获得各位更好的思想。
>
> > 目前的工作环境,是通过ETL的JOB从业务系统数据库E-T-L数据到OLAP数据库(非常庞大惊人),这个OLAP数据库不同于业务系统的数据库,
>
> > 也达不到可以称道的数据仓库的标准(在网上看一些数据仓库建设的案例,我感觉也就达到我所说OLAP数据库的水平),这些个按照大类业务(寿险、产险、
>
> > 银行、财务等)划分开的OLAP数据库,我们内部只认为是数据仓库的雏形----所以部门里成立了专门的数据仓库组开发数据仓库。目前这些个OLAP数据库
>
> > 已经支持OLAP报表多年,公司对机构和个人的考核、算佣、年报等等一切需要指标数据都以我们的OLAP报表为标准,外部监管部门和战略合作伙伴也通过
> > > > > > > 我们获得数据----这个OLAP报表系统的实用性已经在总公司层级彻底替代了其他途径,获得了用户的认可和依赖。
>
> > 另外,我们的ETL是从一个生产库的快照库取数的,没有权限直接从业务系统生产库取数,这个快照库是生产库的完全一致(只存在可以忽略的时差)的备份
>
> > 库。开发人员有专门的开发测试库以供ETL和MDL的开发测试,运营测试和用户测试(开发完毕移交运营测试,通过之后正式部署到ETL货这MDL的生产
>
> > 环境)又是另外的环境----这些环节包括独立的硬件(主机、数据库和网络等)环境和相应同构的数据库环境(开发测试环境、运营/用户测试环境和OLAP生
> > > > > > > 产环境数据库是同构的,其中,运营/用户测试环境和OLAP生产环境在硬件上都是基本同构的)。
>
> > > > > > > 从前,我们部门被称为MIS(管理信息系统),现在,被称为数据管理部(Data Management
> > Center)----内部还没有把自己称为BI
>
> > 部门,大概也是因为我们在数据分析和挖掘上的不足----所以公司专管需求规划的部门一年前开始深入评估SAS----评估在业务中的实际表现,譬如趋势预测结
> > > > > > > 果与实际情况的契合度等。
>
> > > > > > > On 11月21日, 下午2时25分, Qing <
happys...@gmail.com> wrote:
> > > > > > > > 能够刚入职不久就考虑这些问题,你是不是疯了?
>
> > 谈谈我的理解。interstage说无需划分这两种etl,我想从架构上来说,可能不需要。但通常,在组织结构上,负责DW的跟负责OLAP的人又不一样,而---且DW的ETL处理的都是数据仓库内部数据的流动,而从DW到OLAP,可能涉及到不同的技术,其数据处理职责恐怕就单独拎出来给OLAP这个小组自己折腾-。
>
> > 我想daiyan用的应该是MOLAP,是cognos吗?不过对于你说的源端是OLTP系统,这有点奇怪,你们的OLAP难道不是从数据仓库获取数据,还是从---生产系统获取?那数据仓库用来干啥的?