Gmail Calendar Documents Reader Web more »
Recently Visited Groups | Help | Sign in
Google Groups Home
Message from discussion 度量数据仓库系统的指标
The group you are posting to is a Usenet group. Messages posted to this group will make your email address visible to anyone on the Internet.
Your reply message has not been sent.
Your post was successful
 
From:
To:
Cc:
Followup To:
Add Cc | Add Followup-to | Edit Subject
Subject:
Validation:
For verification purposes please type the characters you see in the picture below or the numbers you hear by clicking the accessibility icon. Listen and type the numbers you hear
 
刘庆  
View profile   Translate to Translated (View Original)
 More options Jan 2 2006, 8:53 pm
From: 刘庆 <happys...@gmail.com>
Date: Tue, 3 Jan 2006 09:53:03 +0800
Local: Mon, Jan 2 2006 8:53 pm
Subject: 度量数据仓库系统的指标

DMReview推出一份调查结果,关于度量数据仓库和BI的成功指标<http://www.dmreview.com/article_sub.cfm?articleId=1044330>
,从四百多家公司搜集问卷反馈,整理出两类度量——产品度量和开发度量。具体如下:

产品度量
信息质量:我们通常说的数据质量,但显然信息要比数据含义更广。数据仓库应该提供精确、完整且一致的信息。
系统质量:系统架构是否优良。数据仓库应该具备灵活性、伸缩性,并且能够集成更多数据。
个体影响:系统是否优化组织个体成员的决策习惯。用户应能够快而便捷地访问数据;用新的方式来思考、提问、寻找原因;用数据仓库和BI来改善他们的决策。
组织影响:系统是否对整个组织的战略、执行决策力提高有所帮助。数据仓库和BI应该满足业务需求;便于应用BI;支持战略业务目标的实现;有助改善业务流程;促 使高回报且可量化的投资回报;并且提高组织部门之间的沟通与协作。

开发度量
开发成本:数据仓库开发和维护成本应该适当。
开发周期:开发数据仓库第一个版本的周期应当适当。

对于产品度量的四方面,有若干指标可以衡量,包括:
信息质量:
1、数据仓库支持查询和报表,无数据错误;
2、数据仓库仓库支持数据正确性分级,以用于不同目的;
3、数据仓库中的数据值能够如实反映它所描述的现实事物和事件;
4、数据仓库包括用户和应用所需所有有关业务过程和主题域的数据;
5、数据仓库中包含所有必需的决策支持数据;
6、数据仓库提供用户和应用所需所有数据;
7、数据仓库提供统一视图;
8、数据仓库减少数据不一致性;
9、数据仓库架构为决策支持数据提供唯一的记录系统(system of record);

系统质量:
1、数据仓库架构允许轻松增加新的业务过程和主题域;
2、数据仓库能够迅速满足新需求;
3、数据仓库能够轻松支持未来应用所需;
4、数据仓库架构允许增加更多的用户,而不会对系统性能带来负面影响;
5、数据仓库允许增加复杂和并发的查询,并不会降低性能;
6、数据仓库架构能够轻松地处理数据量的膨胀;
7、数据仓库能够方便地从多个系统集成数据;
8、数据仓库能够方便地集成内部和外部数据源;
9、数据仓库能够方便地集成围绕在主键周围所有需要的数据;

个体影响:
1、最终用户已经正在使用交付的数据仓库系统;
2、因为有了数据仓库,用户可以更加方便快捷地访问数据;
3、用户可以轻松并直观地理解和使用数据仓库中的数据;
4、数据仓库促进用户思考、提问以及寻找问题原因,这是以往做不到的;
5、数据仓库提高了最终用户决策能力。

组织影响:
1、数据仓库已经达到它所需要实现的业务需求;
2、数据仓库大大促进BI的应用;
3、数据仓库改善了业务流程;
4、数据仓库支持战略目标的实现;
5、数据仓库产生高回报和可度量的回报率;
6、数据仓库改善了组织部门之间的交流与协作。

 被调查者被问及他们数据仓库的架构,提供五种选择,其中采用联邦数据仓库、独立的数据集市此两种的,其产品、开发度量分值不太高,而总线架构、CIF(Hub
and Spoke)和集中式无独立数据集市架构三种的分值比较接近,因此下面给出这三种架构在开发度量上的平均值。(mil表示百万刀),如下:
                   总线架构     CIF         集成式
开发成本     1.4mil         2.4mil       1.5mil
开发周期     8.9月          11.4月       8.8月

以上大部分都是翻译的原文,当然是凭自己的理解译过来。有些鸟语语义含糊,例如信息质量中的4和6条,不明白其具体区别是什么。而第9条的system of
record,我翻译成记录系统,这个名词虽然常见,但也是不太明白确切的含义。猜测起来,应当类似我们通常说得ODS数据,是一种原子粒度的数据。因此其中的 record的意思为"记录",跟"事务"这个词很自然地联想到一起。

而非常惭愧地,对于其比较的五种架构。大多只有总线架构的经验,对于其他几种,独立数据集市可能就是指缺乏统一的架构;联邦数据仓库之闻其名;集中式架构非常奇 怪它和总线、CIF的确切区别;而至于CIF,文中更用Hub&Spoke来称呼这种架构,不明白。不知道有哪位能够就某种架构具体阐述一下。

所有这些指标最后的调查结果平均一下成为基准值,分值都是5分上下,这是很容易理解的。因为这些指标的定义并非十分严格,都是主观估分值。而且作为被调查者的心 理考虑,通常都会选择"中间分值",就像我们选择"一般"一样。


    Reply to author    Forward  
You must Sign in before you can post messages.
To post a message you must first join this group.
Please update your nickname on the subscription settings page before posting.
You do not have the permission required to post.

Create a group - Google Groups - Google Home - Terms of Service - Privacy Policy
©2009 Google