实时分析的 6 大关键因素(ibm的文章）

1 view

Skip to first unread message

python

unread,

Nov 24, 2009, 1:52:21 AM11/24/09

to ttnn

文章链接：http://www.ibm.com/developerworks/cn/data/dmmag/dbt14n3/RealTimeAnalytics/index.html

developerWorks 中国 > Information Management >

实时分析的 6 大关键因素

您可以充分发挥分析计划的作用吗？

文档选项

		打印本页

		将此页作为电子邮件发送
		英文原文

级别：初级

Leah MacMillan, 商业智能和性能管理产品营销总监, IBM

2009 年 11 月 11 日

本文为数据管理专家提供了 6 个最佳实践，确保他们的性能管理和分析计划能够取得成功。
来自 IBM Data Management Magazine 中文版。

21 世纪对信息的需求仍在持续增长，并且没有消退的迹象。如今，决策制订者们需要利用海量信息来带领更多企业部署分析解决方案。这些解决方案不仅帮助企业应对重大业务问题，还协助它们根据数据实时数据做出预测并采取行动。

业务分析的价值在于从各种异类数据源中提取具体的不断变化的数据，从而确保做出更加明智的决策。潜在的数据源已经远远延伸到典型的企业资源规划（ERP）事务系统、数据库和数据仓库的 IT 产品组合之外，还包括来自各种外部源的信息，比如客户调查、市场研究和购买者行为趋势。分析应用程序可以实时（或接近实时）转换这些信息，以得到最新的见解。

举例来说，业务分析可以帮助组织监控血液供应、碳足迹报告，或者增加跨供应链的可见性。零售商可以根据客户对 Coke 或 Pepsi 的偏好来确定最佳节流产品。警察服务可以使用分析工具将犯罪信息发放给巡警，以便于他们能够快速识别问题并关联犯罪的趋势和位置。

数据管理专业人员如何确保他们的性能管理和分析计划能取得成功呢？下面提供的 6 个最佳实践将帮助您应付用户需求不断增加和数据来源日益复杂化的双重挑战。

1. 广撒网

仅根据局部信息来做出决策和开发流程有时会对业务性能造成负面影响。因此，首先需要确保您的分析实现能直接访问所有相关数据，无论它们位于什么位置。分析系统还应该充当所有历史和事务数据的权威源，以便您可以适当收集关于趋势的见解，并做出对未来性能造成影响的决策。一次性指示板、自定义程序或单独电子表格都不会连接到通常不可用、不可持续或不可伸缩的受信任的数据池。各解决方案都添加了自己的查询和报表复杂性，并引入了相关的协调和可用性挑战。

分析解决方案需要通过丰富的信息来生成有意义的见解。由于大量数据遍布于众多系统中，因此您需要广泛的覆盖面来确保可以连接到所有事务系统、仓库（关系和在线分析处理 [OLAP]）、平面文件、旧有系统以及 XML、Java Database Connectivity (JDBC)、Lightweight Directory Access Protocol (LDAP) 和 Web Services Description Language (WSDL) 源。

广撒网可帮助您克服影响分析的数据筒仓问题，并能交付及时、全面的相关信息的企业视图。另外，当新的数据源可以访问时，所有分析功能都将能够立即访问该数据。

回页首

2. 计划缓存策略

性能优化是快速报表和交互式分析的关键部分。在不同后端系统之间切换以便访问访问是一项熟悉的需求，但它如果采用动态方式则会严重影响性能。更好的方法是创建一个缓存策略，这样可以改善系统性能并最大限度降低重复数据请求对源系统造成的负面影响。常用的技巧包括企业信息集成 (EII)、虚拟缓存、OLAP 缓存、缓存到磁盘或本地数据库、事件驱动、预定和手动刷新以及高级混合内存 / 磁盘利用选项。

回页首

3. 采用公共、多语言业务模型

当 IT 团队访问并集成所需数据，提供完整组织视图之后，建模人员必须将它转换成对于业务用户有意义的信息。他们还必须确保正确的信息能够在正确的时间以正确的方式到达正确的用户。

要确保业务用户能够理解，交付此信息的关键是使用一个公共元数据业务模型。该模型对所有数据使用一致的业务规则、维度和计算，而不管它的数据源在什么地方。这使业务能够更加准确地报告和分析各种信息，比如发票、总帐和订单收条。公共业务模型提供单一组织视图，从而能为所有角色、位置和语言提供可靠的跨企业报表。此方法不仅支持可确保做出自信决策的信息一致性，还可降低维护建模环境的成本。它还允许为所有地理位置生成单一报表，从而缓解了报表的迅速增加。

回页首

4. 一次建模，多次应用

大型数据仓库有时会让尝试生成报表和分析的企业不堪重负，因为可供选择的数据对象实在是太多了。更好的方法是建立一个模型，并发布它的各个部分来解决不同业务用户或社区的需求。如果可能，创建可重用对象并建立物理模型与业务模型相分离的多层模型。这样可以减少变化产生的下游影响，并允许您轻松发展自己的模型，以及添加或修改数据源和源策略。

通过发布单一公共业务模型的各种部分，您可以避免复制和分歧的缺陷。此策略可帮助减少模型扩散，支持跨企业的一致性，并能缩短交付为不同用户组交付不同模型所需的时间 —— 并且，它将确保各用户社区仅接收所需的特定信息。

回页首

5. 建立基于角色的安全性

同样，通过一个公共业务模型来支持您的分析解决方案并不意味着您希望每个用户都能看到每个分析或报表。分配基于角色的访问权限可以避免生成单独的模型或报表。单模型还限制授权用户只能查看自己的数据视图，这也有助于您遵守数据治理和隐私法规。

回页首

6. 协作开发模型

快速建立、部署和维护一个有效的模型并不简单，因此组织通常借助建模团队来完成这项任务。为了最大限度地提高生产务，设计流程和开发工具时应该尽可能满足协作需求。举例来说，数据建模人员需要能够同步完成模型的不同部分，并且在将分段合并成单一视图之前不会产生各种问题。

2009-11-24

python

msn shir...@163.com

Reply all

Reply to author

Forward

0 new messages