oracle rac只是解决并发和均衡计算的问题,Oracle在数据列存储技术上并不是领先者,据说今年会出支持列存储的数据库产品,不知道现在是
否已经出了.Oracle经常干一些"一行代码没写,先在市场上说已经支持什么技术的事情,等市场反映不错了,再写代码的事情".所以,不等于
ORACLE没解决,就说明技术未成熟的事情.记得Oracle在70年代底推出的数据库,在技术和产品稳定性都不如ingress,就是靠那个"白巫
师"魔鬼式销售方式翘动了市场,在ingress和IBM夹缝中生存,一直到85年IBM选择SQL语言作为RDB标准,使Oracle彻底击溃
ingress成为RDB的领导者.
列存储的出现,不是RDB本身造成的,是一个牛人搞出了基于位压缩算法,定义为BitWise技术,这个压缩算法是基于同类型字段的展开,而传统RDB
的记录中字段类型是不同的,这种记录存储方式是不适合压缩算法,于是乎,那个牛人提出按照同字段类型来进行压缩,压缩后进行存储,这样同字段类型的存储
方式称为"列存储",于是我们就把不同字段类型的记录存储方式称为"行存储",很形象吧.
但是,基于"列存储"一直到98年真正成为数据库产品(解决了列存储后如何还原记录的问题,支持了SQL语言,支持大规模并发). 但这种"列存储"数
据库产品,本身不是从传统RDB环境下出来的,所以在DW理论架构中没有它传统的位置.直到IBM在实践中提出CDW组件的DW实施架构,人们惊奇的发
现,这种"列存储"数据库产品原来最适合CDW,因为CDW比EDW组件数据库要大,存在数据膨胀问题(一般1:3,甚至到1:15),而这种"列存
储"数据库产品由于最基本压缩机制的存在,居然数据不膨胀,反而很小,记得02年世界上最大单个数据库测试,122T数据量的EDW数据库,导入
CDW,只有这种"列存储"数据库经过几天成功Load,其他传统RBD都失败了.
对于目前大谈的"云集市"概念,其实对于"列存储"数据库符合"云计算"的思路很简单, 本来就是同一个类型字段按照不同的位压缩算法存放在一起的,你
就可以把这个同类型字段存放点称为"云"(名字叫法不同),不同"云"之间的整合(其实必须要整合,因为单一个字段不是一条记录,不同字段在一起才能叫
记录)就说支持网格, 不同的"列"存放在不同的系统(Windows,Unix,Linux)来支持大规模并发.
所以,我们只能拭目来看各软件厂商的喧叫,从原理上来冷静分析是不是值得我们去体验和采用.
On 5月22日, 下午4时25分, raullew <
raul...@hotmail.com> wrote:
> DW计算的数据分发与合并通信是个大技术问题,oracle rac都没法解决,恐怕这种技术尚未成熟吧
>
> On 5月22日, 下午1时44分, Qing <
happys...@gmail.com> wrote:
>
>
>
> > 前段时间讨论云计算的事情,大家谈起来觉得好像这离数据仓库是很远的事情。可是古人说的好,最遥远的距离不是天涯海角,而是就在你身边却摸不到。
>
> > 这不,最近一则新闻就是关于vertica这个厂商跟amazon的合作,后者上次介绍过了,有人说它成功地从一个卖书的变成网络包租公,改提供云计算服务了。--而vertica是何许人也,他是一个专门的数据仓库产品,DW
> > Appliance,列式存储,跟sybase
> > IQ等是一条路子。他们的合作一个重点词汇就在于----cloud,云。vertica的分析数据库据说已经支持网格计算,可以将对数据库的访问分散到云里面-去。-"分散到云里面去",我这么说大家可能觉得挺玄乎,其实我不知道是否有这样的说法,但这样说挺形象的。我们将云看作一堆不知所云的东西,里面的构造不知道-,反正-里面可以分担压力。
>
> > 看吧,云计算里数据仓库已经并不远。不过如果在细想一下,当然还会觉得有些疑问。比如数据源从哪里来呢?谁来用它的数据仓库呢?(也许按照vertica的叫法--不应该叫做数据仓库,而是叫做"分析数据库")
> > ),提到了数据集市的外包。这也许就是这种云集市的生存之本吧。按照文章的说法,将企业数据仓库外包的可能性不大(除非本身的事务系统也在云里面),但对于一些--非机密数据的分析。但对于数据集市,到时已经有些是外包了的。并且找出几个理由说,这种外包会继续下去,不过我没怎么看明白这些理由。总之,这些案例没有告诉-如-何将数据弄进这些数据库里面。
>
> > 扩展阅读:DWA概览(
http://www.dbms2.com/2008/04/25/yet-another-data-warehouse-database-a...
> > )- 隐藏被引用文字 -
>
> - 显示引用的文字 -