数据仓库也疯狂

3 views
Skip to first unread message

Qing

unread,
May 29, 2008, 1:39:26 AM5/29/08
to tt...@googlegroups.com
这是世界是怎么了?数据仓库也疯狂起来,大家都开始比拼,我比你大。以前么,还是自己心里想想,背后说说,我比她胸脯大。现在,大家开始用尺子量。就算结果你更大,她也不屑一顾,你那个,恐怕做过手术吧。
 
人们说数据仓库最大的,一般会想到沃尔玛和teradata的案例。最近,也有几家开始蹦出来说,我最大。
 
yahoo说他是世界上最大的数据仓库,2PB,也就是两千个TB。不光是最大,而且是最忙。人家ebay不干,说我有6个PB,yahoo说,算了吧,听说你最大的单个库也就是1.4PB。ebay听到这话,心想,妈的,当初我写新闻稿的时候胆子不够大,那天本来想写14的,可这牛皮太大,于是加了个小数点,想不到这还给落下把柄,真郁闷。还有其他人也不服,更加不信,对yahoo说,照你这个意思,google的数据库也比不上你罗,这牛皮吹大了吧。别急,yahoo很镇静,我们这2PB啊,都是存储结构化数据的。他们那个存储非结构化数据,不算。那些数据又不能拿来分析,我们这2PB可以直接分析的,牛逼吧。看看这里,http://www.computerworld.com/action/article.do?command=viewArticleBasic&articleId=9087918
 
这是yahoo的故事。还有呢,那边sybase跟sun两个一合计,说,咱们合伙申请一个数据仓库的吉尼斯世界纪录吧,说干就干,俩人去申请了,结果成了,http://tech.ccidnet.com/art/1105/20080527/1459477_1.html。反正吉尼斯纪录里面还没有最大数据仓库这一项呢,他们头一个,吉尼斯委员会也不知道啥叫数据仓库,问,你们这个仓库多少平方米?大小s说,很大。这个数据仓库经过证明可以存储1000万亿条结构和非结构化数据,而且访问起来特别快。另外一个更大有点,就是环保,产生的热量和二氧化碳更少。吉尼斯评审在纽约主持了记录仪式,很激动,说他们委员会为吉尼斯能够有数据仓库这个记录而感到欢欣鼓舞。大小s说,我们的数据仓库进入吉尼斯世界纪录,证明我们是最大的。
 
Yahoo知道这消息很后悔。早知道我也去申请,不过也没关系,等过几个月,我再去申请,打破这项纪录。不过可惜,打破纪录总是没有第一个创纪录来的风光。
 
yahoo想搞清楚大小s到底报了多大的量,可惜,死活搞不到,也不知道这个数据仓库究竟是给谁建的。

George Zhang

unread,
May 29, 2008, 2:21:51 AM5/29/08
to tt...@googlegroups.com
这个事情太逗了
看yahoo那个文章的回帖
有个人(估计是国防部的)说,他们储存战略武器资料的数据仓库要大多了~

别急,yahoo很镇静,我们这2PB啊,都是存储结构化数据的。他们那个存储非结构化数据,不算。那些数据又不能拿来分析,我们这2PB可以直接分析的,牛逼吧。看看这里,http://www.computerworld.com/action/article.do?command=viewArticleBasic&articleId=9087918
 
这是yahoo的故事。还有呢,那边sybase跟sun两个一合计,说,咱们合伙申请一个数据仓库的吉尼斯世界纪录吧,说干就干,俩人去申请了,结果成了,http://tech.ccidnet.com/art/1105/20080527/1459477_1.html。反正吉尼斯纪录里面还没有最大数据仓库这一项呢,他们头一个,吉尼斯委员会也不知道啥叫
 


--
Best Regard
George Zhang

raullew

unread,
May 29, 2008, 2:33:23 AM5/29/08
to ttnn BI 观点
叫做数据垃圾仓库吉尼斯世界纪录更合适

On 5月29日, 下午1时39分, Qing <happys...@gmail.com> wrote:
> 这是世界是怎么了?数据仓库也疯狂起来,大家都开始比拼,我比你大。以前么,还是自己心里想想,背后说说,我比她胸脯大。现在,大家开始用尺子量。就算结果你更-大,她也不屑一顾,你那个,恐怕做过手术吧。
>
> 人们说数据仓库最大的,一般会想到沃尔玛和teradata的案例。最近,也有几家开始蹦出来说,我最大。
>
> yahoo说他是世界上最大的数据仓库,2PB,也就是两千个TB。不光是最大,而且是最忙。人家ebay不干,说我有6个PB,yahoo说,算了吧,听说你-最大的单个库也就是1.4PB。ebay听到这话,心想,妈的,当初我写新闻稿的时候胆子不够大,那天本来想写14的,可这牛皮太大,于是加了个小数点,想不到-这还给落下把柄,真郁闷。还有其他人也不服,更加不信,对yahoo说,照你这个意思,google的数据库也比不上你罗,这牛皮吹大了吧。别急,yahoo很-镇静,我们这2PB啊,都是存储结构化数据的。他们那个存储非结构化数据,不算。那些数据又不能拿来分析,我们这2PB可以直接分析的,牛逼吧。看看这里,http://www.computerworld.com/action/article.do?command=viewArticleBas...
>
> 这是yahoo的故事。还有呢,那边sybase跟sun两个一合计,说,咱们合伙申请一个数据仓库的吉尼斯世界纪录吧,说干就干,俩人去申请了,结果成了,http://tech.ccidnet.com/art/1105/20080527/1459477_1.html
> 。反正吉尼斯纪录里面还没有最大数据仓库这一项呢,他们头一个,吉尼斯委员会也不知道啥叫数据仓库,问,你们这个仓库多少平方米?大小s说,很大。这个数据仓库-经过证明可以存储1000万亿条结构和非结构化数据,而且访问起来特别快。另外一个更大有点,就是环保,产生的热量和二氧化碳更少。吉尼斯评审在纽约主持了记录-仪式,很激动,说他们委员会为吉尼斯能够有数据仓库这个记录而感到欢欣鼓舞。大小s说,我们的数据仓库进入吉尼斯世界纪录,证明我们是最大的。

interstage

unread,
May 29, 2008, 2:37:38 AM5/29/08
to ttnn BI 观点
呵呵,我并不这么认为,这不是疯狂,反而有点晚了.数据库技术本身一直在按照它本身的2个技术方向进行着1,存储,2,速度. 这2个方向就一直在平衡
着,利用多点并发解决这2个方向是一个趋势,但在单点,甚至单库来比这2个方向,其实也是数据库人的期待,谁都知道一般人在开车可能一辈子都不会超过
200马,但F1为什么让所有的汽车人痴迷,就是汽车人想知道一辆汽车究竟能开多快,尽管F1备受质疑,认为离一般人很远,但它让买汽车的人感到自信,
连近400马都速度都做出来的厂商给你一辆200妈以下的汽车,你肯定觉得很安全和高质量.同样数据库厂商大库的比拼,其实也有这点味道,我给你的数据
库单库支持2PB都没问题,你搞2年的数据仓库单库才到2T,有什么牛比,放心用吧.
所以,坚决支持吉尼斯对数据库厂商在单库环境下的比拼,建议标准固定(能耗,结构化或非结构化,导入时间,某笔业务记录查询时间等等),这样,让从事数
据库的人有一个尺度,必要被数据库厂商所迷惑,甚至为了很多企业仅仅是为了解决存储和速度的问题被迫上DW系统的,现在都不需要上DW系统了,不再需要
被DW人忽悠了,说什么你要建多维模型等等. 我一直认为从事DW的人首先是RDB的技术人员,如果RDB在技术上能解决的问题,尽量不要用DW的方法
和架构去忽悠客户.

On 5月29日, 下午1时39分, Qing <happys...@gmail.com> wrote:
> 这是世界是怎么了?数据仓库也疯狂起来,大家都开始比拼,我比你大。以前么,还是自己心里想想,背后说说,我比她胸脯大。现在,大家开始用尺子量。就算结果你更-大,她也不屑一顾,你那个,恐怕做过手术吧。
>
> 人们说数据仓库最大的,一般会想到沃尔玛和teradata的案例。最近,也有几家开始蹦出来说,我最大。
>
> yahoo说他是世界上最大的数据仓库,2PB,也就是两千个TB。不光是最大,而且是最忙。人家ebay不干,说我有6个PB,yahoo说,算了吧,听说你-最大的单个库也就是1.4PB。ebay听到这话,心想,妈的,当初我写新闻稿的时候胆子不够大,那天本来想写14的,可这牛皮太大,于是加了个小数点,想不到-这还给落下把柄,真郁闷。还有其他人也不服,更加不信,对yahoo说,照你这个意思,google的数据库也比不上你罗,这牛皮吹大了吧。别急,yahoo很-镇静,我们这2PB啊,都是存储结构化数据的。他们那个存储非结构化数据,不算。那些数据又不能拿来分析,我们这2PB可以直接分析的,牛逼吧。看看这里,http://www.computerworld.com/action/article.do?command=viewArticleBas...
>
> 这是yahoo的故事。还有呢,那边sybase跟sun两个一合计,说,咱们合伙申请一个数据仓库的吉尼斯世界纪录吧,说干就干,俩人去申请了,结果成了,http://tech.ccidnet.com/art/1105/20080527/1459477_1.html
> 。反正吉尼斯纪录里面还没有最大数据仓库这一项呢,他们头一个,吉尼斯委员会也不知道啥叫数据仓库,问,你们这个仓库多少平方米?大小s说,很大。这个数据仓库-经过证明可以存储1000万亿条结构和非结构化数据,而且访问起来特别快。另外一个更大有点,就是环保,产生的热量和二氧化碳更少。吉尼斯评审在纽约主持了记录-仪式,很激动,说他们委员会为吉尼斯能够有数据仓库这个记录而感到欢欣鼓舞。大小s说,我们的数据仓库进入吉尼斯世界纪录,证明我们是最大的。

Qing

unread,
May 30, 2008, 12:31:43 AM5/30/08
to tt...@googlegroups.com
站在另一个角度看,数据仓库也有世界记录确实倒也是好事,对我们BI人是有好处的。为啥哩,因为它能造势啊,大众是盲目的,喜欢看别人大家。这个记录可能很快就被刷新,而这个世界将更快地数据膨胀,所有能够保存的数据,都会放到数据库里面,分析。这会创造出更多的项目机会和就业岗位,bi人的队伍也会壮大起来。对bi应用的需求也不断增长,于是将会有不断的创新去满足这些需求。
 
所以,在我们鄙视这些自称第一的家伙同时,也得为他们鼓鼓掌,他们会发起第二波BI性高潮。(第一波,算是在二十一世纪交界的那两三年)

2008/5/29 interstage <buer...@gmail.com>:
呵呵,我并不这么认为,这不是疯狂,反而有点晚了...
Reply all
Reply to author
Forward
0 new messages