BI的第一波高潮在二十一世纪前后几年!
我已经开始像个神棍样的去断言,当我说这句话的时候,凭的是感觉,有时候难免自我感觉良好。不过如果要做一个科学神棍,需要研究一下数据,用客观事实说话。
如何得到数据,这是个问题。可以从新闻入手,google的新闻,还是有点意思。通过搜索一些关键字,看这些关键字出现的频率,能够大概知道媒体对这个关键字的关注程度。这个数据虽然客观,但也有其他问题,比如关键词的选取问题。这个关键字是否能够代表整个行业的发展?比如,你用"数据仓库"就能代表整个行业吗?或者,一个关键字是否会产生垃圾的结果,比如BI这个词,就经常并非代表商务智能的意思。
废话少说,看图先。
首先是国外(当然主要是美国)的bi关键词搜索结果出现频率,(timeline-bi-in-en.jpg),这得谢谢google的英文新闻提供了timeline功能,目前中文谷歌还不提供此功能。所以再来看bi中文关键词搜索结果,(timeline-bi-in-cn.jpg)基本上可以视为这是国内对bi的关注度。
对于英文关键词,我选了四个,"business Intelligence", "data warehousing", "OLAP", "data mining",从这张黄图上。本文第一句话的断言还有点靠谱。因为BI这个词导致的垃圾结果太多,所以我没有选用它。
下面来分析一下。business Intelligence这个组合在2002年的最受关注,真是各大媒体纷纷报道阿。这个词应当是从1989年正式出炉(现在意义的BI),90年对这个新名词大家挺感兴趣,但估计没什么实质东西,于是随后的几年反而关注少了。直到94年,开始抬头,至02年一只呈关注上升趋势。特别注意以下,在96年的时候,有个小小突起,恐怕这是因为另一个说法,说gartner公布BI这一术语。但从数据上看,其实这次公布的影响力根本不大。
02年是个很高的高峰,太高了,02年发生了什么重要事情?我忘了,谁记得?或者有可能只是google新闻数据库的问题,在这个年份保留的记录最多?在02年之后,关注程度回复到01年的水平,基本平稳。2008年,看起来是不少的,现在才半年的时间,那根柱子已经不矮。但不能妄加断言说08年会爆发,因为搞不清楚google是怎么处理这些新闻的,是不是当年的新闻会返回更多的搜索结果?
看另外几个关键字。综合看,不再一一分析。这三个,data warehousing, olap, data mining,是bi中具体领域的关键字,很少会有歧义。走势竟然差不多,90前后,关注较少,94年得到关注,一直提升,98年附近,是高潮。其中,dw在98年之后稳步下滑,2002之后趋于稳定。olap下滑较快,不过也是02年之后稳定,dm,下滑很少,看来对这玩意儿,还是潜力大大地。
从这几个图来看,我想可以看出一个趋势。在98年前,大家还是主要对具体的分析技术感冒,但之后,开始强调综合的决策应用。
再来看看国内的bi趋势,我搜索了五个关键字,商业智能、商务智能、数据仓库、数据挖掘、决策支持系统。
商业智能跟商务智能这两个词能够代表BI总体的关注,国内对bi主要有这两种译法,台湾还有一种叫做商业智慧,我就不分析了。但有个问题,在搜商务智能的时候,经常有些手机相关的搜索结果干扰(商务智能手机),不能算一个很好的关键字。从图上看,返回的结果从2000年开始,03年之前,这个词语还是零星的关注,从03年开始,开始上升,07年达到高峰,也就是去年。而08年,看着那三根柱子,似乎很不起眼,但毕竟现在还是不是判断08年的时候。
对于数据仓库和数据挖掘这两项专门技术,都是从2000年之后开始得到关注的,基本上完了国外六年。但其实在2000年之前,也曾经零零星星地提到过,比如在88年时候,先是数据仓库,后是数据挖掘。那年中国发生了什么?是不是有什么重要科研项目发布?数据仓库在05年的时候得到最高关注,以后逐年下降。而挖掘自00年之后,一直呈上升趋势,并且看08年的柱子,估计也会在年尾高出07年的。
至于最后那个"决策支持系统",我本来以为在2000年之前提得多,但想不到他的关注趋势跟"商业智能"差不多,在03年兴起。不过这个术语的概念有些模糊,经常有的根本不是现在意义的bi,而是诸如专家系统之类的,所以,这个图也不能太说明什么。也许,只能说,从03年以后,国内对于理性决策的需求越来越大了。
如此分析,个人见解。如果大家有什么高见,也可以看图说话。