是搜索的bug还是故意?--记百度显示的搜索结果数量在瞬间的差异

2 views
Skip to first unread message

fran...@gmail.com

unread,
Oct 30, 2006, 9:45:41 PM10/30/06
to 百度观察
2006-10-30
我在百度搜索网站www.xandx.com.cn,使用site命令,百度显示有10500条记录,如图:www.ebreese.com/images/baidu/baidu.jpg

当时我觉得很奇怪,因为这个论坛是一个新论坛,一共没有多少帖子,所有的包括动网自动形成的各种页面,应该也不会超过4000个,怎么百度会有10500条记录呢?于是我就一页页翻下去,当翻到28页时,百度提示"为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。"
继续,直到74页,到头了!再看上面显示的记录数量,变成了732!如图:www.ebreese.com/images/baidu/baidu2.jpg

接下来更奇怪的事情发生了,回到首页,重新进行上述搜索,显示结果为732,连续几次,结果都是732。如图:www.ebreese.com/images/baidu/baidu31-re-search.jpg(图片为10-31日的结果,741条)。


等待一段时间,再次搜索,结果又变成了10500,严重怀疑是否有某个程序专门控制这种显示方式。

今天这两个数量分别变成了10600和741,两天两组数字差异不同,分别为100和9。我小学数学学得不好,想不明白百度的大虾们怎么计算的。

各位,你们知道吗?

blog.ebreese.com

cuis...@gmail.com

unread,
Oct 30, 2006, 10:01:10 PM10/30/06
to 百度观察
我也经常注意到这个问题
也不知是什么原因
好像官方还没有解释

车夫

unread,
Oct 30, 2006, 10:18:30 PM10/30/06
to baidu...@googlegroups.com
google也一样。不可能给你全部把10000多条都检索出来

在06-10-31,fran...@gmail.com <fran...@gmail.com> 写道:

Mick

unread,
Oct 30, 2006, 10:49:03 PM10/30/06
to baidu...@googlegroups.com
这是正常的搜索策略。


 
在06-10-31,fran...@gmail.com <fran...@gmail.com> 写道:



--
Best Regards,
Yongwei Wu (Mick)

fran...@gmail.com

unread,
Oct 31, 2006, 2:42:16 AM10/31/06
to 百度观察
这正常吗?可是它显示的条数明显是错的呀。还是不明白。

fran...@gmail.com

unread,
Oct 31, 2006, 2:43:35 AM10/31/06
to 百度观察
但是xandx.com.cn的页面一共还不足4000,怎么会有一万多的结果呢?

google也会有同样的问题吗?我没发现,以后注意一下。

车夫

unread,
Oct 31, 2006, 8:08:42 AM10/31/06
to baidu...@googlegroups.com
不一定的。你可以翻翻看,有时候很多无聊的页面它也能找到,例如用户信息页面,打印功能页面等等,会比你的页面数量放大的

loudcloud

unread,
Dec 10, 2006, 9:37:13 PM12/10/06
to 百度观察
我在China Search Engine
Watch里面已经回复了这个问题,对百度,这不是技术问题,而是市场问题。

这个数字的确是预估的,但问题的关键在于百度都是翻几倍的数字估计,其它搜索引擎是往相对真实的数字估计。而且这个数字对于用户也很重要,因为当搜索结果不理想-时,用户往往会根据返回结果数大小决定是否有必要换关键词在结果里作二次搜索。

对于搜索引擎而言,查全和查准都是很关键的指标,返回结果数对普通用户而言是最直接的查全指标。如果你仔细观察就可以发现,百度在第二次报告这个数字时,就是很-准确的数字,原来几万条结果,第二次就是几十条。张朝阳号称的100亿网页收录量,要的也是这个噱头。

从站长的角度看,的确多报几倍的数字不是很关键。从用户的角度,就根本不是那样的啦。百度,还是非常狡猾的。

谷小丰 Gu Xiaofeng

unread,
Dec 13, 2006, 10:25:46 AM12/13/06
to baiduwatch
哈哈,感谢高人指点!
百度最近还公布了一个百度指数,http://index.baidu.com/, 我觉得这里的数字似乎也有问题。
 
我在gtalk里添加你了。
 
 
谷小丰 Gu Xiaofeng,fran...@gmail.com
2006-12-13

田春峰

unread,
Dec 13, 2006, 5:46:32 PM12/13/06
to baidu...@googlegroups.com
 
 
这里是我做的一个统计。
 
 
我现在考虑 一个问题,不知道能不能实现: 就是 如何测试 site:xxx.com  这个方法得出数字 的准确率。
 
做一个等式: 左边是: site:xxx.com 的数字 那么 等式右边 应该写什么呢?

 
多么乐:http://www.domolo.com

搜索引擎研究:http://search-analysis.com

田春峰
Reply all
Reply to author
Forward
0 new messages