谷歌老了,百度很危险

12 views
Skip to first unread message

Hong Xiaowan

unread,
Jun 20, 2006, 11:52:51 PM6/20/06
to GFans
谷歌老了,百度很危险

由于对百度和谷歌的pagerank很感兴趣,所以做了两个实验。

1.东关街和东圈门是扬州的双东民俗古巷游的两条风景线。2005-12-27,注册dongguanjie.comdongquanmen.com,用谷歌的blogger.com进行维护,尽可能转载了所有专业内容(包括江泽民传,因为江泽民小时侯曾经居住在双东地区),撰写了少量原创,同时在百度和谷歌进行登陆。
一天后,百度全站收录,并在七天后,列名第一页,“东关街”主题词搜索排第三,http://www.baidu.com/s?wd=%B6%AB%B9%D8%BD%D6&cl=3,“东圈门”主题词搜索排第一,http://www.baidu.com/s?wd=%B6%AB%C8%A6%C3%C5&cl=3
而直至2006年6月24日,在谷歌不用site;,就无法发现上述两个网站的网页。
2006-05-11注册xufei.info,主题超女许飞和吉他弹唱,转载了关于许飞专业性的内容,同时加了一份我写的吉他弹唱教材,该教材用了许飞晋级的曲目,2006年6月15日,”许飞“排名百度第十位,“吉他弹唱”排名百度第五位,“许飞吉他”排名百度第一位。在谷歌用site,仅发现一页。

2.2006-04-06注册magicalcrystal.com,英文网站,该网站以一种最新材料为主题,发现谷歌依然迟钝。

由此可见,谷歌的以外部联接为基础的排名系统有着致命的弱点,无法收录最新的的和最专业的内容,在谷歌中搜索到的往往都是过时的内容,看来谷歌不仅仅是不懂中文这么简单,恐怕英文也不是太懂。

可以猜测,百度的排名系统是以全文语义分析为基础的,这远远优于谷歌的以外部联接为基础的排名系统。

同时如果百度的排名系统是以全文语义分析为基础,将需要更多的精力来维护网站的主题内容以获得好的排名,将比谷歌的以外部联接为基础的排名系统更不容易作弊。

所以,百度很危险,一旦百度进入其他语种,谷歌的优势将不复存在。

Guxq

unread,
Jun 21, 2006, 12:32:49 AM6/21/06
to fa...@googlegroups.com
百度也在进步

Aaron Liang

unread,
Jun 21, 2006, 12:37:10 AM6/21/06
to fa...@googlegroups.com
Google要索引的是全世界的信息,百度基本上只是"啃"国内的网站。
你说周游世界快,还是走遍中国快?

 

Hong Xiaowan

unread,
Jun 21, 2006, 1:25:02 AM6/21/06
to GFans

Aaron Liang wrote:
> Google要索引的是全世界的信息,百度基本上只是"啃"国内的网站。
> 你说周游世界快,还是走遍中国快?
>

用飞机周游世界比用11路走遍中国快。
百度的网页收录大概是谷歌的1/5,如果都是坐的飞机,百度一天到了,为什么谷歌10天也到不了?

Chaz

unread,
Jun 21, 2006, 1:39:18 AM6/21/06
to fa...@googlegroups.com
对你来说google是无所谓的,因为你不需要专业,只要娱乐。

On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:


--
________________________________
Google Fans

Chaz

unread,
Jun 21, 2006, 1:40:50 AM6/21/06
to fa...@googlegroups.com
似乎楼主没有给出"谷歌"的搜索链接。写文章不要带着偏袒去写好么?


--
________________________________
Google Fans

Hong Xiaowan

unread,
Jun 21, 2006, 1:59:40 AM6/21/06
to GFans
娱乐也是专业的一种,专业的娱乐和娱乐的专业并不矛盾。

Hong Xiaowan

unread,
Jun 21, 2006, 2:04:18 AM6/21/06
to GFans

Chaz wrote:
似乎楼主没有给出"谷歌"的搜索链接。写文章不要带着偏袒去写好么?

给了也没有用,什么都没有,谷歌确实有点老了。我也是google的fans,但是我不偏袒google,要实事求是的去评价。

如果百度杀到多语言市场,google的核心技术真的危险。不要再拿gfw说事,努力在自身技术找原因,为什么搞不过百度。

kore.art

unread,
Jun 21, 2006, 2:19:34 AM6/21/06
to fa...@googlegroups.com
同意楼上,
   写与google有关的必须给出相应的证据.
--
--
掌握全新资讯,探讨每天的动感体验,用商业来衡量价值,客户不是上帝,他们仅仅只是我们的衣食父母.
--------Name:kore  --Http://24-00.org

Hong Xiaowan

unread,
Jun 21, 2006, 4:02:40 AM6/21/06
to GFans
给了也没有用,什么都没有,谷歌确实有点老了。我也是google的fans,但是我不偏袒google,要实事求是的去评价。

如果百度杀到多语言市场,google的核心技术真的危险。不要再拿gfw说事,努力在自身技术找原因,为什么搞不过百度。

Chaz

unread,
Jun 21, 2006, 7:10:17 AM6/21/06
to fa...@googlegroups.com
是不矛盾,你在说废话。我要的是专业搜索,不是娱乐搜索,ok?

On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:
> 娱乐也是专业的一种,专业的娱乐和娱乐的专业并不矛盾。
>
> >
>


--
________________________________
Google Fans

Hong Xiaowan

unread,
Jun 21, 2006, 8:00:03 AM6/21/06
to GFans
如果仅仅指搜索引擎的专业性,谷歌在内核上已经不如百度。
谷歌的危机已经不仅仅是在中国不服水土,而且在技术上也落后于百度。因为拼音语言分词简单,语法结构明晰,拼音语言的全文语义分析要比中文容易的多。如果现在百度介入其他语种的搜索,谷歌必然受到严重冲击。
我的帖子是善意的警告,我们不要独大的谷歌,也不要独大的百度,独大必作恶。谷歌现在中国不行,棒喝一下,千万不要以后在全球不行。

Marcher

unread,
Jun 21, 2006, 8:08:56 AM6/21/06
to fa...@googlegroups.com
不容置疑Google在搜索专业内容的时候找到的垃圾内容要比Baidu少多了。
但是对于中文搜索的支持,比如理解能力,确实比Baidu差点。
总的来说Google在搜索上还是占有重要地位的,不过确实也要居安思危,是吧?

Hong Xiaowan

unread,
Jun 21, 2006, 8:52:09 AM6/21/06
to GFans
我是做服装外贸的,用的google比较多,所以也就发现google的迟钝。在中文信息上,用百度和google同时搜索"服装有限公司",
http://www.baidu.com/s?ie=gb2312&bs=%B7%FE%D7%B0+%CD%E2%C3%B3%B9%AB%CB%BE&sr=&z=&cl=3&f=8&wd=%B7%FE%D7%B0%D3%D0%CF%DE%B9%AB%CB%BE&ct=0
十个结果里出现了一个上海服装(集团)有限公司非完全吻合结果。
http://www.google.cn/search?hl=zh-CN&newwindow=1&q=%E6%9C%8D%E8%A3%85%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8&btnG=%E6%90%9C%E7%B4%A2&meta=
十个结果出现了六个非完全吻合结果。
也许你认为服装,时装,服饰是一样的,但是在我们这个行业里,服装倾向于生产厂,时装倾向于设计、品牌、销售,服饰还包括首饰、鞋帽等。

在这个例子中,谷歌完全不如百度,百度有90分,谷歌只有40分。

每个人都说百度垃圾,谷歌伟大,我不想人云亦云,百度可能流氓了一点,但是绝对不垃圾,如果百度垃圾,谷歌还要垃圾一点。
再说,即使百度再流氓,但是在中国是合法的,作为一个公司,可以钻法律的空子去谋取发展。谷歌再伟大,但是不能超越法律的框架。
至于钻法律空子的例子,最经典的不要在中国找,到美国去找。

> --
> Greetings From Marcher~
> http://marcher233.googlepages.com/about

Guxq

unread,
Jun 21, 2006, 9:17:06 AM6/21/06
to fa...@googlegroups.com
google在某种意义上已经被神化了。

 

Qingyang Li

unread,
Jun 21, 2006, 9:30:08 AM6/21/06
to fa...@googlegroups.com

Qingyang Li

unread,
Jun 21, 2006, 9:37:13 AM6/21/06
to fa...@googlegroups.com
你的意思是说
人可以无耻到百度那种地步
可以无耻到钻法律的空子的地步

是么?

另外
关于法律
作为你个中国公民
你可曾为你现在遵守的任何 法律 投票表决过?

如果是你投票表决过的法律,百度还来钻空子,你还会这样说无耻的话么?

Guxq

unread,
Jun 21, 2006, 9:50:51 AM6/21/06
to fa...@googlegroups.com
看清楼主说的话
至于钻法律空子的例子,最经典的不要在中国找,到美国去找。


 
--
-百度贴吧MSN吧吧主
-Http://guxqcn.spaces.msn.com

Cybersome

unread,
Jun 21, 2006, 9:58:35 AM6/21/06
to fa...@googlegroups.com
对我来说 google带来的流量不及baidu的1/30, 虽然我很讨厌baidu

我做的英文站也是的,msn&yahoo来源多得多!!!!

大概是google把domain看的更重,站大的就摆前面,站小的,即使关键字更吻合也被排在后面

这是我的英文站的访问统计


On 6/21/06, Qingyang Li <con...@gmail.com> wrote:


--
Sincerely,
Cybersome @ http://cybersome.com/
New Wordpress Blog - http://blog.cybersome.com/
cXNA - http://cxna.cybersome.com/

2006-6-21 21.57.39.jpg

Cat

unread,
Jun 21, 2006, 10:40:30 AM6/21/06
to fa...@googlegroups.com
建议楼主再做一次类似实验,但在提交到Google时要提交Google Sitemaps。提交Sitemaps对Google收录有明显的帮助,但对排名不会有什么帮助,而收录更新频率以来PageRank等因素也与Sitemaps无关。在你提交Sitemaps并确认你为该网站的所有者后,你可以查询网站内页面收录的情况。
 
至于Google对新网站的收录(指不提交的自然收录),确实比较慢,它甚至在提交页面声明爬网周期为9个月。但如果你的网站实现了"病毒式传播"(这里指媒体上的,与计算机病毒无关),能够快速得到相当多的Referrer,Google也会很快收录。
 
On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:

Hong Xiaowan

unread,
Jun 21, 2006, 10:51:41 AM6/21/06
to GFans
我希望我无耻到百度那种地步,也不要伟大得和谷歌一样。技不如人就技不如人,为什么要标榜自己伟大呢?
即使如谷歌如此伟大,为什么还有执照门事件呢?我不知道谷歌钻中国法律的空子成功了没有?你可以告诉我吗?
如果我这样的老百姓有这样的荣幸为中国的法律投票表决,那么中国也就有幸拥有和印度一样的公路。

Hong Xiaowan

unread,
Jun 21, 2006, 11:03:10 AM6/21/06
to GFans
sitemap有违谷歌的把一切简单化的初衷。至于病毒式传播,更不是一般网民可以操作的。
如果可以得到同样的结果,老百姓为什么要选择烦琐的谷歌呢?百度多简单!
> --
> My blog:
> http://purl.oclc.org/NET/cathsfz

Cat

unread,
Jun 21, 2006, 11:28:18 AM6/21/06
to fa...@googlegroups.com
如果说Sitemaps复杂,那么针对Yahoo和Baidu作语义优化不同样是复杂吗?虽然这些都是搜索引擎认为合法的SEO手段。
 
在关键时刻,你会选择依赖一个不太熟的朋友,还是一个曾经帮过你也曾经害过你的朋友?这个我无法给出结论,我想看一下其他人怎么说,看看大家是选择"一次不忠百次不用"还是别的什么。在中文搜索领域,Google属于前者,虽然它确实不能怎么帮你,但也不会害你;baidu的中文搜索结果大多数时候都比Google好,但有时候它会害你一下。

Qingyang Li

unread,
Jun 21, 2006, 11:52:19 AM6/21/06
to fa...@googlegroups.com
他的意思我看得很明白。他的意思是说,百度钻法律的空子那是它的本事。

但是,他的文章的主旨是说百度与谷歌,因此,我的回应里面也只想说百度和谷歌,这有什么不对么?

但是,我认为钻法律空子的百度很无耻;有空子可钻的法律很悲哀。
  如果我的话有错,你再用红色大字体来提醒我也不迟。
  楼主说的话是在给baidu的无耻找理由。
  可是请问,他的理由站的住脚么?
  他的理由有什么值得你维护的?

至于钻法律的空子,我不想找最经典的,我只想知道,百度如果这样做,你真的还要买它的帐么? 也许你会,因为那个法律和你无关。

Qingyang Li

unread,
Jun 21, 2006, 11:56:58 AM6/21/06
to fa...@googlegroups.com
google真的有标榜自己伟大么?我说过google伟大么?
真的有么?
真的么?

"我希望我无耻到百度那种地步"
头骨的凉...

[BLT]FQX

unread,
Jun 21, 2006, 11:58:24 AM6/21/06
to GFans
*Messages not complying with local law, regulation or policy do not
appear.*

为什么会这样……

Qingyang Li

unread,
Jun 21, 2006, 12:02:55 PM6/21/06
to fa...@googlegroups.com
期待百度进入其他语种

On 6/21/06, Guxq <gux...@gmail.com> wrote:

Chaz

unread,
Jun 21, 2006, 12:09:52 PM6/21/06
to fa...@googlegroups.com
请你了解一下什么叫内核再说话。google的水土不服是文化的差异,并不代表技术,谢谢。

On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:
> 如果仅仅指搜索引擎的专业性,谷歌在内核上已经不如百度。
> 谷歌的危机已经不仅仅是在中国不服水土,而且在技术上也落后于百度。因为拼音语言分词简单,语法结构明晰,拼音语言的全文语义分析要比中文容易的多。如果现在百度介入其他语种的搜索,谷歌必然受到严重冲击。
> 我的帖子是善意的警告,我们不要独大的谷歌,也不要独大的百度,独大必作恶。谷歌现在中国不行,棒喝一下,千万不要以后在全球不行。
> Chaz wrote:
> > 是不矛盾,你在说废话。我要的是专业搜索,不是娱乐搜索,ok?
> > On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:
> > > 娱乐也是专业的一种,专业的娱乐和娱乐的专业并不矛盾。
> > >
> > > >
> > >
> >
> >
> > --
> > ________________________________
> > Google Fans
>
> >
>


--
________________________________
Google Fans

Hong Xiaowan

unread,
Jun 21, 2006, 11:17:07 AM6/21/06
to GFans
对了,开复跳槽是不是和谷歌有关的最经典钻美国法律空子的案例?

Hong Xiaowan

unread,
Jun 21, 2006, 11:51:04 AM6/21/06
to GFans
首先,您误解了我的意思,不是优化,而是策划。专业的,原创的网站需要策划。优化仅仅是让网站看起来象专业原创的,是一种作弊,一种钻空子的行为。
面对百度,不需要seo,只需要专注努力做好自己的网站。

被百度封杀,请在自己身上找原因。百度可以沟通,如果确实没有作弊行为,可以解封。当然,由于谷歌比较迟钝,可能一时发现不了作弊,但也不是"不会害你"。被谷歌封杀的也多了!

Hong Xiaowan

unread,
Jun 21, 2006, 12:25:11 PM6/21/06
to GFans
对了,开复跳槽是不是谷歌最经典的钻美国法律空子的案例?
执照门呢?

非为禁止即为合法,能够钻法律的空子并不可耻,可耻的是没有本领钻空子,做了法盲还要用不作恶,公正来标榜自己。可耻的是把技术上的失败归结于某些法律环境。
可耻的是似乎只有违法才是生财之道,和赖星星有的一比。

牌坊之说也就不要谈了!

Aaron Liang

unread,
Jun 21, 2006, 5:56:16 PM6/21/06
to fa...@googlegroups.com
不管百度的所谓核心技术是不是优于Google,百度是一个让我感到恶心的公司。
如果没有了百度,我的生活丝毫不会受到影响;如果没有了Google...不敢想象。

--
Gfans非官方商店
http://www.cafepress.com/gfans

Cat

unread,
Jun 21, 2006, 9:57:42 PM6/21/06
to fa...@googlegroups.com
"被百度封杀,请在自己身上找原因。百度可以沟通,如果确实没有作弊行为,可以解封。"——以前曾经见过有帖子说,无辜被baidu封杀后baidu的人建议购买一两个月的竞价排名服务那样就能重新上榜,在不愿意购买竞价排名服务的情况下该站长选择了直接给¥3000要求取消封杀并且baidu接受了。对于此事真实性我不知道,不过这个Group的早期成员应该都看过那张帖的。

On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:

led ca

unread,
Jun 21, 2006, 10:40:09 PM6/21/06
to fa...@googlegroups.com
其实www.baidu.comwww.google.com都是美国人的公司,没必要争吵这些概念了,习惯什么用什么,也可以所有的都用一下,就像虽然我的签名是那样的,但是经常还是用windows+ie上来的。
--
乐观 达观 开朗
FreeBSD 6.0 STABLE  KDE3.4.3 firefox 1.5

Tang Jia

unread,
Jun 21, 2006, 8:34:40 PM6/21/06
to fa...@googlegroups.com
Hong Xiaowan wrote:
> 如果仅仅指搜索引擎的专业性,谷歌在内核上已经不如百度。
> 谷歌的危机已经不仅仅是在中国不服水土,而且在技术上也落后于百度。因为拼音语言分词简单,语法结构明晰,拼音语言的全文语义分析要比中文容易的多。如果现在百度介入其他语种的搜索,谷歌必然受到严重冲击。
> 我的帖子是善意的警告,我们不要独大的谷歌,也不要独大的百度,独大必作恶。谷歌现在中国不行,棒喝一下,千万不要以后在全球不行。
>
这位兄弟好象是说技术上的问题!看看百度的工程师,哪的?看看google的工程
师,哪的?你要真想从技术上说google输了的话,麻烦你多了解点软件行业再谈。OK

Hong Xiaowan

unread,
Jun 21, 2006, 10:11:17 PM6/21/06
to GFans
百度不会为3000元落下话柄。
这种流言用脚指头想想就可以知道如此荒谬。
解封,百度是不要钱的,你要花点时间和电话费。
Cat wrote:
> "被百度封杀,请在自己身上找原因。百度可以沟通,如果确实没有作弊行为,可以解封。"--以前曾经见过有帖子说,无辜被baidu封杀后baidu的人建议购买一两个月的竞价排名服务那样就能重新上榜,在不愿意购买竞价排名服务的情况下该站长选择了直接给¥3000要求取消封杀并且baidu接受了。对于此事真实性我不知道,不过这个Group的早期成员应该都看过那张帖的。

Hong Xiaowan

unread,
Jun 21, 2006, 10:22:14 PM6/21/06
to GFans
百度的技术超过谷歌,公共关系没有谷歌好。
看来百度也要向谷歌学习,技术是不重要的,关键要做一个好的演员。
> =惝界焮鐌踝?郫{雖?夗z{S蕳瓄 嗁 ?

Aaron Liang

unread,
Jun 22, 2006, 12:00:23 AM6/22/06
to fa...@googlegroups.com
你一方面说百度的技术超过谷歌,另一方面又说技术是不重要的,啥意思啊?

On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:

Hong Xiaowan

unread,
Jun 21, 2006, 10:42:21 PM6/21/06
to GFans
百度2005年营入为3960万美元,谷歌2005年营入为61.39亿美元,可见国际市场和国内市场的巨大差距。

所以,尽管在本土面临谷歌的压力,但是,李彦宏表示,将把眼光投向国际市场。

进攻是最好的防守!

Aaron Liang

unread,
Jun 22, 2006, 12:16:06 AM6/22/06
to fa...@googlegroups.com
整个一百度Fan,跑到这来骂Google。


On 6/21/06, Hong Xiaowan <hongx...@gmail.com> wrote:
百度2005年营入为3960万美元,谷歌2005年营入为61.39亿美元,可见国际市场和国内市场的巨大差距。

所以,尽管在本土面临谷歌的压力,但是,李彦宏表示,将把眼光投向国际市场。

进攻是最好的防守!

Qingyang Li wrote:
> 期待百度进入其他语种
>
> On 6/21/06, Guxq <gux...@gmail.com> wrote:
> >
> > 百度也在进步
> >
> >
> > On 6/21/06, Hong Xiaowan < hongx...@gmail.com> wrote:
> > >
> > > 谷歌老了,百度很危险
> > >
> > > 由于对百度和谷歌的pagerank很感兴趣,所以做了两个实验。
> > >
> > > 1.东关街和东圈门是扬州的双东民俗古巷游的两条风景线。2005-12-27,注册dongguanjie.comdongquanmen.com,用谷歌的blogger.com进行维护,尽可能转载了所有专业内容(包括江泽民传,因为江泽民小时侯曾经居住在双东地区),撰写了少量原创,同时在百度和谷歌进行登陆。
> > >
> > >
> > > 一天后,百度全站收录,并在七天后,列名第一页,"东关街"主题词搜索排第三,http://www.baidu.com/s?wd=%B6%AB%B9%D8%BD%D6&cl=3,"东圈门"主题词搜索排第一,http://www.baidu.com/s?wd=%B6%AB%C8%A6%C3%C5&cl=3
> > > 而直至2006年6月24日,在谷歌不用site;,就无法发现上述两个网站的网页。
> > > 2006-05-11注册xufei.info,主题超女许飞和吉他弹唱,转载了关于许飞专业性的内容,同时加了一份我写的吉他弹唱教材,该教材用了许飞晋级的曲目,2006年6月15日,"许飞"排名百度第十位,"吉他弹唱"排名百度第五位,"许飞吉他"排名百度第一位。在谷歌用site,仅发现一页。
> > >
> > > 2.2006-04-06注册magicalcrystal.com,英文网站,该网站以一种最新材料为主题,发现谷歌依然迟钝。
> > >
> > > 由此可见,谷歌的以外部联接为基础的排名系统有着致命的弱点,无法收录最新的的和最专业的内容,在谷歌中搜索到的往往都是过时的内容,看来谷歌不仅仅是不懂中文这么简单,恐怕英文也不是太懂。
> > >
> > >
> > > 可以猜测,百度的排名系统是以全文语义分析为基础的,这远远优于谷歌的以外部联接为基础的排名系统。
> > >
> > >
> > > 同时如果百度的排名系统是以全文语义分析为基础,将需要更多的精力来维护网站的主题内容以获得好的排名,将比谷歌的以外部联接为基础的排名系统更不容易作弊。
> > >
> > > 所以,百度很危险,一旦百度进入其他语种,谷歌的优势将不复存在。
> > >
> > > > >
> > >






--
Gfans非官方商店
http://www.cafepress.com/gfans

Guxq

unread,
Jun 22, 2006, 12:18:42 AM6/22/06
to fa...@googlegroups.com
不过他说的一些事情也是事实。
我们不应该在这里给他定性,
应该拿出实质的东西和他对抗。

 

Cat

unread,
Jun 22, 2006, 2:57:37 AM6/22/06
to fa...@googlegroups.com
Google和baidu赚的钱完全不是同一回事,Google靠的是AdSense,baidu靠的是竞价排名。从收入构成来说,Google是广告公司,baidu是搜索公司,既然从收入构成来说它们不是同行,那么对比收入也是无意义的。baidu并不见得拓展市场后就有实力进入广告领域,Google应该也不会愿意为了中国市场而引入竞价排名服务。
 
李开复最近有篇《中国Web 2.0的责任感——大胆假设小心求证》,我觉得我们也就应该"大胆假设小心求证"。对于主贴上说的,既然是楼主做过实验的了,那应该没问题,起码raw data都是正确的,只不过不同立场的人推出的结论可能不同。但是后面楼主的一句"百度的技术超过谷歌,公共关系没有谷歌好。",并没有提供任何证明材料和推导就下结论,这显然会导致更多人卷入争吵之中嘛。

kore.art

unread,
Jun 22, 2006, 2:33:04 AM6/22/06
to fa...@googlegroups.com
 
 
对于百度,我在google里找不到的时候才会去找它,
  然,
              百度里面信息多,但是也是垃圾居多.
              google的内核总比一个小小的百度强,何况他的垃圾少.
---------- 不知道大家能不能想想,百度如此快的搜索量,是否在打算监控整个中国互联网?何况近来g--f--w封锁时候,百度还没被封过

 
--
--
掌握全新资讯,探讨每天的动感体验,用商业来衡量价值,客户不是上帝,他们仅仅只是我们的衣食父母.
--------Name:kore  --Http://24-00.org

LepingBeta Zhang

unread,
Jun 22, 2006, 2:40:37 AM6/22/06
to fa...@googlegroups.com
百毒枪手,鉴定完毕

2006/6/22, Guxq <gux...@gmail.com>:

Hong Xiaowan

unread,
Jun 22, 2006, 4:09:11 AM6/22/06
to GFans
Dear Cat.
1.adwords是一种广告,竞价排名也是一种广告。谷歌adwords需要竞价,百度也有类似于adwords的广告产品。百度和谷歌都是靠广告作为主要收入,他们都是以搜索为主的网站。
2.关于百度的公共关系没有谷歌好,说的不准确,我在此道歉,百度的公共关系在政界和商界比谷歌好,对广大网民的公共关系需要改进。
Best regards

Cat wrote:
> Google和baidu赚的钱完全不是同一回事,Google靠的是AdSense,baidu靠的是竞价排名。从收入构成来说,Google是广告公司,baidu是搜索公司,既然从收入构成来说它们不是同行,那么对比收入也是无意义的。baidu并不见得拓展市场后就有实力进入广告领域,Google应该也不会愿意为了中国市场而引入竞价排名服务。
>
> 李开复最近有篇《中国Web 2.0的责任感--大胆假设小心求证》,我觉得我们也就应该"大胆假设小心求证"。对于主贴上说的,既然是楼主做过实验的了,那应该没问题,起码raw

mingfal

unread,
Jun 22, 2006, 4:28:39 AM6/22/06
to fa...@googlegroups.com
只想问一句,败毒给了你多钱?
--
我的blog:http://my.opera.com/mingfal

Hong Xiaowan

unread,
Jun 22, 2006, 4:20:31 AM6/22/06
to GFans
不要拿gfw和枪手来说事,请根据Guxq,不要给我定性,拿出实质的东西来和我论证。

Hong Xiaowan

unread,
Jun 22, 2006, 4:29:43 AM6/22/06
to GFans
1.我不知道百度的工程师哪的,谷歌的工程师哪的,但我知道抗美援朝,美国和其盟军,不得不和中国签定一个没有胜利的停战协议。
2.我不需要知道哪个饭店的师傅手艺更好,我只要知道哪个饭店的菜更美味。
3.同样,我不需要知道软件行业,百度有更好的用户体验,这就足够了。

Hong Xiaowan

unread,
Jun 22, 2006, 5:17:10 AM6/22/06
to GFans
没有钱,我是gfans,比较喜欢反思。
我的网站全部是用blogger来维护,所有的信箱转发到gmail。
在中国,很多人都认为谷歌是水土不服,我不这么认为。

我是做服装外贸的,我是服装设计师,六年来,对于各个搜索引擎,包括各种服装的搜索引擎,我都会根据我感兴趣的主题词用flashget定期下载。不是下载一部分,是下载所有。然后再建立数据库来研究趋势。

同样,在网站上挂谷歌的adsense,不是为了赚钱,而是为了寻找和了解我的竞争对手,寻找自身的弱点。然后再提升自己的服务。

谷歌的现状很好,但是所有走向衰败的企业都是在辉煌的时候没有发现自身的弱点,谷歌的模型从原理上来说是错误的,没有办法防止spam的攻击。

谷歌确实不如百度,我发这个贴并非没有根据。

Message has been deleted

量子公民

unread,
Jun 22, 2006, 5:55:29 AM6/22/06
to GFans
关于国际化:
百度数据中心至今仍不采用Unicode,仅支持GB2312,只能提供GB码内容搜索,
其强制中文繁->简转换使显示繁体成问题,解决这个之前做国际化极不容易

这一系列帖子实在逻辑混乱+_+

终极super

unread,
Jun 22, 2006, 7:16:22 AM6/22/06
to fa...@googlegroups.com
google也有竞价排名吧

终极super zhongjisuper
4361z0aa0-c5e93as0a66-8634jeb6e

终极super

unread,
Jun 22, 2006, 7:17:35 AM6/22/06
to fa...@googlegroups.com
这个不能这么问,因为有人会反过来问你......

终极super zhongjisuper
4361z0aa0-c5e93as0a66-8634jeb6e
----- Original Message -----
From: "mingfal" <fei8...@gmail.com>
To: <fa...@googlegroups.com>
Sent: Thursday, June 22, 2006 4:28 PM
Subject: Re: 谷歌老了,百度很危险


终极super

unread,
Jun 22, 2006, 7:22:34 AM6/22/06
to fa...@googlegroups.com
这个gb2312中的gb是不是国标码的意思?

终极super zhongjisuper
4361z0aa0-c5e93as0a66-8634jeb6e
----- Original Message -----
From: "量子公民" <airo...@gmail.com>
To: "GFans" <fa...@googlegroups.com>
Sent: Thursday, June 22, 2006 5:55 PM
Subject: Re: 谷歌老了,百度很危险


Cat

unread,
Jun 22, 2006, 7:36:45 AM6/22/06
to fa...@googlegroups.com
GB是国标。
 
Google有没有内部的竞价排名暂时不知道,但没有公开卖的。Google公开的说法是,所有可通过付费出现的结果都注明是"赞助商链接"出现在右侧,而如果既是赞助商链接又确实和搜索高度吻合则出现在搜索结果的上方(但还是会标明"赞助商链接")。同时一个关键字多赞助商链接的排名不仅仅由价格决定还由和关键字的吻合度以及用户的点击率决定。因为我没有用过AdWords服务,详细是如何的应该找用过的人出来说说。
 
另外,Google和AOL合作的时候AOL的排名上升,有人说这是Google内部调整了排名,但是否真的是这样没有人能证明。

 

Hong Xiaowan

unread,
Jun 22, 2006, 7:39:54 AM6/22/06
to GFans
1.关于代码,http://www.dongguanjie.com
http://www.dongquanmen.com
都是用的Unicode(utf-8),请你用东关街百度一下看看。或者东圈门用百度一下。你说的百度只能提供GB码内容搜索是完全不对的。
2.简化字转换成繁体字会有问题,原因在于简化字方案中合并了多个繁体字到一个简化字。问题不在百度。繁->简是不成问题的,你正好理解反了。
3.不一定非要采用Unicode,
数据中心也可以采用GB2312,源数据只要保持一一对应就可以,衍生数据可以通过程序自由转换,不要说繁转简,就是各个语种之间智能翻译也可以做到。
4.百度也收录了其他语言的网页,虽然搜索结果不多,但是相信这只是冰山的一角。

suse...@gmail.com

unread,
Jun 22, 2006, 8:57:31 AM6/22/06
to fa...@googlegroups.com
en,在除了某些特定领域中,百度的搜索结果比起google似乎对我来说有较小的命中率...
咦,似乎百度的图片搜索换了算法了?还是人工干预了,第一页竟然出现了真的马...而不是马云或者马化腾?
大家在想想别的关键词试试是否算法有了改进:)

On 6/22/06, Hong Xiaowan < hongx...@gmail.com> wrote:

Hong Xiaowan

unread,
Jun 22, 2006, 8:15:13 AM6/22/06
to GFans
谷歌的adwords的规则是商业秘密,只能大致猜测:
1.对一个指定的关键词,价格高的显示在前;
2.如果点击率超过指定比例,会调低价格或封顶;
3.同ip的显示和点击率在指定的一个时间段的价格会按一种函数递减;
对于aol这样的网站来说,和谷歌合作,对双方都是很有好处的。可以相互带来流量。其流量的差异和增加的流量对各自的战略意义应该是制作合作条款的依据。

Cat wrote:
> GB是国标。
>
> Google有没有内部的竞价排名暂时不知道,但没有公开卖的。Google公开的说法是,所有可通过付费出现的结果都注明是"赞助商链接"出现在右侧,而如果既是赞助商链接又确实和搜索高度吻合则出现在搜索结果的上方(但还是会标明"赞助商链接")。同时一个关键字多赞助商链接的排名不仅仅由价格决定还由和关键字的吻合度以及用户的点击率决定。因为我没有用过AdWords服务,详细是如何的应该找用过的人出来说说。
>
> 另外,Google和AOL合作的时候AOL的排名上升,有人说这是Google内部调整了排名,但是否真的是这样没有人能证明。
>
>
> On 6/22/06, 终极super <zhongj...@gmail.com> wrote:
> >
> > google也有竞价排名吧
> >
> > 终极super zhongjisuper
> > 4361z0aa0-c5e93as0a66-8634jeb6e
> > ----- Original Message -----
> > From: "Cat" <cat...@gmail.com>
> > To: <fa...@googlegroups.com>
> > Sent: Thursday, June 22, 2006 2:57 PM
> > Subject: Re: 谷歌老了,百度很危险
> >
> >
> > >
> > Google和baidu赚的钱完全不是同一回事,Google靠的是AdSense,baidu靠的是竞价排名。从收入构成来说,Google是广告公司,baidu是搜索公司,既然从收入构成来说它们不是同行,那么对比收入也是无意义的。baidu并不见得拓展市场后就有实力进入广告领域,Google应该也不会愿意为了中国市场而引入竞价排名服务。
> > >
> > > 李开复最近有篇《中国Web 2.0的责任感-
> > -大胆假设小心求证》,我觉得我们也就应该"大胆假设小心求证"。对于主贴上说的,既然是楼主做过实验的了,那应该没问题,起码raw

Leegorous

unread,
Jun 22, 2006, 9:34:27 AM6/22/06
to fa...@googlegroups.com
确实,baidu在中文语义分词,分析方面确实比google要好一点。
在搜索方面不仅仅是收录量,更新速度,排名方面的比较,还有垃圾信息的识别,过滤,对信息的智能分析,排序等等方面的。光收录,作简单排序应该花不了太多时间的,但是要分析,对比这些信息就必须花多好几倍的时间,google所面对的是全球的网页,其信息量巨大可想而知,要对这么多信息分门别类的管理和分析是相当相当重的负担,所以我理解google爬网慢的一个方面。站主主动建立sitemap是帮助google爬网的工具,但是它什么时候起作用这还不是很清楚。
baidu收录量也不少,但是你看国内的网页有不少一部分是垃圾中的垃圾,甚至纯粹是在骗搜索引擎的,而对这些垃圾内容baidu的分析过滤似乎并不到位。
技术上我觉得google更加成熟一点。

On 6/22/06, Hong Xiaowan <hongx...@gmail.com> wrote:


--
My Blog:
http://leegorous.net/blog

量子公民

unread,
Jun 22, 2006, 10:21:06 AM6/22/06
to GFans
Hong Xiaowan wrote:
> 1.关于代码,http://www.dongguanjie.com
> http://www.dongquanmen.com
> 都是用的Unicode(utf-8),请你用东关街百度一下看看。或者东圈门用百度一下。你说的百度只能提供GB码内容搜索是完全不对的。
> 2.简化字转换成繁体字会有问题,原因在于简化字方案中合并了多个繁体字到一个简化字。问题不在百度。繁->简是不成问题的,你正好理解反了。
> 3.不一定非要采用Unicode,
> 数据中心也可以采用GB2312,源数据只要保持一一对应就可以,衍生数据可以通过程序自由转换,不要说繁转简,就是各个语种之间智能翻译也可以做到。
> 4.百度也收录了其他语言的网页,虽然搜索结果不多,但是相信这只是冰山的一角。

那是因为转码,在数据中心里还是GB码...
百度数据中心和Web搜索只支持GB码,索引GB/ISO-8859-1外任何编码的内容全要转码

蜘蛛检索、数据中心和Web搜索均可用不同编码,只要它能转码...
于是国际化后,装备一个服务器场,专门把全球网页都转成GB码:)

日文/英文在GB中好解决,其他语言...试一下百度
韩文:대한민국‎
俄文:Президент России
(意思是"俄联邦总统"网站,找www.kremlin.ru)

转码需要巨大的运算能力,再加上GFW,百度只能有选择收录部分网站,至少其英文内容目前不是冰山

最终的问题:GFW...如果蜘蛛索引"非法内容",政府不会饶了百度...
因此真正面向国际、不过滤的蜘蛛要放到国外...似乎除了转码服务器场还可能再掏一笔钱...

当然,百度继续在蜘蛛做过滤就不需要喽:)

Hong Xiaowan

unread,
Jun 22, 2006, 10:45:10 AM6/22/06
to GFans
1.从下面的结果来看,谷歌20命中3个,15分,百度命中14个,70分
2.谷歌的规则里似乎少了词库,对于马的搜索,应该有马的近义词和各种习惯叫法词库,同时在和其他中国姓距离2-8个字符时要添加非马的权数,同时要参考马的禁止词库,如马自达等。
3.中文的分词和鉴别以及语义判断比拼音语言复杂的多,需要不断的充实知识库,百度的系统应该类似于深蓝的系统,可以通过不断的更新知识库。
4.百度的新闻图片全部没有命中,可能没有联结上网页图片的知识库。这是一个bug。

http://images.google.com/images?q=%E9%A9%AC&hl=zh-CN&btnG=%E6%90%9C%E7%B4%A2%E5%9B%BE%E7%89%87

1-马 中国食疗网 800 x 600 像素 - 55k - jpg www.shiliao.com.cn
0-《桃花运》开机马俪文葛优等主创齐亮相 ...550 x 825
像素 - 38k chinanews.sina.com
0-《桃花运》开机马俪文葛优等主创齐亮相 ...550 x 825
像素 - 53k chinanews.sina.com
0-对比马自达6轿跑车VS凯美瑞 450 x 328 像素 - 28k
auto.sina.com.cn


0-对比马自达6轿跑车VS凯美瑞 450 x 328 像素 - 27k
auto.sina.com.cn
0-"马自达6"大幅降价 450 x 338 像素 - 18k
www.nmg.xinhuanet.com
0-多维追击:「连马密会」马请连传话胡锦涛 675 x 522
像素 - 35k
www7.chinesenewsnet.com 0-世乒赛:中国女队旗开得胜男队"马"到成功
400 x 283 像素 - 22k sports.people.com.cn


0-连马昨密会马请连向大陆传话 300 x 411 像素 - 52k
www.chinadaily.com.cn
0-马6要"跑"起来了(图)500 x 316 像素 - 42k
auto.people.com.cn
2-马背110 :守卫雪域边疆的平安 500 x 489 像素 - 55k
www.xz.xinhuanet.com
3-马背110 :守卫雪域边疆的平安 363 x 500 像素 - 78k
www.xz.xinhuanet.com


0-"长安福特没空生产" 马自达3复产日期难定 500 x 340
像素 - 71k auto.chinanews.com.cn
0-亲民党发起大规模抗议活动马宋要求陈水 ...418 x 500
像素 - 33k ah.people.com.cn
0-亲民党发起大规模抗议活动马宋要求陈水 ...418 x 500
像素 - 92k tw.people.com.cn
0-连战今与家人在祖籍地漳州龙海马崎村祭祖 500 x 341
像素 - 34k www.hi.chinanews.com.cn


0-连战今与家人在祖籍地漳州龙海马崎村 ...500 x 336
像素 - 48k www.hb.chinanews.com.cn
0-连战今与家人在祖籍地漳州龙海马崎村祭祖 500 x 288
像素 - 37k www.hi.chinanews.com.cn
0-马3最早6月底复产预计8月才能交付 ...400 x 300 像素 -
10k www.nmg.xinhuanet.com
0-国内首款轿跑车马自达6今日上市 400 x 300 像素 - 40k
news.chinacars.com

http://image.baidu.com/i?ct=201326592&cl=2&lm=-1&tn=baiduimage&pv=&word=%C2%ED&z=0

0-1024x768 168k jpg 仙界圣诞惊喜多,刀二、神鬼促销来...
1-1024x768 78k jpg 马
0-2032x1524 612k jpg 马.jpg
2-791x864 132k jpg 马图片列表-原创图片-大千世界图片...


3-734x864 134k jpg 马图片列表-原创图片-大千世界图片...
4-620x875 72k jpg 着色网页 马 - 免费可印上色图片 马
5-665x841 112k jpg 马图片列表-原创图片-大千世界图片...
6-618x874 28k jpg 着色网页 马 - 免费可印上色图片 马


7-1116x1504 384k jpg 马
8-1576x1772 134k jpg 马
9-1149x850 112k jpg 马
10-898x862 74k jpg 马


11-1927x977 886k gif 马
12-1210x750 118k jpg 成扇
13-844x1812 100k jpg 马
14-600x600 68k jpg 马

0-2006-6-22 17:31 国际 新浪 玻利维亚艾马拉人庆祝新年
0-2006-6-22 17:04 财经 搜狐
"放学术腐败行为一马"之后的纵...
0-2006-6-22 16:38 国内 新华网福建频道
马英九电视演讲四方面...
0-2006-6-22 16:38 国内 新华网福建频道
马英九电视演讲四方面...

> --
> 珍爱生命,拒绝光明牛奶!

Marcher

unread,
Jun 22, 2006, 10:52:42 AM6/22/06
to fa...@googlegroups.com
没完了吧你……
自己找Google反馈去,跟这里说半天又没人知道。
搞这么专业还不去Google应聘。

 

量子公民

unread,
Jun 22, 2006, 11:04:46 AM6/22/06
to GFans
Hong Xiaowan wrote:
> 1.从下面的结果来看,谷歌20命中3个,15分,百度命中14个,70分
> 2.谷歌的规则里似乎少了词库,对于马的搜索,应该有马的近义词和各种习惯叫法词库,同时在和其他中国姓距离2-8个字符时要添加非马的权数,同时要参考马的禁止词库,如马自达等。
> 3.中文的分词和鉴别以及语义判断比拼音语言复杂的多,需要不断的充实知识库,百度的系统应该类似于深蓝的系统,可以通过不断的更新知识库。
> 4.百度的新闻图片全部没有命中,可能没有联结上网页图片的知识库。这是一个bug。

若是指"马"这种动物,那么不妨用繁体:
http://images.google.com/images?hl=en&safe=off&as_q=%E9%A6%AC
命中多少?...呵呵 :)

可以看出图片主要来自日本、台湾...
大概是因为GFW对蜘蛛的屏蔽使Google很难检索到中国大陆的图片所致

希望Google加强图形搜索项目的中文繁简转换能力...
总之,因为不受GFW干扰,理论上百度蜘蛛能检索到的资源多于Google

发条狐狸

unread,
Jun 22, 2006, 12:32:44 PM6/22/06
to fa...@googlegroups.com
可能楼主想去百度。
--
我是发条狐狸,有着发条的狐狸。

Aaron Liang

unread,
Jun 22, 2006, 3:28:09 PM6/22/06
to fa...@googlegroups.com
百度有更好的用户体验?那是在GFW的帮助下。如果没有GFW,你绝对不会说这种话的。
如果不信,你可以到美国试试看,到底百度和Google哪个的用户体验更好。

 
On 6/22/06, Hong Xiaowan <hongx...@gmail.com> wrote:

suse...@gmail.com

unread,
Jun 22, 2006, 10:18:54 PM6/22/06
to fa...@googlegroups.com
事实上,大约在三个月以前,搜索马这个关键字,在百度的图片搜索里至少第二页还没有出现一个关于这种动物的图片,所以我感到惊奇的是,如果不是人工手工干预的话,可能百度是有了某方面的改进...而同时期的google在这方面稍好些.这个也不能说明很多问题,只是说在结果的命中率上来说,google在那时比百度要高,至少在这个关键字上.同样的,很多关键字在google的命中率比百度要稍高那么一点点...如果你是在使用互联网技术而不是娱乐宽带的话 :)
在结果的过滤比较上似乎google也稍胜一筹,当然你可以说我这个结果并不客观..:)这里是google-fans :)

--
珍爱生命,拒绝光明牛奶!

量子公民

unread,
Jun 22, 2006, 3:28:32 PM6/22/06
to GFans
量子公民 wrote:
> 那是因为转码,在数据中心里还是GB码...
> 百度数据中心和Web搜索只支持GB码,索引GB/ISO-8859-1外任何编码的内容全要转码
>
> 蜘蛛检索、数据中心和Web搜索均可用不同编码,只要它能转码...
补充一下,还有其他可能性:

百度可能保留原始的Big5/Shift-JIS等非GB码数据,Web搜索时自动做GB->Big5等转码,
产生GB、Big5等多重请求,若有繁体再转码合并到GB,这也是解决GB码缺陷的方式之一...

Hong Xiaowan

unread,
Jun 22, 2006, 11:56:49 PM6/22/06
to GFans
以文本为基础的图片搜索不可能很精确,如果对图片进行分析,可以参考指纹鉴别来进行图片和主题词挂钩,那样命中率会高一点。
gfw不能屏蔽蜘蛛,要绕过gfw,对谷歌来说,很容易。

Hong Xiaowan

unread,
Jun 23, 2006, 12:07:37 AM6/23/06
to GFans
百度一直在前进。只有三个月的时间,谷歌在马的图片搜索就远远落后了。
不因为你是gfans就可以说你的结果不客观,我也是gfans。
拿数据说话最客观。
我发现谷歌不行已经很久了。谷歌已经变成一个庞大而衰老的企业,不再是充满活力。

suse...@gmail.com wrote:
> 事实上,大约在三个月以前,搜索马这个关键字,在百度的图片搜索里至少第二页还没有出现一个关于这种动物的图片,所以我感到惊奇的是,如果不是人工手工干预的话,可能百度是有了某方面的改进...而同时期的google在这方面稍好些.这个也不能说明很多问题,只是说在结果的命中率上来说,google在那时比百度要高,

量子公民

unread,
Jun 23, 2006, 12:33:35 AM6/23/06
to GFans
Hong Xiaowan wrote:
> 以文本为基础的图片搜索不可能很精确,如果对图片进行分析,可以参考指纹鉴别来进行图片和主题词挂钩,那样命中率会高一点。
> gfw不能屏蔽蜘蛛,要绕过gfw,对谷歌来说,很容易。
回应搜索结果命中"马"动物图片的原因:
http://images.google.com/images?hl=en&safe=off&as_q=%E9%A6%AC


GFW是双向过滤系统,国外到中国大陆的连接同样被拦截,用过代理就会明白它到底有多伟大...
看这些搜索结果:
http://www.baidu.com/s?wd=GFW+%22%CB%AB%CF%F2%B9%FD%C2%CB%22
http://forum.ikaka.com/topic.asp?board=54&artid=8105690

"对谷歌来说,很容易。"有趣,真的很有趣:)
Google蜘蛛深受GFW其害...

Hong Xiaowan

unread,
Jun 23, 2006, 2:23:24 AM6/23/06
to GFans
过滤不仅仅是合法的需要,而且是客户满意的需要,根据不同的客户,能够推送不同的搜索结果。这样的针对性更强。

Hong Xiaowan

unread,
Jun 23, 2006, 3:33:16 AM6/23/06
to GFans
Dear Aaron
你的名字和我的一个客户一样。相当数量的英文网站被gfw,我很感谢gfw给了我最好的客户体验。为了更完全的收集相关信息,我很喜欢通过代理服务器来下载搜索联结。我的代理服务器是特殊的,是我的客人在电脑里装的只供我用的。通过各个国家的客人,我发现很多网站对于不同ip的推送是不一样的。

所以,我认为,不要找gfw这样的借口来掩盖谷歌技术上的致命弱点。

早在3年前我们就发现了谷歌的迟钝,即使在美国也是一如既往的迟钝,信息是不确定性的消除,信息有时效性。对我们来说,谷歌只是一本比不上wiki的教科书。

而百度可以有最新的信息,有的往往是一两个小时就能百度到。我们往往通过百度找到最新中文信息,再去找相关英文信息。

这是谷歌,没有相关结果
http://www.google.com/search?hl=zh-CN&q=%E8%B0%B7%E6%AD%8C%E8%80%81%E4%BA%86%EF%BC%8C%E7%99%BE%E5%BA%A6%E5%BE%88%E5%8D%B1%E9%99%A9&btnG=Google+%E6%90%9C%E7%B4%A2&meta=lr%3Dlang_zh-CN%7Clang_zh-TW
这是百度,两个小时即收录
http://www.baidu.com/s?wd=%B9%C8%B8%E8%C0%CF%C1%CB%A3%AC%B0%D9%B6%C8%BA%DC%CE%A3%CF%D5&cl=3

> --
> Gfans非官方商店
> http://www.cafepress.com/gfans

Hong Xiaowan

unread,
Jun 23, 2006, 3:56:31 AM6/23/06
to GFans
Dear 量子公民
不要用繁体来替谷歌掩盖,难道繁体的马是马,简体的就不是马了?

我用的就是代理,双向过滤对我来说没有用,可以远程用网站下载软件下载,然后打包发回国内。谷歌在国内一定有自己养的肉鸡,怎么可能怕封锁。
如果这样的封锁都突破不了,还谈什么技术高超。

不仅gfw会封锁,有的服务器会自动的对某些ip段封锁,所以不要再那gfw来说事。

墙高万丈,挡的不来之人。

Hong Xiaowan

unread,
Jun 23, 2006, 4:01:24 AM6/23/06
to GFans
难道繁体的马是马,简体的就不是马了?

我用的就是代理,双向过滤对我来说没有用,可以远程用网站下载软件下载,然后打包发回国内。谷歌在国内一定有自己养的肉鸡,怎么可能怕封锁。
如果这样的封锁都突破不了,还谈什么技术高超。

不仅gfw会封锁,有的服务器会自动的对某些ip段封锁,所以不要再那gfw来说事。

墙高万丈,挡的不来之人。

量子公民

unread,
Jun 23, 2006, 4:45:23 AM6/23/06
to GFans
无奈啊...现在连楼主自己也开始岔开话题了^_^...

http://www.williamlong.info/archives/451.html
希望能帮助理解Google蜘蛛为何一定用PageRank,绝不疯狂抢掠网站数据的原因

http://xys.3322.org/forum/db/149/16.html

Cybersome

unread,
Jun 23, 2006, 7:57:29 AM6/23/06
to fa...@googlegroups.com
google确实算歧视我到位了
搜索cybersome他把wikipedia的个人资料,flickr的资料界面都放在 blog.cybersome.com 的前面
甚至把 blog.cybersome.com 烧制的feedburner的界面放在网站前面

AND,,,
看图:
头两个链接: gfans.org/2006/06/10/google_adsense.html
solidot.org/article.pl?sid=06/06/10/1140232&from=rss
都是我写的,而且原文中也有指向出处的链接:
http://blog.cybersome.com/2006/06/google-adsense-click-to-play-video-ads
既然这样为什么还会把我的链接排在后面?

关于我的网站所收录的界面竟然是rss的
blog.cybersome.com/2006/06/10/google-adsense-click-to-play-video-ads/feed/
(固定链接我刚修改了)

当初收录我的个人站点就很慢,申请gmail for domain也被卡住不通过,刚才搜索一下又碰到这样的事,明摆着对我歧视阿!!!


--
Sincerely,
Cybersome @ http://cybersome.com/
New Wordpress Blog - http://blog.cybersome.com/
cXNA - http://cxna.cybersome.com/

2006-6-23 19.11.14.jpg

Cat

unread,
Jun 23, 2006, 8:44:22 AM6/23/06
to fa...@googlegroups.com
Google虽然发布新产品时能够给人带来惊喜,但技术发展方面可能有点过度关注技术而非应用了,那些博士可能在干些为技术而技术的事情。另一方面,Google的政策也在支持他们这样做,对外说不看股民脸色做事,对内是"把项目当作泥土向墙上扔看看哪个能粘住"。所以搜索引擎改善进度落后,或者改善的地方不是大多数普通用户想要的,这是正常。
 
另外一件事,就是Google从收入构成来说是"广告公司"从主要服务来说是"搜索公司"但他自己声称的本质却是"信息公司",它的目标是"改变世界上信息相互联系的方式",所以Google所做的很多事情企业内和用户对其的评价(evaluate)可能非常不同。企业内可能认为这是向目标迈进的一步,用户可能觉得是一个粘不上墙的项目。

Cybersome

unread,
Jun 23, 2006, 12:22:34 PM6/23/06
to fa...@googlegroups.com
p.s.
cat

OCLC Online Computer Library Center?

i like ur blog and added a link to http://purl.oclc.org/NET/cathsfz in my blog

Cybersome

unread,
Jun 23, 2006, 1:33:24 PM6/23/06
to fa...@googlegroups.com
我还是认为google爬虫懒

baidu疯狂的抓毕竟也是要有足够强的硬件支持的

当然baidu仅面向中文,
但我的英文站google抓得也很懒,流量都是msn&yahoo带过去的

google只对大站有利,这样可能更符合搜索者心理,符合做耍流氓的大站的心理

Message has been deleted

Hong Xiaowan

unread,
Jun 23, 2006, 9:24:05 AM6/23/06
to GFans
没有办法,只会拿gfw说事。
Message has been deleted

Hong Xiaowan

unread,
Jun 23, 2006, 10:44:51 AM6/23/06
to GFans
谷歌的pagerank是一种伪科学,它人为的根据伪科学的系统剥夺了网站的平等的被选择权。
同时又由于自身系统的原理缺陷,使得作弊横行。

你所推荐的文章我看了,正是因为"没有网页级别的网站,Google则坚决不去收录",不仅剥夺了网站的平等的被选择权,也剥夺了我们对最新信息的了解权。

这就是谷歌的逻辑,剥夺了你的权利还要告诉你它是公正的,不作恶的。

百度的核心是语义分析,所以不会惧怕收录垃圾站而拒绝新网站,它知识努力把最新的,最匹配的信息推送给你。

Hong Xiaowan

unread,
Jun 23, 2006, 11:09:39 AM6/23/06
to GFans
你讲的非常有道理,谷歌面临产业分工缺失。
在服装界,有调研,设计,生产,销售等等环节,而谷歌,虽然也有调研,设计,生产,销售等等环节,但谷歌只是一个oem的服装厂,里面有手艺最好的机缝工,却要生产出一堆不合身的衣服逼着我们套上。
用最好的机缝工,让他们去研究什么衣服会最好卖,让他们去设计款式,让他们去搞市场营销!
这在服装界最荒谬的事情,在谷歌确是最正常的。
谷歌可能是一个成功的网站,但是绝对不是一个终结者,谷歌,将可能是又一个倒在彼得原理下的过客。

Hong Xiaowan

unread,
Jun 23, 2006, 11:49:52 AM6/23/06
to GFans
谷歌确实存在歧视,不尊重原创,你知道怎样搞一个原创站点吗?拷贝网站,放在pangrank高的网页上,然后这个原创网站就可能在谷歌中消失。

同时,由于"没有网页级别的网站,Google则坚决不去收录",所以,这类网页的原创,一旦被pangrank高的网页抄袭,李逵就变成了李鬼,李鬼也就变成了李逵。

Message has been deleted

量子公民

unread,
Jun 23, 2006, 1:54:02 PM6/23/06
to GFans
Cybersome wrote:
> 我还是认为google爬虫懒
> baidu疯狂的抓毕竟也是要有足够强的硬件支持的
> 当然baidu仅面向中文,
> 但我的英文站google抓得也很懒,流量都是msn&yahoo带过去的
> google只对大站有利,这样可能更符合搜索者心理,符合做耍流氓的大站的心理
既然Google不疯狂抢掠网站数据,那相对百度"懒"是肯定的了

对啊,任何大站都是耍流氓得来的PageRank:)

量子公民

unread,
Jun 23, 2006, 2:46:30 PM6/23/06
to GFans
Hong Xiaowan wrote:
> 难道繁体的马是马,简体的就不是马了?
> 我用的就是代理,双向过滤对我来说没有用,可以远程用网站下载软件下载,然后打包发回国内。谷歌在国内一定有自己养的肉鸡,怎么可能怕封锁。
> 如果这样的封锁都突破不了,还谈什么技术高超。
> 不仅gfw会封锁,有的服务器会自动的对某些ip段封锁,所以不要再那gfw来说事。
> 墙高万丈,挡的不来之人。
Google能抓到的中国大陆图片太少了...没有繁体搜寻困难...

请求"谷歌在国内一定有自己养的肉鸡"的来源...

引用(2002年):
http://www.ciscofan.com/cgi-bin/bbs/printpage.cgi?forum=8&topic=538
“我们还会发现一个问题,那就是Google的搜索结果,变得越来越差,而其中我们可以发现,只是国内网页的搜索结果越来越差,而且还会越来越少。这是为什么呢?呵呵,注意观察某些会记录访问者IP的网页。我们就会发现其中的秘密。crawler.googlebot.com,是的,正是googlebot的机器人。googlebot机器人的某些特征被抓到后,就可以对其进行有限量的抓取或者不让其进行抓取,例如只对几个官方网站进行更新,其它的网页信息都抓不回去。进一步的去想,利用这个机器人甚至还可以发现潜藏在国内网站内部的不良信息。”

您是一个人穿墙,不需要很多资源,借用别人的服务器加密,绝不影响工作娱乐:)
蜘蛛,每天爬走远远超过GB级的数据,带宽要求极高,需异常稳定的网络环境,这用简单技术不易解决

穿墙大法如下:)
·Google在美国,用肉鸡肯定是非法的,其性能、稳定性很难保障
·轻量级加密软件,借别人零散的带宽,网络稳定性同样无法保证
·自设代理,最好用硬件级加密设备,
可这在中国很不安全,我国能随时施加影响
最后...
·把蜘蛛放到中国,像Yahoo一样和政府合作.可数据怎么传回美国呢...
要不再把Web服务器场和数据中心都挪窝到中国:)

正是因为墙高万丈,细微砖缝才使大众自由穿梭高墙内外,而那些庞然大物们不挖大洞怎能穿墙...
目前Google蜘蛛受到极大限制...让蛛网半死不活,让那些蜘蛛玩完,让那Google玩完^_^

Aaron Liang

unread,
Jun 23, 2006, 7:11:30 PM6/23/06
to fa...@googlegroups.com
怎么连伪科学都出来了,你骂Google上瘾啊?!别告诉我你打算明天说Google是邪教,后天说两位创始人是疯子......

On 6/23/06, Hong Xiaowan <hongx...@gmail.com> wrote:

Hong Xiaowan

unread,
Jun 23, 2006, 10:00:33 PM6/23/06
to GFans
1."自己养的肉鸡"是指自己投资设的傀儡服务器。不是通过黑客方法控制的肉鸡。
在商言商,谷歌能够搞出执照门,当然也可以搞出肉鸡门,毕竟这样的肉鸡"可以"做到不犯法。
数据加密打包,gfw是没有办法的。
2.目前,gfw似乎不仅仅是双向过滤,在国内对国内服务器的访问也被过滤,我在国内的虚拟主机无法前段时间无法访问,是因为服务器有违禁内容,整个被封。在这样的机制下,百度的蜘蛛也不可能抓到到违禁内容。而且由于蜘蛛的存在,等于帮了gfw的忙,一有违禁内容,蜘蛛没有得到内容,gfw会第一时间知道。
3.所以,现在在大陆设肉鸡,已经没有意义。
4.而且,gfw已经有能力封https:,原理是一旦有https:请求,gfw将作为代理服务器,先行下载,然后根据内容自动进行封杀。

其实,不去搞违禁内容,gfw是不可能封杀的。思科已经开发出这样的系统,就是只对指定的url封锁,不会对整站和ip封锁。原理同https:封锁。

累就一个字。

量子公民 wrote:
> Hong Xiaowan wrote:
> > 我用的就是代理,双向过滤对我来说没有用,可以远程用网站下载软件下载,然后打包发回国内。谷歌在国内一定有自己养的肉鸡,怎么可能怕封锁。

> > 墙高万丈,挡的不来之人。
> 请给出"一定有自己养的肉鸡"的来源...
>
> 引用:
> http://www.oixiaomi.net/googleg.html
> "我们还会发现一个问题,那就是Google的搜索结果,变得越来越差,而其中我们可以发现,只是国内网页的搜索结果越来越差,而且还会越来越少。这是为什么呢?呵呵,注意观察某些会记录访问者IP的网页。我们就会发现其中的秘密。crawler.googlebot.com,是的,正是googlebot的机器人。googlebot机器人的某些特征被抓到后,就可以对其进行有限量的抓取或者不让其进行抓取,例如只对几个官方网站进行更新,其它的网页信息都抓不回去。"(岑之巍)
>
> 您一人穿墙的技术非常容易,用别人的服务器+小规模加密不会影响工作娱乐:)
> 但蜘蛛需要高得多的运算能力及带宽...至少网络环境要异常稳定
>
> Google在美国,用肉鸡是非法的,还会有泄密问题;
> 小规模破网软件,带宽、性能都不够用,网络不稳定;
> 专门在中国设蜘蛛肯定会受政府控制,Yahoo是个好例子;
>
> 怎么把不加密的数据穿墙传回美国呢...
> 硬件级安全服务器穿墙同样可能受政府影响...要不再把Web服务器群、数据中心都搬到中国来:)
>
> 于是目前GoogleBot与2002年相比,受到的限制还在继续增加...
>
> 重复:简体查不到主要是因为Google的抓取被GFW限制

量子公民

unread,
Jun 24, 2006, 12:13:34 AM6/24/06
to GFans
Hong Xiaowan wrote:
> 谷歌的pagerank是一种伪科学,它人为的根据伪科学的系统剥夺了网站的平等的被选择权。
> 同时又由于自身系统的原理缺陷,使得作弊横行。
> 你所推荐的文章我看了,正是因为"没有网页级别的网站,Google则坚决不去收录",不仅剥夺了网站的平等的被选择权,也剥夺了我们对最新信息的了解权。
> 这就是谷歌的逻辑,剥夺了你的权利还要告诉你它是公正的,不作恶的。
> 百度的核心是语义分析,所以不会惧怕收录垃圾站而拒绝新网站,它知识努力把最新的,最匹配的信息推送给你。
对,新站点的PageRank永远不会提高,名气大了+链接增多PageRank也永远都是0...
做了大量垃圾SEO的网站绝不会被Google的全自动程序封杀,永远都有高高的PageRank:)

Google没有任何语义分析,没有智商:)
http://www.sinowish.com/?p=11

Logic and Magic...
http://www.xdanger.com/2006/04/13/000044.html

引用:
“政策限制。其实这应该放在第一条。搜索时一不小心就被GFW挡了,然后5分钟刷不出Google,网页快照也一辈子打不开,还不时地让你连不上任何*.google.com,普通用户谁受得了。哦,原来这才是Baidu的核心竞争力。”

GFW已成为我国"国家标准海关",如果不考虑它没必要在中国运营,或者被GFW玩完后唱山歌:"二十年后,又是一条好汉!!!":)

量子公民

unread,
Jun 24, 2006, 12:16:37 AM6/24/06
to GFans
Cybersome wrote:
> google确实算歧视我到位了
> 搜索cybersome他把wikipedia的个人资料,flickr的资料界面都放在 blog.cybersome.com 的前面
> 甚至把 blog.cybersome.com 烧制的feedburner的界面放在网站前面
首先需要考虑的就是Google的PageRank...挑选几个靠前的网站...


gfans.org,PageRank为5:
http://www.123cha.com/google_pagerank/index.php?url=gfans.org

solidot.org,PageRank也为5:
http://www.123cha.com/google_pagerank/index.php?url=solidot.org

kenwong.cn,PageRank为4:
http://www.123cha.com/google_pagerank/index.php?url=www.kenwong.cn

最后,你的blog.cybersome.com,PageRank值为2:
http://www.123cha.com/google_pagerank/index.php?url=blog.cybersome.com

我想不用再多解释什么了:)...Google对被链接数量少的网站一向如此,尤其是新兴Blog

但随Blog知名度提高,Traceback增多,PageRank将自动上升,
随后被收录页面量、排名都会更好...您名气大了就会靠前的^_^

Aaron Liang

unread,
Jun 24, 2006, 12:53:19 AM6/24/06
to fa...@googlegroups.com
能否定义一下这里"违禁"的含义?

On 6/23/06, Hong Xiaowan <hongx...@gmail.com> wrote:
Gfans非官方商店
http://www.cafepress.com/gfans

量子公民

unread,
Jun 24, 2006, 1:39:15 AM6/24/06
to GFans
Hong Xiaowan wrote:
> 1."自己养的肉鸡"是指自己投资设的傀儡服务器。不是通过黑客方法控制的肉鸡。
> 在商言商,谷歌能够搞出执照门,当然也可以搞出肉鸡门,毕竟这样的肉鸡"可以"做到不犯法。
> 数据加密打包,gfw是没有办法的。
> 2.目前,gfw似乎不仅仅是双向过滤,在国内对国内服务器的访问也被过滤,我在国内的虚拟主机无法前段时间无法访问,是因为服务器有违禁内容,整个被封。在这样的机制下,百度的蜘蛛也不可能抓到到违禁内容。而且由于蜘蛛的存在,等于帮了gfw的忙,一有违禁内容,蜘蛛没有得到内容,gfw会第一时间知道。
> 3.所以,现在在大陆设肉鸡,已经没有意义。
> 4.而且,gfw已经有能力封https:,原理是一旦有https:请求,gfw将作为代理服务器,先行下载,然后根据内容自动进行封杀。
> 其实,不去搞违禁内容,gfw是不可能封杀的。思科已经开发出这样的系统,就是只对指定的url封锁,不会对整站和ip封锁。原理同https:封锁。
ps:请看完回复:
http://groups.google.com/group/fans/msg/6c8e51cb1575860d?dmode=print

傀儡服务器目标太大.一个人加密容易,蜘蛛服务器群整体套加密层,穿墙挖出的大洞会非常明显.

国内网站出事大部分是因为备案后我国查网站容易的多了...
目前GFW仅存在于国际出口网关上,如果在百度搜FLG也出现TCP-Reset,才能确认省市级也有过滤.

"不去搞违禁内容,gfw是不可能封杀的。"这句话比较有趣,呵呵:)

GFW这位功夫王还是很伟大的:)

妖精の瞳™

unread,
Jun 24, 2006, 2:04:06 AM6/24/06
to fa...@googlegroups.com
原来是非IT业的, 那样对BAIDU不了解也能理解了.
并非我们不支持国产的, 也并非我们崇洋媚外...
我们支持国产, 但, 想百度, YAHOO助手(前3721)这样的国产, 就算世界上的国产品牌都消失了, 只剩这两根独苗, 我也不会支持他们! 他们是中国的耻辱, 而并非光荣. 当然, 如果人们都不是把流氓和无耻当作一种光荣的话...

 
On 6/22/06, Hong Xiaowan <hongx...@gmail.com> wrote:
没有钱,我是gfans,比较喜欢反思。
我的网站全部是用blogger来维护,所有的信箱转发到gmail。
在中国,很多人都认为谷歌是水土不服,我不这么认为。

我是做服装外贸的,我是服装设计师,六年来,对于各个搜索引擎,包括各种服装的搜索引擎,我都会根据我感兴趣的主题词用flashget定期下载。不是下载一部分,是下载所有。然后再建立数据库来研究趋势。

同样,在网站上挂谷歌的adsense,不是为了赚钱,而是为了寻找和了解我的竞争对手,寻找自身的弱点。然后再提升自己的服务。

谷歌的现状很好,但是所有走向衰败的企业都是在辉煌的时候没有发现自身的弱点,谷歌的模型从原理上来说是错误的,没有办法防止spam的攻击。

谷歌确实不如百度,我发这个贴并非没有根据。



--
灌水, 只是我滴表面工作...
blog: http://weblog.at.3322.org

妖精の瞳™

unread,
Jun 24, 2006, 2:13:19 AM6/24/06
to fa...@googlegroups.com
怎么算是不去搞违禁内容?? 有多少人又是真的因为搞违禁内容被封的??
难道还要为文字狱说好话?
我搜索"自由"二字, 算搞违禁吗?
有多少人因为几个莫名其妙的关键字, 写了N久的文章发送后提示一句"含有禁止字词"后付诸东流? BBS, BLOG皆是如此. 甚至到了游戏里面, 也不能幸免. 再游戏里打个"中国人" 变成了对应的广告词... 而德国人, 法国人, 却安然无恙...
更有举不胜举的文字狱(新世纪的名字叫"关键字过滤"), 我就不想多举例了. 一个稍有人权意识的人, 都能感觉出这是对自己最明显的侵犯.

 
On 6/24/06, Hong Xiaowan <hongx...@gmail.com> wrote:

其实,不去搞违禁内容,gfw是不可能封杀的。思科已经开发出这样的系统,就是只对指定的url封锁,不会对整站和ip封锁。原理同https:封锁。

累就一个字。



量子公民

unread,
Jun 24, 2006, 2:16:33 AM6/24/06
to GFans
总之,目前Google与Baidu在中国竞争的环境都不平等...

不公平的状况下,
天平自然会倾斜.

suse...@gmail.com

unread,
Jun 24, 2006, 3:56:17 AM6/24/06
to fa...@googlegroups.com
恩,Mr.Hong Xiaowan 确实言之凿凿,对于搜索引擎的各种细节,我确实不是很了解:p,我能说一说的,确实也只有一点苍白的用户体验:P
说baidu有更好的全文语义分析,也可能吧,在没有看过详细的paper之前,我无法对这个东西能搭上话。但是,无论如何,中文的全文语义分析不管计算技术有了何等进步,在当前的条件下我想还是远不如人肉全文语义分析的:p(如果错了,请指正...似乎Hong也仅仅只是推测?)所以,在当前, 这两个搜索引擎的结果并无法有一个客观的判断.而且就hong的说法,我也使用他提供的关键字尝试了一把,似乎并看不出有什么差异.当然,我不专业.
说说其他的吧,权当敲敲边鼓XD
对了,开复跳槽是不是谷歌最经典的钻美国法律空子的案例?
执照门呢?

非为禁止即为合法,能够钻法律的空子并不可耻,可耻的是没有本领
钻空子,做了法盲还要用不作恶,公正来标榜自己。可耻的是把技术上的失败归结于某些法律环境。
可耻的是似乎只有违法才是生财之道,和赖星星有的一比。
执照的问题在现在这个时代似乎是个很遥远的问题了...不能说del.icio.us没有中国工商总局颁发的营业执照就无法访问了...难道我们的著名chinanet正如其名是个世界最大局域网?当然,在中国要有各种活动这个是必须有这个执照的.这也是法律的问题.嗯,如果这是个耻辱的话那么应该怪罪到我们这群所谓的gfans头上.谁让你非法访问国外网站了?而且赶集网的那个执照问题现在看并说不清楚.
李开复的跳槽,似乎并不能说明什么法律的空子,在劳动合同(国外叫什么我还真是不知道)上应该明确的有这种情况的处理,即使没有,至少还有句类似"一切未尽事宜由双方商议而定"之类的话,正常的人员流动和法律的空子有什么关系?
当然,我不承认百度违法,从某种意义上来说,百度是为捍卫中华人民共和国的法律作出了杰出而应有的贡献的.但是,错就错在还有个道德问题.在某些手段上利用现有的技术无法达到的空洞来诋毁和影响对手,这是让我们无法接受的:)其实,那摞传说中的A4纸中的资料来说明百度本身存在的问题也是足够的:)
法律就是法律,不存在什么空子.只是在法律之外还有道德.btw:I don't like Lee too :)


On 6/24/06, 量子公民 <airo...@gmail.com> wrote:
总之,目前Google与Baidu在中国竞争的环境都不平等...

不公平的状况下,
天平自然会倾斜.


--
珍爱生命,拒绝光明牛奶!

Hong Xiaowan

unread,
Jun 24, 2006, 3:35:50 AM6/24/06
to GFans
在1988年到1991年,我跟导师的项目是文献情报检索;独自编过组面分类法;做过专家诊断系统。在文献分类中,也有abc,但是绝对不会剔除c。
谷歌的pagerank拷贝了文献引用原理,又武断的抛弃了其中的精华。
pagerank是个古老的概念,谷歌给它换了个新的衣服。听说还申请了专利,好搞笑。我明天就造纸术还可以弄个专利,呵呵。

刚刚注册了一个nopagerank.com,会在最近对谷歌的pagerank进行分析。

Hong Xiaowan

unread,
Jun 24, 2006, 3:40:18 AM6/24/06
to GFans
是真的不平等,还是谷歌以此为由争取优惠待遇?
是真的不平等,还是以谷歌为凭,在搜索技术之外说事。
量子公民 wrote:
> 总之,目前Google与Baidu在中国竞争的环境都不平等...
>
> 不公平的状况下,
> 天平自然会倾斜.
It is loading more messages.
0 new messages