急:与solr整合的问题

9 views
Skip to first unread message

china1000

unread,
Jun 5, 2008, 11:32:44 PM6/5/08
to Paoding's Knives
我现在在用垂直搜索应用(tomcat5.5, jdk1.6 + solr + paoding中文分词),使用paoding做中文分
词,paoding分词分得不错,准确快速,但我发现一个问题:
我输入关键字:四川中国测试,solr分词的结果是:四川/中国/测试,我的标题测试内容:"四川是中国的,测试结果"能够显示出来,
但是当我输入关键字:四川测试中国solr分词的结果结果也是:四川/测试/中国,我的标题测试内容:"四川是中国的,测试结果"就不能显示出来了.

不知道为什么是这样,同样的关键字解析出来却不能在solr上面出现同样的结果?

恳请帮忙!




china1000

unread,
Jun 6, 2008, 2:43:51 AM6/6/08
to Paoding's Knives
我再补充一下:我发现的问题是关键字的排序如果不同(如:四川/中国/测试 和 四川/测试/中国),则导致查询的结果不同(同样的内容"四川是中国
的,测试结果"使用关键词'四川/中国/测试'能查出来而使用关键词''四川/测试/中国'却查不出来,)

同样的情况在英文句子情况下不会出现.

不知道是paoding分词的问题还是solr的问题,恳请有类似经历的朋友协助!

切切·王

unread,
Jun 6, 2008, 6:29:34 AM6/6/08
to pao...@googlegroups.com
是QueryParser的 "短语查询" 语义的问题。
QueryParser认为你连接在一起的词,就是要找目标文章也是按照这个顺序,而且是紧挨着的。

"四川是中国的,测试结果"这篇文章,因为"是","的"都是噪声字词,所以分解出来的结果是:
四川/中国/测试/其他词,
这和符合关键字的"四川中国测试"。
却不服合"四川测试中国"

记住:这不是paoding,也不是solr的问题,而是QueryParser的处理方式。

2008/6/6 china1000 <rub...@126.com>:



--
我愿意和你一起分享成就
Reply all
Reply to author
Forward
0 new messages