是否支持sorl的index,query这种方式的配置?

60 views
Skip to first unread message
Message has been deleted

jbas

unread,
Nov 5, 2009, 4:02:49 AM11/5/09
to mmseg4j
你好,
mmseg4j是否支持solr的这种配置?这样可以定义一些不可搜索的东东。

谢谢!

<fieldType name="text" class="solr.TextField"
positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>



<!-- in this example, we will only use synonyms at query time
<filter class="solr.SynonymFilterFactory"
synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
-->
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt"/>
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPorterFilterFactory"
protected="protwords.txt"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>


<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt"
ignoreCase="true" expand="true"/>
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt"/>
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="0"
catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPorterFilterFactory"
protected="protwords.txt"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
</fieldType>

chenlb2008

unread,
Nov 5, 2009, 6:52:49 AM11/5/09
to mmseg4j
实现 TokenizerFactory 的都支持这种配置方式,MMSeg4jTokenizerFactory  实现了它。
 

chenlb2008
2009-11-05

发件人: jbas
发送时间: 2009-11-05 17:02:53
收件人: mmseg4j
抄送:
主题: 是否支持sorl的index,query这种方式的配置 ?

chenlb

unread,
Nov 5, 2009, 6:55:49 AM11/5/09
to mmseg4j
实现了 TokenizerFactory 的都支持这种配置方式,MMSeg4jTokenizerFactory 实现了它。

jbas

unread,
Nov 5, 2009, 8:36:39 AM11/5/09
to mmseg4j
chenlb,
你好,不好意思,我该怎样去写你说的这个MMSeg4jTokenizerFactory ,我在你的mmseg4j-all-1.8.1-
with-dic.jar包中没找到你说的MMSeg4jTokenizerFactory
这个类了。

谢谢!

jbas

unread,
Nov 5, 2009, 8:38:55 AM11/5/09
to mmseg4j
chenlb,
你好,不好意思,刚开始学solr,请问我该如何去配我说的这种index.query方式。
你说的 MMSeg4jTokenizerFactory 这个类,我在你的mmseg4j-all-1.8.1-with-dic.jar 包中
没找到了。

谢谢!

On 11月5日, 下午7时55分, chenlb <chenlb2...@gmail.com> wrote:

chenlb2008

unread,
Nov 5, 2009, 10:31:01 AM11/5/09
to mmseg4j
com.chenlb.mmseg4j.solr.MMSegTokenizerFactory 
 
把 <tokenizer class="solr.WhitespaceTokenizerFactory"/> 改为
 
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"/>
 
如果要指定词库目录,让用 dicPath 指定。可以用 mode 参数指定分词模式:simple、complex、max-word
 
 
 

chenlb2008
2009-11-05

发件人: jbas
发送时间: 2009-11-05 21:36:42
收件人: mmseg4j
抄送:
主题: Re: 是否支持sorl的index,query这种方式的配 置?
 
chenlb,
  你好,不好意思,我该怎样去写你说的这个MMSeg4jTokenizerFactory  ,我在你的mmseg4j-all-1.8.1-
with-dic.jar包中没找到你说的MMSeg4jTokenizerFactory
这个类了。
谢谢!
On 11月5日, 下午7时55分, chenlb <chenlb2...@gmail.com> wrote:
Reply all
Reply to author
Forward
0 new messages