Groups
Sign in
Groups
Paoding's Knives
Conversations
About
Send feedback
Help
Paoding's Knives
Contact owners and managers
1–30 of 120
Mark all as read
Report group
0 selected
Qieqie
, …
Rory Ye
5
1/24/10
庖丁 Lucene 3.0 升级
已经checkout. 感谢楼主的努力。 2010/1/25 Qieqie <qieqi...@gmail.com> 请稍等两天,此期间建议走下svn 王志亮 人人网 架构部 电话:
unread,
庖丁 Lucene 3.0 升级
已经checkout. 感谢楼主的努力。 2010/1/25 Qieqie <qieqi...@gmail.com> 请稍等两天,此期间建议走下svn 王志亮 人人网 架构部 电话:
1/24/10
蒋波礼
1/20/10
回复:庖丁 Lucene 3.0 升级
paoding终于有更新了。。。。 ------------------ 原始邮件 ------------------ 发件人: "Qieqie"<qieqie.wang@
unread,
回复:庖丁 Lucene 3.0 升级
paoding终于有更新了。。。。 ------------------ 原始邮件 ------------------ 发件人: "Qieqie"<qieqie.wang@
1/20/10
ke_kkk
,
liugang
2
7/13/09
源码给出的示例能否使用用户自定义的词进行分词?
加入自定义的词典需要重新编译。只要把.compile目录删掉,然后重新运行程序即可 2009/7/13 ke_kkk <kebi...@gmail.com> 我运行了示例,但是加入自己
unread,
源码给出的示例能否使用用户自定义的词进行分词?
加入自定义的词典需要重新编译。只要把.compile目录删掉,然后重新运行程序即可 2009/7/13 ke_kkk <kebi...@gmail.com> 我运行了示例,但是加入自己
7/13/09
ke_kkk
7/12/09
哪里有比较完整的使用文档,代码里的那个比较的简略。
顺便问一下怎么加入用户词典,我照着群里的方法试了试,分词完成后结果和没有加入用户词典是一样的,没有管用。
unread,
哪里有比较完整的使用文档,代码里的那个比较的简略。
顺便问一下怎么加入用户词典,我照着群里的方法试了试,分词完成后结果和没有加入用户词典是一样的,没有管用。
7/12/09
An YanTong
5/20/09
请给出意见和建议
大家好, 我是开放的中文分词项目“句读”的发起人蚂蚁。 http://groups.google.com/group/judou 冒昧在这里发邮件。 这是我们的社区白皮书http://twinsant.
unread,
请给出意见和建议
大家好, 我是开放的中文分词项目“句读”的发起人蚂蚁。 http://groups.google.com/group/judou 冒昧在这里发邮件。 这是我们的社区白皮书http://twinsant.
5/20/09
boli....@gmail.com
,
liugang
2
4/15/09
修改词典之后怎么保证不用重启服务?
在下一次调用庖丁进行分词的时候,会自动编译词典,不需要重启服务 2009/4/15 boli....@gmail.com <boli....@gmail.com> 大家好: 我用的是
unread,
修改词典之后怎么保证不用重启服务?
在下一次调用庖丁进行分词的时候,会自动编译词典,不需要重启服务 2009/4/15 boli....@gmail.com <boli....@gmail.com> 大家好: 我用的是
4/15/09
aspirit
,
Qieqie
3
2/12/09
使用php-java桥调用庖丁分词遇到的问题
问题找到原因了:是因为用新的jar覆盖原来的导致的 重启tomcat服务就好了不好意思 麻烦了On Feb 13, 9:48 am, Qieqie <qieqie.w...@gmail.com
unread,
使用php-java桥调用庖丁分词遇到的问题
问题找到原因了:是因为用新的jar覆盖原来的导致的 重启tomcat服务就好了不好意思 麻烦了On Feb 13, 9:48 am, Qieqie <qieqie.w...@gmail.com
2/12/09
加菲猫
, …
kevo
5
2/3/09
请问哪里有比较全的文档?
好像是把.compile目录删除,然后再运行就可以了。我最近试了一下,好像管用。 On 1月29日, 上午12时40分, kevo <kev...@gmail.com> wrote:
unread,
请问哪里有比较全的文档?
好像是把.compile目录删除,然后再运行就可以了。我最近试了一下,好像管用。 On 1月29日, 上午12时40分, kevo <kev...@gmail.com> wrote:
2/3/09
加菲猫
,
roy deen
2
1/14/09
关于用户输入的搜索内容
看示例程序呀,有用的。 2009/1/14 加菲猫 <kevin...@gmail.com> 加入用户输入一个比较长的搜索词或句,是不是我还要先用庖丁进行分词,然后再组合查询? 又或者
unread,
关于用户输入的搜索内容
看示例程序呀,有用的。 2009/1/14 加菲猫 <kevin...@gmail.com> 加入用户输入一个比较长的搜索词或句,是不是我还要先用庖丁进行分词,然后再组合查询? 又或者
1/14/09
jerry
, …
nid.hust
8
1/7/09
如何定制自己的字典
那样的话除了第一行以外,其余的应该有效呀,但是全部都不好用,不知道为什么。 [广告] 出名要趁“小”,快来上传宝贝照片赢大奖吧!
unread,
如何定制自己的字典
那样的话除了第一行以外,其余的应该有效呀,但是全部都不好用,不知道为什么。 [广告] 出名要趁“小”,快来上传宝贝照片赢大奖吧!
1/7/09
javapig
, …
ghostwwl .
4
1/5/09
dictionary file如何生成呢?
这个你应该去庖丁的论坛或者什么问吧 不好意思 我是写python的 我这里用的庖丁都是java组的同时 全都弄好了 生成了jar我只是用python掉用词典的配置什么的 你应该去lucene或者庖丁的的
unread,
dictionary file如何生成呢?
这个你应该去庖丁的论坛或者什么问吧 不好意思 我是写python的 我这里用的庖丁都是java组的同时 全都弄好了 生成了jar我只是用python掉用词典的配置什么的 你应该去lucene或者庖丁的的
1/5/09
jj
,
切切·王
3
12/30/08
我用paoding+lucene写的windows程序好用,从jsp中调用出错!
解决了,就是paoding-analyzer.jar的包放错位置了。 On 12月30日, 上午10时36分, jj <manhuijia_...@163.com> wrote: >
unread,
我用paoding+lucene写的windows程序好用,从jsp中调用出错!
解决了,就是paoding-analyzer.jar的包放错位置了。 On 12月30日, 上午10时36分, jj <manhuijia_...@163.com> wrote: >
12/30/08
freej
11/23/08
关于查询词的疑问
大家好,问个问题。我集成好了solr和Paoding,field有三,分别是title、content和all。all是默认查询的field, 并包含了title和content的内容。我建立索引的时候
unread,
关于查询词的疑问
大家好,问个问题。我集成好了solr和Paoding,field有三,分别是title、content和all。all是默认查询的field, 并包含了title和content的内容。我建立索引的时候
11/23/08
malphas
10/24/08
QueryParser对中文分词的要求
http://www.javaeye.com/topic/133318 请问这个问题,现在有解决办法了吗?
unread,
QueryParser对中文分词的要求
http://www.javaeye.com/topic/133318 请问这个问题,现在有解决办法了吗?
10/24/08
syj...@gmail.com
,
切切·王
3
10/17/08
请问paoding支持从数据库表中加载字典吗?
好的,非常感谢。 On Oct 8, 1:10 pm, "切切·王" <qieqie.w...@gmail.com> wrote: > 目前没有,需要的话,可能要
unread,
请问paoding支持从数据库表中加载字典吗?
好的,非常感谢。 On Oct 8, 1:10 pm, "切切·王" <qieqie.w...@gmail.com> wrote: > 目前没有,需要的话,可能要
10/17/08
bose.pavithra
10/16/08
job
EARN MONEY $1000-25000 PER MONTH TAKE SIMPLE ONLINE SURVEYS CREATE FREE ACCOUNT OTHER DETAILS LOG ON
unread,
job
EARN MONEY $1000-25000 PER MONTH TAKE SIMPLE ONLINE SURVEYS CREATE FREE ACCOUNT OTHER DETAILS LOG ON
10/16/08
gbcindy
,
liugang
2
10/12/08
未登陆词的识别和新词录入!!!
开源的没有吧,北大语言研究所、中科院出的分词工具有这些功能,但不是开源的 2008/10/11 gbcindy <gon...@gmail.com> 不知道 庖丁解牛 分词工具 有没有
unread,
未登陆词的识别和新词录入!!!
开源的没有吧,北大语言研究所、中科院出的分词工具有这些功能,但不是开源的 2008/10/11 gbcindy <gon...@gmail.com> 不知道 庖丁解牛 分词工具 有没有
10/12/08
lightwinner
,
minglong yu
5
10/5/08
paoding在classpath下装载词典的问题
呵呵,国庆长假一直没有登录不过我还没测试,我项目中暂时用绝对定位dic目录,等有时间再修改代码。 非常感谢minglong yu的回复,收获不小,再次感谢。 lightwinner 2008.10.06
unread,
paoding在classpath下装载词典的问题
呵呵,国庆长假一直没有登录不过我还没测试,我项目中暂时用绝对定位dic目录,等有时间再修改代码。 非常感谢minglong yu的回复,收获不小,再次感谢。 lightwinner 2008.10.06
10/5/08
lwl
,
切切·王
3
9/29/08
编码问题
thx 做了实验,终于搞明白了。 2008/9/24 切切·王 <qieqi...@gmail.com> 网页编码和paoding没有关系,你只需要按照网页的编码解析出正确编码的
unread,
编码问题
thx 做了实验,终于搞明白了。 2008/9/24 切切·王 <qieqi...@gmail.com> 网页编码和paoding没有关系,你只需要按照网页的编码解析出正确编码的
9/29/08
Universe
,
liugang
2
9/23/08
我找不到release.txt这个文件呀?
要加入后缀是dic的文件 2008/9/23 Universe <sunyu...@163.com> 我想增加分词,可是我在dic里面加入了一个txt没有效果,看了论坛上说看
unread,
我找不到release.txt这个文件呀?
要加入后缀是dic的文件 2008/9/23 Universe <sunyu...@163.com> 我想增加分词,可是我在dic里面加入了一个txt没有效果,看了论坛上说看
9/23/08
yumin...@gmail.com
,
切切·王
5
8/26/08
关于词典路径问题
首先对于你的第一句话我感觉不用说sorry,因为当时我不知道Google group是这个软件的主论坛,后来无意中找到的,但是在javaeye看见你的blog就留言了。我很支持开源的!当然在此也对你的
unread,
关于词典路径问题
首先对于你的第一句话我感觉不用说sorry,因为当时我不知道Google group是这个软件的主论坛,后来无意中找到的,但是在javaeye看见你的blog就留言了。我很支持开源的!当然在此也对你的
8/26/08
白泽居主人
8/12/08
想参与“庖丁解牛”的开发
切切, 实在找不到你的联系方式,你留下找工作的邮件地址发信被退回了,Skype也找不到用户名,只好在这里联系你了。 我最近在研究Lucene,分词器使用的是“庖丁解牛”,感觉很不错。 我个人有一定的时间
unread,
想参与“庖丁解牛”的开发
切切, 实在找不到你的联系方式,你留下找工作的邮件地址发信被退回了,Skype也找不到用户名,只好在这里联系你了。 我最近在研究Lucene,分词器使用的是“庖丁解牛”,感觉很不错。 我个人有一定的时间
8/12/08
alpha
,
切切·王
2
8/12/08
请问庖丁解牛有没有同义词功能?
没有,抱歉。 2008/8/12 alpha <alph...@gmail.com> 请问庖丁解牛有没有同义词功能? 就比如在分析一篇文章的时候, 将一些切分的词和同义词联系起来.并索引.
unread,
请问庖丁解牛有没有同义词功能?
没有,抱歉。 2008/8/12 alpha <alph...@gmail.com> 请问庖丁解牛有没有同义词功能? 就比如在分析一篇文章的时候, 将一些切分的词和同义词联系起来.并索引.
8/12/08
cinron
,
白泽居主人
2
8/10/08
支不支持多个关键字查找
这个不应该是Paoding的问题。你通过"中国"和"组织"都可以查出来的话,说明"中国"和"组织"两个词都已经被正确分词并
unread,
支不支持多个关键字查找
这个不应该是Paoding的问题。你通过"中国"和"组织"都可以查出来的话,说明"中国"和"组织"两个词都已经被正确分词并
8/10/08
iampencil
,
白泽居主人
2
8/10/08
新手的疑问
是这样的。 如果分词的时候"百乐宝"已经被处理成为一个词了,那么相关内容就被用"百乐宝"记录在索引中,那么你用"百"不可能再查到它。 On
unread,
新手的疑问
是这样的。 如果分词的时候"百乐宝"已经被处理成为一个词了,那么相关内容就被用"百乐宝"记录在索引中,那么你用"百"不可能再查到它。 On
8/10/08
pavi
7/20/08
EARN MONEY $2500-10000 PER WEEK
EARN MONEY $2500-10000 PER WEEK SIMPLE ONLINE SURVEY OTHER DETAILS LOGONTO **************************
unread,
EARN MONEY $2500-10000 PER WEEK
EARN MONEY $2500-10000 PER WEEK SIMPLE ONLINE SURVEY OTHER DETAILS LOGONTO **************************
7/20/08
leo
,
切切·王
3
7/4/08
自定义的词组加在哪个字典里?
问:另外,是不是dic目录下所有的字典都会被装载?可否有选择 ,或者自定义字典,然后让paoding加载 答:"有选择"这个说明不明确,回复不涉及之。 其他的回复为"是。
unread,
自定义的词组加在哪个字典里?
问:另外,是不是dic目录下所有的字典都会被装载?可否有选择 ,或者自定义字典,然后让paoding加载 答:"有选择"这个说明不明确,回复不涉及之。 其他的回复为"是。
7/4/08
Qieqie
, …
lwl
6
6/29/08
各位,我发布了paoding分词的2.0.4beta版
赞 辛苦了 在08-6-28,Btsw <qixia...@gmail.com> 写道: 经过1个月的努力我终于svn下来了 哇哈哈哈哈哈哈哈哈哈哈 On Jun 6, 9:23 pm,
unread,
各位,我发布了paoding分词的2.0.4beta版
赞 辛苦了 在08-6-28,Btsw <qixia...@gmail.com> 写道: 经过1个月的努力我终于svn下来了 哇哈哈哈哈哈哈哈哈哈哈 On Jun 6, 9:23 pm,
6/29/08
javageek
,
切切·王
2
6/21/08
求解:简单的分词
Paoding目前的分词默认不支持仅仅分出这样的词出来。 这样的分法,应该采用的是"反向最大切词"的方式,或者我想应该可以实现一个按照你自己规定的Collector进行分词过滤。(但
unread,
求解:简单的分词
Paoding目前的分词默认不支持仅仅分出这样的词出来。 这样的分法,应该采用的是"反向最大切词"的方式,或者我想应该可以实现一个按照你自己规定的Collector进行分词过滤。(但
6/21/08
china1000
,
切切·王
3
6/6/08
急:与solr整合的问题
是QueryParser的 "短语查询" 语义的问题。 QueryParser认为你连接在一起的词,就是要找目标文章也是按照这个顺序,而且是紧挨着的。 "四川是中国的,测试
unread,
急:与solr整合的问题
是QueryParser的 "短语查询" 语义的问题。 QueryParser认为你连接在一起的词,就是要找目标文章也是按照这个顺序,而且是紧挨着的。 "四川是中国的,测试
6/6/08