Groups
Conversations
All groups and messages
Send feedback to Google
Help
Training
Sign in
Groups
Paoding's Knives
Conversations
About
Paoding's Knives
Contact owners and managers
1–30 of 120
Mark all as read
Report group
0 selected
Qieqie
, …
Rory Ye
5
1/24/10
庖丁 Lucene 3.0 升级
已经checkout. 感谢楼主的努力。 2010/1/25 Qieqie <qieqi...@gmail.com> 请稍等两天,此期间建议走下svn 王志亮 人人网 架构部 电话:
unread,
庖丁 Lucene 3.0 升级
已经checkout. 感谢楼主的努力。 2010/1/25 Qieqie <qieqi...@gmail.com> 请稍等两天,此期间建议走下svn 王志亮 人人网 架构部 电话:
1/24/10
蒋波礼
1/20/10
回复:庖丁 Lucene 3.0 升级
paoding终于有更新了。。。。 ------------------ 原始邮件 ------------------ 发件人: "Qieqie"<qieqie.wang@
unread,
回复:庖丁 Lucene 3.0 升级
paoding终于有更新了。。。。 ------------------ 原始邮件 ------------------ 发件人: "Qieqie"<qieqie.wang@
1/20/10
ke_kkk
,
liugang
2
7/13/09
源码给出的示例能否使用用户自定义的词进行分词?
加入自定义的词典需要重新编译。只要把.compile目录删掉,然后重新运行程序即可 2009/7/13 ke_kkk <kebi...@gmail.com> 我运行了示例,但是加入自己
unread,
源码给出的示例能否使用用户自定义的词进行分词?
加入自定义的词典需要重新编译。只要把.compile目录删掉,然后重新运行程序即可 2009/7/13 ke_kkk <kebi...@gmail.com> 我运行了示例,但是加入自己
7/13/09
ke_kkk
7/12/09
哪里有比较完整的使用文档,代码里的那个比较的简略。
顺便问一下怎么加入用户词典,我照着群里的方法试了试,分词完成后结果和没有加入用户词典是一样的,没有管用。
unread,
哪里有比较完整的使用文档,代码里的那个比较的简略。
顺便问一下怎么加入用户词典,我照着群里的方法试了试,分词完成后结果和没有加入用户词典是一样的,没有管用。
7/12/09
An YanTong
5/20/09
请给出意见和建议
大家好, 我是开放的中文分词项目“句读”的发起人蚂蚁。 http://groups.google.com/group/judou 冒昧在这里发邮件。 这是我们的社区白皮书http://twinsant.
unread,
请给出意见和建议
大家好, 我是开放的中文分词项目“句读”的发起人蚂蚁。 http://groups.google.com/group/judou 冒昧在这里发邮件。 这是我们的社区白皮书http://twinsant.
5/20/09
boli....@gmail.com
,
liugang
2
4/15/09
修改词典之后怎么保证不用重启服务?
在下一次调用庖丁进行分词的时候,会自动编译词典,不需要重启服务 2009/4/15 boli....@gmail.com <boli....@gmail.com> 大家好: 我用的是
unread,
修改词典之后怎么保证不用重启服务?
在下一次调用庖丁进行分词的时候,会自动编译词典,不需要重启服务 2009/4/15 boli....@gmail.com <boli....@gmail.com> 大家好: 我用的是
4/15/09
aspirit
,
Qieqie
3
2/12/09
使用php-java桥调用庖丁分词遇到的问题
问题找到原因了:是因为用新的jar覆盖原来的导致的 重启tomcat服务就好了不好意思 麻烦了On Feb 13, 9:48 am, Qieqie <qieqie.w...@gmail.com
unread,
使用php-java桥调用庖丁分词遇到的问题
问题找到原因了:是因为用新的jar覆盖原来的导致的 重启tomcat服务就好了不好意思 麻烦了On Feb 13, 9:48 am, Qieqie <qieqie.w...@gmail.com
2/12/09
加菲猫
, …
kevo
5
2/3/09
请问哪里有比较全的文档?
好像是把.compile目录删除,然后再运行就可以了。我最近试了一下,好像管用。 On 1月29日, 上午12时40分, kevo <kev...@gmail.com> wrote:
unread,
请问哪里有比较全的文档?
好像是把.compile目录删除,然后再运行就可以了。我最近试了一下,好像管用。 On 1月29日, 上午12时40分, kevo <kev...@gmail.com> wrote:
2/3/09
加菲猫
,
roy deen
2
1/14/09
关于用户输入的搜索内容
看示例程序呀,有用的。 2009/1/14 加菲猫 <kevin...@gmail.com> 加入用户输入一个比较长的搜索词或句,是不是我还要先用庖丁进行分词,然后再组合查询? 又或者
unread,
关于用户输入的搜索内容
看示例程序呀,有用的。 2009/1/14 加菲猫 <kevin...@gmail.com> 加入用户输入一个比较长的搜索词或句,是不是我还要先用庖丁进行分词,然后再组合查询? 又或者
1/14/09
jerry
, …
nid.hust
8
1/7/09
如何定制自己的字典
那样的话除了第一行以外,其余的应该有效呀,但是全部都不好用,不知道为什么。 [广告] 出名要趁“小”,快来上传宝贝照片赢大奖吧!
unread,
如何定制自己的字典
那样的话除了第一行以外,其余的应该有效呀,但是全部都不好用,不知道为什么。 [广告] 出名要趁“小”,快来上传宝贝照片赢大奖吧!
1/7/09
javapig
, …
ghostwwl .
4
1/5/09
dictionary file如何生成呢?
这个你应该去庖丁的论坛或者什么问吧 不好意思 我是写python的 我这里用的庖丁都是java组的同时 全都弄好了 生成了jar我只是用python掉用词典的配置什么的 你应该去lucene或者庖丁的的
unread,
dictionary file如何生成呢?
这个你应该去庖丁的论坛或者什么问吧 不好意思 我是写python的 我这里用的庖丁都是java组的同时 全都弄好了 生成了jar我只是用python掉用词典的配置什么的 你应该去lucene或者庖丁的的
1/5/09
jj
,
切切·王
3
12/30/08
我用paoding+lucene写的windows程序好用,从jsp中调用出错!
解决了,就是paoding-analyzer.jar的包放错位置了。 On 12月30日, 上午10时36分, jj <manhuijia_...@163.com> wrote: >
unread,
我用paoding+lucene写的windows程序好用,从jsp中调用出错!
解决了,就是paoding-analyzer.jar的包放错位置了。 On 12月30日, 上午10时36分, jj <manhuijia_...@163.com> wrote: >
12/30/08
freej
11/23/08
关于查询词的疑问
大家好,问个问题。我集成好了solr和Paoding,field有三,分别是title、content和all。all是默认查询的field, 并包含了title和content的内容。我建立索引的时候
unread,
关于查询词的疑问
大家好,问个问题。我集成好了solr和Paoding,field有三,分别是title、content和all。all是默认查询的field, 并包含了title和content的内容。我建立索引的时候
11/23/08
malphas
10/24/08
QueryParser对中文分词的要求
http://www.javaeye.com/topic/133318 请问这个问题,现在有解决办法了吗?
unread,
QueryParser对中文分词的要求
http://www.javaeye.com/topic/133318 请问这个问题,现在有解决办法了吗?
10/24/08
syj...@gmail.com
,
切切·王
3
10/17/08
请问paoding支持从数据库表中加载字典吗?
好的,非常感谢。 On Oct 8, 1:10 pm, "切切·王" <qieqie.w...@gmail.com> wrote: > 目前没有,需要的话,可能要
unread,
请问paoding支持从数据库表中加载字典吗?
好的,非常感谢。 On Oct 8, 1:10 pm, "切切·王" <qieqie.w...@gmail.com> wrote: > 目前没有,需要的话,可能要
10/17/08
bose.pavithra
10/16/08
job
EARN MONEY $1000-25000 PER MONTH TAKE SIMPLE ONLINE SURVEYS CREATE FREE ACCOUNT OTHER DETAILS LOG ON
unread,
job
EARN MONEY $1000-25000 PER MONTH TAKE SIMPLE ONLINE SURVEYS CREATE FREE ACCOUNT OTHER DETAILS LOG ON
10/16/08
gbcindy
,
liugang
2
10/12/08
未登陆词的识别和新词录入!!!
开源的没有吧,北大语言研究所、中科院出的分词工具有这些功能,但不是开源的 2008/10/11 gbcindy <gon...@gmail.com> 不知道 庖丁解牛 分词工具 有没有
unread,
未登陆词的识别和新词录入!!!
开源的没有吧,北大语言研究所、中科院出的分词工具有这些功能,但不是开源的 2008/10/11 gbcindy <gon...@gmail.com> 不知道 庖丁解牛 分词工具 有没有
10/12/08
lightwinner
,
minglong yu
5
10/5/08
paoding在classpath下装载词典的问题
呵呵,国庆长假一直没有登录不过我还没测试,我项目中暂时用绝对定位dic目录,等有时间再修改代码。 非常感谢minglong yu的回复,收获不小,再次感谢。 lightwinner 2008.10.06
unread,
paoding在classpath下装载词典的问题
呵呵,国庆长假一直没有登录不过我还没测试,我项目中暂时用绝对定位dic目录,等有时间再修改代码。 非常感谢minglong yu的回复,收获不小,再次感谢。 lightwinner 2008.10.06
10/5/08
lwl
,
切切·王
3
9/29/08
编码问题
thx 做了实验,终于搞明白了。 2008/9/24 切切·王 <qieqi...@gmail.com> 网页编码和paoding没有关系,你只需要按照网页的编码解析出正确编码的
unread,
编码问题
thx 做了实验,终于搞明白了。 2008/9/24 切切·王 <qieqi...@gmail.com> 网页编码和paoding没有关系,你只需要按照网页的编码解析出正确编码的
9/29/08
Universe
,
liugang
2
9/23/08
我找不到release.txt这个文件呀?
要加入后缀是dic的文件 2008/9/23 Universe <sunyu...@163.com> 我想增加分词,可是我在dic里面加入了一个txt没有效果,看了论坛上说看
unread,
我找不到release.txt这个文件呀?
要加入后缀是dic的文件 2008/9/23 Universe <sunyu...@163.com> 我想增加分词,可是我在dic里面加入了一个txt没有效果,看了论坛上说看
9/23/08
yumin...@gmail.com
,
切切·王
5
8/26/08
关于词典路径问题
首先对于你的第一句话我感觉不用说sorry,因为当时我不知道Google group是这个软件的主论坛,后来无意中找到的,但是在javaeye看见你的blog就留言了。我很支持开源的!当然在此也对你的
unread,
关于词典路径问题
首先对于你的第一句话我感觉不用说sorry,因为当时我不知道Google group是这个软件的主论坛,后来无意中找到的,但是在javaeye看见你的blog就留言了。我很支持开源的!当然在此也对你的
8/26/08
白泽居主人
8/12/08
想参与“庖丁解牛”的开发
切切, 实在找不到你的联系方式,你留下找工作的邮件地址发信被退回了,Skype也找不到用户名,只好在这里联系你了。 我最近在研究Lucene,分词器使用的是“庖丁解牛”,感觉很不错。 我个人有一定的时间
unread,
想参与“庖丁解牛”的开发
切切, 实在找不到你的联系方式,你留下找工作的邮件地址发信被退回了,Skype也找不到用户名,只好在这里联系你了。 我最近在研究Lucene,分词器使用的是“庖丁解牛”,感觉很不错。 我个人有一定的时间
8/12/08
alpha
,
切切·王
2
8/12/08
请问庖丁解牛有没有同义词功能?
没有,抱歉。 2008/8/12 alpha <alph...@gmail.com> 请问庖丁解牛有没有同义词功能? 就比如在分析一篇文章的时候, 将一些切分的词和同义词联系起来.并索引.
unread,
请问庖丁解牛有没有同义词功能?
没有,抱歉。 2008/8/12 alpha <alph...@gmail.com> 请问庖丁解牛有没有同义词功能? 就比如在分析一篇文章的时候, 将一些切分的词和同义词联系起来.并索引.
8/12/08
cinron
,
白泽居主人
2
8/10/08
支不支持多个关键字查找
这个不应该是Paoding的问题。你通过"中国"和"组织"都可以查出来的话,说明"中国"和"组织"两个词都已经被正确分词并
unread,
支不支持多个关键字查找
这个不应该是Paoding的问题。你通过"中国"和"组织"都可以查出来的话,说明"中国"和"组织"两个词都已经被正确分词并
8/10/08
iampencil
,
白泽居主人
2
8/10/08
新手的疑问
是这样的。 如果分词的时候"百乐宝"已经被处理成为一个词了,那么相关内容就被用"百乐宝"记录在索引中,那么你用"百"不可能再查到它。 On
unread,
新手的疑问
是这样的。 如果分词的时候"百乐宝"已经被处理成为一个词了,那么相关内容就被用"百乐宝"记录在索引中,那么你用"百"不可能再查到它。 On
8/10/08
pavi
7/20/08
EARN MONEY $2500-10000 PER WEEK
EARN MONEY $2500-10000 PER WEEK SIMPLE ONLINE SURVEY OTHER DETAILS LOGONTO **************************
unread,
EARN MONEY $2500-10000 PER WEEK
EARN MONEY $2500-10000 PER WEEK SIMPLE ONLINE SURVEY OTHER DETAILS LOGONTO **************************
7/20/08
leo
,
切切·王
3
7/4/08
自定义的词组加在哪个字典里?
问:另外,是不是dic目录下所有的字典都会被装载?可否有选择 ,或者自定义字典,然后让paoding加载 答:"有选择"这个说明不明确,回复不涉及之。 其他的回复为"是。
unread,
自定义的词组加在哪个字典里?
问:另外,是不是dic目录下所有的字典都会被装载?可否有选择 ,或者自定义字典,然后让paoding加载 答:"有选择"这个说明不明确,回复不涉及之。 其他的回复为"是。
7/4/08
Qieqie
, …
lwl
6
6/29/08
各位,我发布了paoding分词的2.0.4beta版
赞 辛苦了 在08-6-28,Btsw <qixia...@gmail.com> 写道: 经过1个月的努力我终于svn下来了 哇哈哈哈哈哈哈哈哈哈哈 On Jun 6, 9:23 pm,
unread,
各位,我发布了paoding分词的2.0.4beta版
赞 辛苦了 在08-6-28,Btsw <qixia...@gmail.com> 写道: 经过1个月的努力我终于svn下来了 哇哈哈哈哈哈哈哈哈哈哈 On Jun 6, 9:23 pm,
6/29/08
javageek
,
切切·王
2
6/21/08
求解:简单的分词
Paoding目前的分词默认不支持仅仅分出这样的词出来。 这样的分法,应该采用的是"反向最大切词"的方式,或者我想应该可以实现一个按照你自己规定的Collector进行分词过滤。(但
unread,
求解:简单的分词
Paoding目前的分词默认不支持仅仅分出这样的词出来。 这样的分法,应该采用的是"反向最大切词"的方式,或者我想应该可以实现一个按照你自己规定的Collector进行分词过滤。(但
6/21/08
china1000
,
切切·王
3
6/6/08
急:与solr整合的问题
是QueryParser的 "短语查询" 语义的问题。 QueryParser认为你连接在一起的词,就是要找目标文章也是按照这个顺序,而且是紧挨着的。 "四川是中国的,测试
unread,
急:与solr整合的问题
是QueryParser的 "短语查询" 语义的问题。 QueryParser认为你连接在一起的词,就是要找目标文章也是按照这个顺序,而且是紧挨着的。 "四川是中国的,测试
6/6/08