Groups
Groups
Sign in
Groups
Groups
句读:开放的中文分词项目
Conversations
About
Send feedback
Help
句读:开放的中文分词项目
1–30 of 47
人生总要留下些什么:感恩过去,珍惜现在,努力未来。
Mark all as read
Report group
0 selected
张沈鹏
, …
twinsant
6
6/7/09
以字分词
对应pdf已经放置在ftp里,请查看资源共享页面。 2009/6/7 张沈鹏 <zsp...@gmail.com> 2009/6/7 liz <shengyan1985@gmail.
unread,
以字分词
对应pdf已经放置在ftp里,请查看资源共享页面。 2009/6/7 张沈鹏 <zsp...@gmail.com> 2009/6/7 liz <shengyan1985@gmail.
6/7/09
mei...@gmail.com
, …
weibingzheng
22
6/2/09
讨论下统计分词与规则分词的结合点吧
呵呵,与最大熵对照着看看,其实不复杂 2009/6/2 杨志宇 <mei...@gmail.com> CRF的思想很好很强大,但!我看不明白!呵呵呵。。。。。。脑细胞不够用了! 2009/
unread,
讨论下统计分词与规则分词的结合点吧
呵呵,与最大熵对照着看看,其实不复杂 2009/6/2 杨志宇 <mei...@gmail.com> CRF的思想很好很强大,但!我看不明白!呵呵呵。。。。。。脑细胞不够用了! 2009/
6/2/09
Mingli Yuan
, …
Pem
10
3/2/15
请问本组还活跃吗?
炸出来几个冒泡的 2015-03-02 20:41 GMT+08:00 kevin...@bit.edu.cn <kevin...@bit.edu.cn>: 欢迎大家来ictclas
unread,
请问本组还活跃吗?
炸出来几个冒泡的 2015-03-02 20:41 GMT+08:00 kevin...@bit.edu.cn <kevin...@bit.edu.cn>: 欢迎大家来ictclas
3/2/15
Mingli Yuan
, …
twinsant
16
1/20/13
关于语料库的基础工作
那就订下基本规则: 项目的push权限成员的选择由已有权限成员讨论决定。 push过程中发生的问题在邮件组公开讨论解决。 2013/1/21 Mingli Yuan <mingli.yuan@
unread,
关于语料库的基础工作
那就订下基本规则: 项目的push权限成员的选择由已有权限成员讨论决定。 push过程中发生的问题在邮件组公开讨论解决。 2013/1/21 Mingli Yuan <mingli.yuan@
1/20/13
twinsant
,
junyi sun
3
1/15/13
人民日报98年1月的Python parser
恩,我的意思是你parse人民日报语料的python code。。。我连这个也懒得写了。 2013/1/16 junyi sun <ccn...@gmail.com> 什么样的parser
unread,
人民日报98年1月的Python parser
恩,我的意思是你parse人民日报语料的python code。。。我连这个也懒得写了。 2013/1/16 junyi sun <ccn...@gmail.com> 什么样的parser
1/15/13
twinsant
,
Mingli Yuan
3
1/15/13
果壳语料是怎么生成的?
准确的说在实现matrix67的这篇文章: http://trac.judou.org/trac.judou.org/wiki/Matrix67 代码已经写完了,发现选取阀值是个问题。需要语料来测试。
unread,
果壳语料是怎么生成的?
准确的说在实现matrix67的这篇文章: http://trac.judou.org/trac.judou.org/wiki/Matrix67 代码已经写完了,发现选取阀值是个问题。需要语料来测试。
1/15/13
Mingli Yuan
,
twinsant
2
1/8/13
[ANN] Clojure和Java上对 stanford-corenlp 包的包装
stanford的这nlp framework本身有什么特点呢?我最近在学习nltk,比较疑惑不同的框架该如何选择呢? 2013/1/8 Mingli Yuan <mingli.yuan@
unread,
[ANN] Clojure和Java上对 stanford-corenlp 包的包装
stanford的这nlp framework本身有什么特点呢?我最近在学习nltk,比较疑惑不同的框架该如何选择呢? 2013/1/8 Mingli Yuan <mingli.yuan@
1/8/13
twinsant
1/2/13
AC自动机
详见: https://github.com/judou/redis-ac-keywords
unread,
AC自动机
详见: https://github.com/judou/redis-ac-keywords
1/2/13
ju...@googlecode.com
, …
twinsant
3
9/18/12
Issue 16 in judou: setup.py is broken
已收录到wiki http://trac.judou.org/trac.judou.org/wiki 多谢。 2012/9/18 junyi sun <ccn...@gmail.com>
unread,
Issue 16 in judou: setup.py is broken
已收录到wiki http://trac.judou.org/trac.judou.org/wiki 多谢。 2012/9/18 junyi sun <ccn...@gmail.com>
9/18/12
ju...@googlecode.com
, …
twinsant
6
10/19/10
Issue 15 in judou: 对judou.py有关编码的补丁
gnap.an已经是commiter了:) 2010/10/19 <ju...@googlecode.com> Comment #2 on issue 15 by gnap.an: 对
unread,
Issue 15 in judou: 对judou.py有关编码的补丁
gnap.an已经是commiter了:) 2010/10/19 <ju...@googlecode.com> Comment #2 on issue 15 by gnap.an: 对
10/19/10
twinsant
, …
Jimmy Ma
20
7/8/10
8月目标顺延至9月
mongodb不错,弱弱的支持一下。 在 2010年7月9日 上午8:54,twinsant <twin...@gmail.com>写道: 词库我觉得应该采用中心服务器的形式,sqlite
unread,
8月目标顺延至9月
mongodb不错,弱弱的支持一下。 在 2010年7月9日 上午8:54,twinsant <twin...@gmail.com>写道: 词库我觉得应该采用中心服务器的形式,sqlite
7/8/10
Alex Dong
, …
Yongqiang Chen
9
5/7/10
对于句读中切词算法在英文中自动提取短语的应用
呵呵,勇强这个回复说到点子上了,此外,计算量也是一个大问题。 现在看来,用wikipedia或者freebase做词库可能是最合适的选择。 2010/5/7 Yongqiang Chen <
unread,
对于句读中切词算法在英文中自动提取短语的应用
呵呵,勇强这个回复说到点子上了,此外,计算量也是一个大问题。 现在看来,用wikipedia或者freebase做词库可能是最合适的选择。 2010/5/7 Yongqiang Chen <
5/7/10
张沈鹏
, …
YoungKing
21
12/19/09
easy_install mmseg
因为全文索引要保证全查率 所以后来换成二元分词了 呵呵那是前公司的项目了,以后有机会再试 2009/12/20 张沈鹏 <zsp...@gmail.com> 2009/6/14
unread,
easy_install mmseg
因为全文索引要保证全查率 所以后来换成二元分词了 呵呵那是前公司的项目了,以后有机会再试 2009/12/20 张沈鹏 <zsp...@gmail.com> 2009/6/14
12/19/09
ju...@googlecode.com
2
10/12/09
Issue 13 in judou: 设置 Issue changes 都 post 到邮件列表中吧
Comment #7 on issue 13 by twinsant: 设置 Issue changes 都 post 到邮件列表中 吧 http://code.google.com/p/judou/
unread,
Issue 13 in judou: 设置 Issue changes 都 post 到邮件列表中吧
Comment #7 on issue 13 by twinsant: 设置 Issue changes 都 post 到邮件列表中 吧 http://code.google.com/p/judou/
10/12/09
monnand
, …
twinsant
9
10/10/09
关于CRF算法
2009/10/10 monnand <monnan...@gmail.com> twinsant 写道: > 要是有个中文crf入门教程就好啦~ > > 大家可以把
unread,
关于CRF算法
2009/10/10 monnand <monnan...@gmail.com> twinsant 写道: > 要是有个中文crf入门教程就好啦~ > > 大家可以把
10/10/09
twinsant
,
HD
3
10/9/09
邮件组集体讨论第一弹
赞,老黄终于出现啦~ 俺的小白问题和想法在另一帖。 2009/10/9 HD <huan...@gmail.com> 在十一前,我们对我们的搜索引擎效果进行了仔细的评估。发现在千万级,或
unread,
邮件组集体讨论第一弹
赞,老黄终于出现啦~ 俺的小白问题和想法在另一帖。 2009/10/9 HD <huan...@gmail.com> 在十一前,我们对我们的搜索引擎效果进行了仔细的评估。发现在千万级,或
10/9/09
monnand
,
twinsant
2
10/7/09
Re: 报名贴
欢迎monnand,多交流沟通:) 2009/10/7 monnand <monnan...@gmail.com> twin...@gmail.com 写道: > 请邮件组成员
unread,
Re: 报名贴
欢迎monnand,多交流沟通:) 2009/10/7 monnand <monnan...@gmail.com> twin...@gmail.com 写道: > 请邮件组成员
10/7/09
twinsant
8/4/09
忙碌,句读7月目标顺延至8月
有闲的同学们多做贡献那: http://bit.ly/8chTy
unread,
忙碌,句读7月目标顺延至8月
有闲的同学们多做贡献那: http://bit.ly/8chTy
8/4/09
leopku
7/13/09
不错,弄了个演示
具体要做的东西正在策划,希望能有时间做完http://www.entcloud.com/
unread,
不错,弄了个演示
具体要做的东西正在策划,希望能有时间做完http://www.entcloud.com/
7/13/09
leopku
,
张沈鹏
3
7/1/09
弱问mmseg怎么没seg_text的方法?
thanks On Jul 1, 2:04 pm, 张沈鹏 <zsp...@gmail.com> wrote: > http://pypi.python.org/pypi/mmseg/
unread,
弱问mmseg怎么没seg_text的方法?
thanks On Jul 1, 2:04 pm, 张沈鹏 <zsp...@gmail.com> wrote: > http://pypi.python.org/pypi/mmseg/
7/1/09
twinsant
, …
fire9
8
6/30/09
jobsdigg招募广告启动
DB Arichitector 一样的缩写亚 XD 2009/7/1 fire9 <fire9...@gmail.com> 纠正一下 fenng同学是数据架构师,不在担任DBA工作了。
unread,
jobsdigg招募广告启动
DB Arichitector 一样的缩写亚 XD 2009/7/1 fire9 <fire9...@gmail.com> 纠正一下 fenng同学是数据架构师,不在担任DBA工作了。
6/30/09
twinsant
6/30/09
句读主页更新7月目标上线
http://judou.org/
unread,
句读主页更新7月目标上线
http://judou.org/
6/30/09
twinsant
6/29/09
蚂蚁分词代码的其余部分已开放
http://code.google.com/p/judou/source/detail?r=27 至此,所以实例代码已上传至google code。 python是非常好的快速实现想法的语言。 大家请
unread,
蚂蚁分词代码的其余部分已开放
http://code.google.com/p/judou/source/detail?r=27 至此,所以实例代码已上传至google code。 python是非常好的快速实现想法的语言。 大家请
6/29/09
twinsant
, …
张沈鹏
10
6/26/09
句读MM和RMM算法文件放出
词图已生成,可以直接到邮件组上传文件列表里看: http://groups.google.com/group/judou/files 工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的
unread,
句读MM和RMM算法文件放出
词图已生成,可以直接到邮件组上传文件列表里看: http://groups.google.com/group/judou/files 工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的
6/26/09
twinsant
6/23/09
句读词典接口和实现放出
http://code.google.com/p/judou/source/detail?r=19 大家请围观。
unread,
句读词典接口和实现放出
http://code.google.com/p/judou/source/detail?r=19 大家请围观。
6/23/09
twinsant
2
6/18/09
开放细胞词库构建工具
细胞词库SQLite3格式数据库已经上传到ftp上: http://groups.google.com/group/judou/web/%E5%8F%A5%E8%AF%BBftp%E8%B5%84%E6
unread,
开放细胞词库构建工具
细胞词库SQLite3格式数据库已经上传到ftp上: http://groups.google.com/group/judou/web/%E5%8F%A5%E8%AF%BBftp%E8%B5%84%E6
6/18/09
twinsant
6/17/09
新会员的帖子需经过审核
鉴于近日spam泛滥,论坛规则已经修改为“ 新会员的帖子需经过审核”。
unread,
新会员的帖子需经过审核
鉴于近日spam泛滥,论坛规则已经修改为“ 新会员的帖子需经过审核”。
6/17/09
twinsant
, …
pem
64
6/13/09
报名贴
* twitter: http://twitter.com/pemryan/ * douban url :http://www.douban.com/people/pem/ * Blog: http:/
unread,
报名贴
* twitter: http://twitter.com/pemryan/ * douban url :http://www.douban.com/people/pem/ * Blog: http:/
6/13/09
twinsant
,
DaiZW
5
6/10/09
judou on google code
多谢:) 已经把俺写的丑陋的下载搜狗细胞词库的源文件放上去了: http://code.google.com/p/judou/source/browse/trunk/demo/cell_dict.py
unread,
judou on google code
多谢:) 已经把俺写的丑陋的下载搜狗细胞词库的源文件放上去了: http://code.google.com/p/judou/source/browse/trunk/demo/cell_dict.py
6/10/09
张沈鹏
,
twinsant
2
6/7/09
上次发的mmseg有个大bug 这是修正版本
资源已更新。。。 如果有可能,请按照资源共享页面说明: http://groups.google.com/group/judou/web/%E5%8F%A5%E8%AF%BBftp%E8%B5%84%
unread,
上次发的mmseg有个大bug 这是修正版本
资源已更新。。。 如果有可能,请按照资源共享页面说明: http://groups.google.com/group/judou/web/%E5%8F%A5%E8%AF%BBftp%E8%B5%84%
6/7/09
twinsant
,
Qiangning Hong
3
6/4/09
更新资源页面
多谢Qiangning童鞋~ 2009/6/4 Qiangning Hong <hon...@gmail.com> done
unread,
更新资源页面
多谢Qiangning童鞋~ 2009/6/4 Qiangning Hong <hon...@gmail.com> done
6/4/09
twinsant
, …
杨志宇
8
6/2/09
句读主页更新本月目标
晕,误导大家了,总共系统包括9000行代码,除了俺改的,利用已有的。 俺写的部分有2000行左右。。。 2009/6/2 杨志宇 <mei...@gmail.com> 一周9000行!动力
unread,
句读主页更新本月目标
晕,误导大家了,总共系统包括9000行代码,除了俺改的,利用已有的。 俺写的部分有2000行左右。。。 2009/6/2 杨志宇 <mei...@gmail.com> 一周9000行!动力
6/2/09