Issue 15 in judou: 对judou.py有关编码的补丁

7 views
Skip to first unread message

ju...@googlecode.com

unread,
Oct 18, 2010, 5:20:47 AM10/18/10
to ju...@googlegroups.com
Status: New
Owner: ----
Labels: Type-Defect Priority-Medium

New issue 15 by gnap.an: 对judou.py有关编码的补丁
http://code.google.com/p/judou/issues/detail?id=15

问题描述:
目前的mm_seg, atom_seg, ch_seg,rmm_seg等函数内部,存在多个进行编码转
换的地方,使得编码处理位置分散,一旦代码改动,极易出错。同时,几处代码并没有
使用全局的ENCODING变量,而是直接使用'utf-8'制定编码,
问题解决:
附件中的patch将所有函数修改为只支持unicode内码,利用
create_local_seg()生成支持转吗的分词函数。函数接口与当前测试用例兼容。
补丁方法:judou/目录下执行patch -p1 < path_to/encoding-fix-r43.patch

Attachments:
encoding-fix-r43.patch 14.8 KB

ju...@googlecode.com

unread,
Oct 18, 2010, 5:31:59 AM10/18/10
to ju...@googlegroups.com

Comment #1 on issue 15 by twinsant: 对judou.py有关编码的补丁
http://code.google.com/p/judou/issues/detail?id=15

gnap.an你好,感谢patch,你的邮箱是?我把你直接加入member

gnap

unread,
Oct 18, 2010, 9:05:37 PM10/18/10
to 句读:开放的中文分词项目

你好,我的邮箱是gnap.an AT gmail.com.很荣幸能够参与judou开发。

On Oct 18, 5:31 pm, ju...@googlecode.com wrote:
> Comment #1 on issue 15 by twinsant: 对judou.py有关编码的补丁http://code.google.com/p/judou/issues/detail?id=15
>
> gnap.an你好,感谢patch,你的邮箱是?我把你直接加入member

twinsant

unread,
Oct 18, 2010, 9:42:20 PM10/18/10
to ju...@googlegroups.com
已加入,感谢参与!

2010/10/19 gnap <gnap.an@gmail.com>
>
> gnap.an你好,感谢patch,你的邮箱是?我把你直接加入member

--
====================
句读:开放的中文分词项目
====================

主要链接
=======

* 句读首页:http://judou.org

使用
====
* 讨论请发邮件到ju...@googlegroups.com
* 查看更多到http://groups.google.com/group/judou

* 想退订发邮件到judou+un...@googlegroups.com

ju...@googlecode.com

unread,
Oct 19, 2010, 3:16:11 AM10/19/10
to ju...@googlegroups.com

Comment #2 on issue 15 by gnap.an: 对judou.py有关编码的补丁
http://code.google.com/p/judou/issues/detail?id=15

在这里重回一下吧,Groups被墙了不好上。我邮箱是:gnap.an AT gmail.com

twinsant

unread,
Oct 19, 2010, 4:08:11 AM10/19/10
to ju...@googlegroups.com
gnap.an已经是commiter了:)


Comment #2 on issue 15 by gnap.an: 对judou.py有关编码的补丁 在这里重回一下吧,Groups被墙了不好上。我邮箱是:gnap.an AT gmail.com
Reply all
Reply to author
Forward
0 new messages