网上论坛
登录
网上论坛
ictclas
会话
关于
发送反馈
帮助
ictclas4j的 统计功能
已查看 40 次
跳至第一个未读帖子
icalm
未读,
2009年5月15日 13:40:27
2009/5/15
回复作者
登录即可回复作者
转发
登录即可转发
删除
您无权在此群组中删除帖子
复制链接
举报消息
显示原始帖子
要么此群组的电子邮件地址为匿名状态,要么您得查看成员电子邮件地址权限才能查看原始帖子
收件人 ictclas
我现在想在分词结果的基础上统计分词的结果。
能够统计出一段话中频度最高的几个关键词,同时也能够根据词性进行区分。
譬如一个统计需求是,在一篇文章中频率最高的名词。
有什么方法吗?
现在我的处理方式是在分词的结果上进行二次处理,用正则表达式对字符串进行处理。
liugang
未读,
2009年5月17日 22:18:10
2009/5/17
回复作者
登录即可回复作者
转发
登录即可转发
删除
您无权在此群组中删除帖子
复制链接
举报消息
显示原始帖子
要么此群组的电子邮件地址为匿名状态,要么您得查看成员电子邮件地址权限才能查看原始帖子
收件人 ict...@googlegroups.com
最简单的方法就是在分词基础上做二次处理
2009/5/16 icalm
<
Alex....@gmail.com
>
--
Yours sincerely
liugang
回复全部
回复作者
转发
0 个新帖子