ictclas4j的 统计功能

已查看 40 次
跳至第一个未读帖子

icalm

未读,
2009年5月15日 13:40:272009/5/15
收件人 ictclas
我现在想在分词结果的基础上统计分词的结果。
能够统计出一段话中频度最高的几个关键词,同时也能够根据词性进行区分。
譬如一个统计需求是,在一篇文章中频率最高的名词。

有什么方法吗?

现在我的处理方式是在分词的结果上进行二次处理,用正则表达式对字符串进行处理。

liugang

未读,
2009年5月17日 22:18:102009/5/17
收件人 ict...@googlegroups.com
最简单的方法就是在分词基础上做二次处理

2009/5/16 icalm <Alex....@gmail.com>



--
Yours sincerely
liugang
回复全部
回复作者
转发
0 个新帖子