ictclas4j的 统计功能

40 views
Skip to first unread message

icalm

unread,
May 15, 2009, 1:40:27 PM5/15/09
to ictclas
我现在想在分词结果的基础上统计分词的结果。
能够统计出一段话中频度最高的几个关键词,同时也能够根据词性进行区分。
譬如一个统计需求是,在一篇文章中频率最高的名词。

有什么方法吗?

现在我的处理方式是在分词的结果上进行二次处理,用正则表达式对字符串进行处理。

liugang

unread,
May 17, 2009, 10:18:10 PM5/17/09
to ict...@googlegroups.com
最简单的方法就是在分词基础上做二次处理

2009/5/16 icalm <Alex....@gmail.com>



--
Yours sincerely
liugang
Reply all
Reply to author
Forward
0 new messages