On 5月20日, 下午3时38分, liugang <liuga...@gmail.com> wrote:
> 这里的sn.getPos()对应的是nr.dct里的词性
> ==============================构成人名的角色=================================
> Tag = B( 1), Count = 513, 姓氏
> Tag = C( 2), Count = 955, 双名的首字
> Tag = D( 3), Count = 1,043, 双名的末字
> Tag = E( 4), Count = 574, 单名
> Tag = F( 5), Count = 3, 前缀
> Tag = G( 6), Count = 9, 后缀
> *Tag = K( 10), Count = 0, 人名的上文
> Tag = L( 11), Count = 1,198, 人名的下文
> Tag = M( 12), Count = 1,684, 两个中国人名之间的成分
> Tag = N( 13), Count = 67, <无>
> *Tag = U( 20), Count = 0, 人名的上文与姓氏成词
> *Tag = V( 21), Count = 0, 人名的末字与下文成词
> Tag = X( 23), Count = 84, 姓与双名首字成词
> Tag = Y( 24), Count = 47, 姓与单名成词
> Tag = Z( 25), Count = 388, 双名本身成词
> Tag = m( 44), Count = 58, <无>
> Tag = *(100), Count = 1, 始##始
> Tag = *(101), Count = 1, 末##末
>
> 应该改成小于5,就是把能够构成姓名的词提出来,组合成名字
>
> 2009/5/20 zjwang <wangzhijiang...@yahoo.com.cn>