ictclas4j 分词是 遇到 "月份牌" 三个字 就进入死循环了

25 views
Skip to first unread message

彭亮

unread,
Apr 8, 2009, 9:58:30 PM4/8/09
to ictclas
跟踪了一下,是NShortPath类 里面
while (curNode > 0) {
     SegTag.println2Err("Test ----3");
     // Get its parent and store them in nParentNode,nParentIndex
     QueueNode qn = parent[curNode].pop(false);
     if (qn == null)
      qn = parent[curNode].top();
     if (qn != null) {
      curNode = qn.getParent();
      curIndex = qn.getIndex();
     }
     if (curNode > 0)
      queResult.push(new QueueNode(curNode, curIndex, 0));
    }
这个循环 进入了 死循环 跳不出来了...
 
因为我是写 一个搜索工具 用到ictclas4j  没仔细研究过ictclas4j  的代码  希望各位大大 帮忙解决一下
 
ps:ictclas4j的 分词有点慢啊...

Dancefire

unread,
Apr 8, 2009, 11:30:46 PM4/8/09
to ict...@googlegroups.com
在ICTCLAS中,原子切分的时候,针对“月份”进行了特殊处理,防止这两个字拆开。ICTCLAS4j是根据ICTCLAS改写的,因此应该具有相同的逻辑。那么很有可能是原子切分的时候,针对“月份”这两个字进行特殊处理部分的代码有bug。你可以到响应的位置寻找bug。

2009/4/9 彭亮 <bez...@gmail.com>:

--
Tao Wang
Microsoft Certified Technology Specialist
CCNA

Reply all
Reply to author
Forward
0 new messages