正如您所述,确实存在上述异常,在ictclas4j中可以在AdjustSeg类的firstAdjust()方法中做如下调整:
if (".".equals(last) || "/".equals(last)) {
pos = -POSTag.NUM;
srcWord = curWord.substring(0, curWord.length() - 1);
curWord = Utility.UNKNOWN_NUM;
index--;
//增加如下两行
sn.setWord(curWord.substring(curWord.length() - 1));
sgs.set(i, sn);
}
在08-4-9,tli123 <tli...@126.com> 写道:
"卡-50/卡-52"
上述句子在ICSCLAS的网上演示中会出错,在下载的版本上分词也会出错,哪位高手知识为什么?