我使用的原始语料库,里面已经将每个句子以词语为单位切分好了,而我需要将切分好的词语转化为拼音,以进行模型的训练。
转化工作靠编写程序来完成,前提条件是有一个好的 词语->拼音 的词典。如果某开源软件直接实现了 词语->拼音 的转化而且在处理多音字时也表现的
好的话,那再好不过了。
Thank u all the same.
On Jan 8, 6:14 pm, 张沈鹏 <zsp...@gmail.com> wrote:
> 发错了
> 是这个http://code.google.com/p/pyzh/source/browse/#svn/trunk/zhutils/word/w...
简单点是不是可以先单字转化,然后用替换纠正特殊读音
--
七夜&七连星,你最真诚的朋友!
http://hi.baidu.com/qqwaqq
> > > 是这个http://code.google.com/p/pyzh/source/browse/#svn/trunk/zhutils/word/w...- Hide quoted text -
>
> - Show quoted text -
只是这样的处理办法在人名和古文这类单字语境中无效
> > > > 是这个http://code.google.com/p/pyzh/source/browse/#svn/trunk/zhutils/word/w...Hide quoted text -