--
Best regards,
lilydjwg
Linux Vim Python 我的博客:
http://lilydjwg.is-programmer.com/
--
A: Because it obfuscates the reading.
Q: Why is top posting so bad?
--
邮件来自: `CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
退订: python-cn+...@googlegroups.com (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/CpyUg
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
单子的拼音是字母的有限组合,不考虑内容是否有意义的情况下,能否做一个匹配呢?
把字符串按拼音的规则解析?这样做是可以,但是要求有些严。我在想,能不能像
OCR 那样进行模式识别?然后再加上机器学习什么的?
看看cedict?
from miui
luwen ing <ning...@gmail.com>编写:
考虑容错性的话,建议还是模式识别吧。
--
邮件来自: `CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
退订: python-cn+...@googlegroups.com (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/CpyUg
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
On Wed, Apr 18, 2012 at 10:34:50AM +0800, iamzcy_hit iamzcy_hit wrote:
> 楼主是这个意思吗?
> 判断这个字母序列“nihaowoshiyigexuesheng”是英文串还是汉语拼音串???
>
> 在 2012年4月18日 上午10:12,iamzcy_hit iamzcy_hit <iamz...@gmail.com>写道:
>
> > 训练一个分类器吧
> >
> > 在 2012年4月18日 上午9:51,Liang Sun <i...@liangsun.org>写道:
> >
> > 考虑容错性的话,建议还是模式识别吧。
> >>
> >>
> >> On Tuesday, April 17, 2012 7:31:55 PM UTC+8, 依云 wrote:
> >>>
> >>> 一串字符,可能是拼音或者英文或者代码等。**如何判断它是否为拼音呢,在不使用
> >>> 诸如 Google Translate 的前提下?
> >>>
> >>> --
> >>> Best regards,
> >>> lilydjwg
> >>>
> >>> Linux Vim Python 我的博客:
> >>> http://lilydjwg.is-programmer.**com/<http://lilydjwg.is-programmer.com/>
On Wed, Apr 18, 2012 at 01:52:36PM +0800, Eric Miao wrote:
> 前几天用到的时候随手写的,按拼音规则判断,拼音规则根据WikiPedia来的。
>
> 2012/4/18 依云 <lily...@gmail.com>
>
> > 对。另外,可能有空格。还可能是一行代码什么的,我要判定它是否为拼音,然后
> > 拿给搜狗云输入法之类的「翻译」成汉字。
> >
> > On Wed, Apr 18, 2012 at 10:34:50AM +0800, iamzcy_hit iamzcy_hit wrote:
> > > 楼主是这个意思吗?
> > > 判断这个字母序列“nihaowoshiyigexuesheng”是英文串还是汉语拼音串???
> > >
> > > 在 2012年4月18日 上午10:12,iamzcy_hit iamzcy_hit <iamz...@gmail.com>写道:
> > >
> > > > 训练一个分类器吧
> > > >
> > > > 在 2012年4月18日 上午9:51,Liang Sun <i...@liangsun.org>写道:
> > > >
> > > > 考虑容错性的话,建议还是模式识别吧。
> > > >>
> > > >>
> > > >> On Tuesday, April 17, 2012 7:31:55 PM UTC+8, 依云 wrote:
> > > >>>
> > > >>> 一串字符,可能是拼音或者英文或者代码等。**如何判断它是否为拼音呢,在不使用
> > > >>> 诸如 Google Translate 的前提下?
--
Best regards,
lilydjwg
Linux Vim Python 我的博客:
print split_pinyin('aoaoaoaoaoaoaoaoaoaoaoaoaoaoaoaoaoaoaoaox')
就知道了
改成递推就没问题了
2012/4/18 Eric Miao <eric....@gmail.com>:
On Apr 18, 1:22 pm, 依云 <lilyd...@gmail.com> wrote:
> 对。另外,可能有空格。还可能是一行代码什么的,我要判定它是否为拼音,然后
> 拿给搜狗云输入法之类的「翻译」成汉字。
>
>
>
>
>
>
>
>
>
> On Wed, Apr 18, 2012 at 10:34:50AM +0800, iamzcy_hit iamzcy_hit wrote:
> > 楼主是这个意思吗?
> > 判断这个字母序列"nihaowoshiyigexuesheng"是英文串还是汉语拼音串???
>
> > 在 2012年4月18日 上午10:12,iamzcy_hit iamzcy_hit <iamzcy...@gmail.com>写道:
>
> > > 训练一个分类器吧
>
> > > 在 2012年4月18日 上午9:51,Liang Sun <i...@liangsun.org>写道:
>
> > > 考虑容错性的话,建议还是模式识别吧。
>
> > >> On Tuesday, April 17, 2012 7:31:55 PM UTC+8, 依云 wrote:
>
> > >>> 一串字符,可能是拼音或者英文或者代码等。**如何判断它是否为拼音呢,在不使用
> > >>> 诸如 Google Translate 的前提下?
>
> > >>> --
> > >>> Best regards,
> > >>> lilydjwg
>
> > >>> Linux Vim Python 我的博客:
> > >>>http://lilydjwg.is-programmer.**com/<http://lilydjwg.is-programmer.com/>
> > >>> --
> > >>> A: Because it obfuscates the reading.
> > >>> Q: Why is top posting so bad?
>
> > >>> --
> > >> 邮件来自: `CPyUG`华蟒用户组(中文Python技术邮件列表)
> > >> 规则:http://code.google.com/p/cpyug/wiki/PythonCn
> > >> 发言: pyth...@googlegroups.com
> > >> 退订: python-cn+...@googlegroups.com (向此发空信即退!)
> > >> 详情:http://code.google.com/p/cpyug/wiki/CpyUg
> > >> 严正: 理解列表! 智慧提问!http://wiki.woodpecker.org.cn/moin/AskForHelp
>
> > > --
> > > 我们注定要被刻上这个时代的烙印.....
>
> > --
> > 我们注定要被刻上这个时代的烙印.....
>
> > --
> > 邮件来自: `CPyUG`华蟒用户组(中文Python技术邮件列表)
> > 规则:http://code.google.com/p/cpyug/wiki/PythonCn
> > 发言: pyth...@googlegroups.com
> > 退订: python-cn+...@googlegroups.com (向此发空信即退!)
> > 详情:http://code.google.com/p/cpyug/wiki/CpyUg
> > 严正: 理解列表! 智慧提问!http://wiki.woodpecker.org.cn/moin/AskForHelp
感觉不是正交的 没办法
这种情况需要待识别的文本有一定长度,否则还得靠字典。
于 12-4-17 下午9:53, 依云 写道: