这篇文章有用不:
http://blog.zdnet.com.cn/html/01/421901-2880527.html
--
Best Regards,
Leo Jay
On 11月9日, 下午10时01分, Leo Jay <python.leo...@gmail.com> wrote:
> 2009/11/9 悟空飞 <wangb...@gmail.com>:
引用(GBK维基百科):
由于GB 2312-80只收录了6763个汉字,有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“啰”),部分人名用字(如中国
前总理朱镕基的“镕”字),台湾及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内。中文电脑开发商,于是利用了GB 2312-80未有使用的
编码空间,收录了所有出现在Unicode 1.1及GB 13000.1-93之中的汉字,制定了GBK编码。
使用GBK基本上可以满足绝大部分中文应用的需求,但是由于它兼容了GB2312,所以在GB2312之后加入的汉字与之前的汉字就不是按照拼音排序
了。
我想在UTF-8的编码方式下按照拼音排序,看来是不是只能建立一个汉字拼音对照表,将汉字转换成拼音,然后再根据拼音进行排序。
Best Regards.
On 11月9日, 下午10时04分, "@@" <ask...@gmail.com> wrote:
> 好像gb系列就是按拼音排序的。转成gb 直接排序就行吧
>
> 2009/11/9 悟空飞 <wangb...@gmail.com>
>
>
>
> > 第一次提问,希望知道的前辈指点一下。
第一次提问,希望知道的前辈指点一下。
>>> a=['你','是','我','的','小','呀','小','苹','果']
>>> def yo(n): return n.encode('GBK')
>>> sorted(a,key=yo)['的', '果', '你', '苹', '是', '我', '小', '小', '呀']2009年的提问…
--
--
邮件来自: `CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
详情: http://code.google.com/p/cpyug/wiki/CpyUg
G+: https://plus.google.com/u/0/communities/108786798869709602787
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
---
您收到此邮件是因为您订阅了Google网上论坛中的“python-cn(华蟒用户组,CPyUG 邮件列表)”论坛。
要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到python-cn+...@googlegroups.com。
要在网络上查看此讨论,请访问https://groups.google.com/d/msgid/python-cn/5a65a384-99a3-4c58-8dab-3e2649641c32%40googlegroups.com。
要查看更多选项,请访问https://groups.google.com/d/optout。
--
--
邮件来自: `CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
详情: http://code.google.com/p/cpyug/wiki/CpyUg
G+: https://plus.google.com/u/0/communities/108786798869709602787
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
---
您收到此邮件是因为您订阅了 Google 网上论坛的“python-cn(华蟒用户组,CPyUG 邮件列表)”论坛。
要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到python-cn+...@googlegroups.com。
要在网络上查看此讨论,请访问 https://groups.google.com/d/msgid/python-cn/20140826144450.GA32028%40lilyforest。
要查看更多选项,请访问 https://groups.google.com/d/optout。