--
Yili Zhao
会议没有不隆重的;闭幕没有不胜利的
讲话没有不重要的;鼓掌没有不热烈的;
领导没有不重视的;看望没有不亲切的;
接见没有不亲自的;进展没有不顺利的;
完成没有不圆满的;成就没有不巨大的;
工作没有不扎实的;效率没有不显著的;
决议没有不通过的;人心没有不振奋的;
班子没有不团结的;群众没有不满意的;
领导没有不微笑的,问题没有不解决的;
事情没有不瞩目的,会谈没有不坦诚的;
反对没有不强烈的,交涉没有不严正的;
完成没有不超额的;竣工没有不提前的;
中日没有不友好的,中美没有不合作的;
节日没有不祥和的;妇女没有不解放的;
决策没有不英明的;路线没有不正确的;
扫黄没有不彻底的;行动没有不果断的;
形势没有不大好的;观点没有不赞同的;
气氛没有不友好的;信心没有不增强的;
粮食没有不丰收的,抗洪没有不英勇的;
贪官总是极少数的,群众总是受蒙蔽的;
干涉没有不粗暴的,遗憾没有不深表的
对抗总是没出路的,后果总是你来负的;
台读分子总是一小撮的,反话势力总是到处有的,
亡我之心总是不死的,美国人民没有不友好的,
态度没有不坚决的,措施没有不得力的,
成绩总是主要的,问题总是暂时的,
阿族武装总没好人的,塞族武装总没坏人的,
科斯图呢察总是美国豢养的,米络舍维奇总是冤枉的,
申奥没有不支持的,法律没有不公正的,
上述没有不驳回的,国家机密总没说得出定义的,
调研没有不深入的,贯彻没有不彻底的,
理论没有不高屋建瓴的,政策没有不鼓舞人心的;
大赛没有一次不冲击的,关键比赛没有一场赢的,
生命没有不宝贵的,抢救没有不及时的,
损失没有不惨重的,设计没有不合理的,
技术没有不先进的,论证没有不专家的,
检测没有不严格的,运行没有不可靠的,
系统没有不安全的,特色没有不中国的,
失误总是难免的,运动总是成效显著的,
问题总是历史造成的;创造利润没有小的,
带来利税没有少的,农业没有不遭灾的,
灾年没有不丰收的。江河没有不治的,
大水没有不发的,团结总是紧密的,
拥护总是一致的,旗帜总是高举的,
思想总是坚持的,道路总是曲折的,
前途总是光明的。社会总是在嘴边的,
初级阶段总是过不完的!工人下岗没有不再就业的,
成绩肯定是在领导的关心下取得的;
农民减负没有不奔小康的!
前总统没有不是老朋友的。
2011/12/1 Yili Zhao <pan...@gmail.com>:
> --
> 来自: Golang China 中文Go语言技术邮件列表
> 发言: golang...@googlegroups.com
> 在线: http://groups.google.com/group/golang-china?hl=zh-CN
>
Unicode 和 UTF-32 可不是一回事啊。Unicode 表示的是一个整数和一个字符之间的对应关系,而 UTF-8、UTF-16、UTF-32 则是这个整数在计算机中的存储与处理方式。
On Thu, Dec 1, 2011 at 2:59 PM, Oling Cat <olin...@gmail.com> wrote:
UTF-8是变长编码,用一个字节表示ASCII字符,用两个字节表示西欧字符和一部分亚洲字符,用三个字节表示亚洲的大部分字符,,还有极小一部分几乎用不到的字符用四个字节表示。Unicode是定长编码,也是标准和规范,所有字符都用四个字节编码,即UTF-32。(补充个小知识:Unicode的学名叫"Universal Multiple-Octer Coded Character Set",简称UCS,UCS是"Unicode Character Set"的缩写,所以UCS其实就是指Unicode。UCS有两种格式:UCS2和UCS4,UCS2就是用两个字节编码,所以其变长编码的实现又叫UTF-16,;UCS4就是四个字节编码,所以其编码实现又叫UTF-32。1byte=8bit应该知道吧?)按说一切都用Unicode就解决了,就算转换也是在ASCII字符前面加三个字节的0,比如ASCII单字节的0x20变成UTF-32四字节的0x00000020。但由于以前的C语言和Unix使用ASCII编码,而0x00在C语言里面是控制字符,所以定长的UTF-32和ASCII码不兼容,UTF-16虽然是变长的,但最小长度为2个字节,所以也同样不兼容。UTF-8虽然兼容了ASCII,但转换为UTF-16有一套规则,详细请看参考来源。简而言之,Unicode是标准,UTF-8是Unicode标准中UCS2格式的一个实现+扩展,就像ANSI-C是标准,gcc是其实现+自己的扩展,你问的那句就像“某程序的源码是包含了gcc库的ANSI-C语言源码”一样。--参考来源:1.字符编码的故事2.各种编码间的关系--Hello! This is Oling Cat!
--
来自: Golang China 中文Go语言技术邮件列表
发言: golang...@googlegroups.com
在线: http://groups.google.com/group/golang-china?hl=zh-CN
按这种方式,假设整数1024代表中文字符'语'字,所谓Unicode指的就是1024到'语'之间的对应关系;而这个整数存储在计算机里面,用几个字节来表示,就要看是采用UTF-8还是UTF-16,或者是UTF-32。如果采用UTF-8或者是UTF-16,那就用两个字节存储;如果使用UTF-32,那就使用四个字姐存储。
这种理解方式对吗?
--
Yili Zhao
下面是Unicode和UTF-8转换的规则
Unicode UTF-8
0000 - 007F 0xxxxxxx
0080 - 07FF 110xxxxx 10xxxxxx
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx
例如"汉"字的Unicode编码是6C49。6C49在0800-FFFF之间,所以要用3字节模板:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 1100 0100 1001,将这个比特流按三字节模板的分段方法分为0110 110001 001001,依次代替模板中的x,得到:1110-0110 10-110001 10-001001,即E6 B1 89,这就是其UTF8的编码。
参考 http://play.golang.org/p/GjMzBT9GeN
http://golang.org/doc/go_spec.html#String_literals
http://golang.org/doc/go_spec.html#Conversions
2011/12/1 Yili Zhao <pan...@gmail.com>:
--
Yili Zhao
2011/12/1 Oling Cat <olin...@gmail.com>:
2011/12/1 Yili Zhao <pan...@gmail.com>:
--
来自: Golang China 中文Go语言技术邮件列表
发言: golang...@googlegroups.com
在线: http://groups.google.com/group/golang-china?hl=zh-CN
2011/12/1 shiwei xu <xushi...@gmail.com>:
--
Yili Zhao