建议:邮件编码UTF-8

46 views
Skip to first unread message

FANG Kun (Richard)

unread,
Sep 16, 2007, 5:19:18 AM9/16/07
to min...@googlegroups.com
大家能把发出信件的编码设置为UTF-8吗?现在电脑上的收件程序一般都能识别GB2312,但很多手持设备(比如iPhone)还是不支持的.

--
FANG Kun (Richard)

cathayan

unread,
Sep 16, 2007, 10:26:41 AM9/16/07
to min...@googlegroups.com
哪封信?这么老土?请大侠点名!

欢迎使用著名的Gmail Web版,打倒iPhone.

On 9/16/07, FANG Kun (Richard) <richa...@gmail.com> wrote:
大家能把发出信件的编码设置为UTF-8吗?现在电脑上的收件程序一般都能识别GB2312,但很多手持设备(比如iPhone)还是不支持的.

--
FANG Kun (Richard)





--
cath...@gmail.com
http://blog.cathayan.org

CHEN,Zizhao

unread,
Sep 17, 2007, 8:51:24 PM9/17/07
to min...@googlegroups.com
国内有些开发人员,一提到汉字就GB2312。我恨死了。GB2312太局限了。至少也得弄个GB18030吧。


--
CHEN Zizhao
Gtalk/Jabber:ncowboy@gmail.com
E-Mail:CHEN@Sep24th.COM

Zheng YAN

unread,
Sep 17, 2007, 9:16:42 PM9/17/07
to min...@googlegroups.com
GB18030 又不是什么好标准
说个GBK也就算了

cathayan

unread,
Sep 17, 2007, 9:21:23 PM9/17/07
to min...@googlegroups.com
不是GBK的话,我们早就全国Unicode了。

Zheng YAN

unread,
Sep 17, 2007, 9:24:24 PM9/17/07
to min...@googlegroups.com
也不一定
再说GBK也不是国家标准
是人家为了做做好,多支持点字,自己搞得兼容方案

cathayan

unread,
Sep 17, 2007, 9:27:17 PM9/17/07
to min...@googlegroups.com
这是业界很广泛的一个传闻,也就是为什么GBK不是强制标准而GB18030却是强制标准的原因。


有关GB18030编码来由的传说



from: ler...@newsmth.net

简单说一下我对这段历史的理解吧,说错了欢迎大家指正。

1,GB2312是很老的东西了,早就发现不够用了。

2,94年(还是之前)国家推出了建议性标准gb18000(还是13000我忘了),这个标准其实就是utf-8标准(除了名字,完全一样),同时也建议微软公司采纳。--(据说是1993年,GB13000,应该是ISO10646)

3,微软借口说gb18000还不成熟,为了取得中国市场的垄断地位,自己搞了一套汉字标准,于是它就随着win95和office之类的流行起来了,国 家看生米已经煮成了熟饭,只好把这套标准定为国标GBK标准。--(其实只是指导性标准,并非强制性,GB18030是强制性标准)

4,微软到了99年(前后吧),又说GBK已经落伍了,现在流行utf-8标准,准备全盘转换成utf-8,这些把有关部门惹怒了。NND,当年我们推utf-8你说不成熟,自己搞了一套,现在赚得盆满钵满了又自己说要推utf-8了,你丫微软分明就没把政府放在眼里。

5,于是政府怒了,强制推行gb18030标准(这个标准前面兼容GBK,其他码位兼容utf-8),算是过渡标准吧。要求微软强制执行,否则产品不得在 大陆买。于是基本搞死了微软的WindowsMe,差点搞死了Office2000(据说发行前几个月,微软除了改字符编码就没干其他什么事情)--(确 实,WinMe是我认为的最差的Windows版本,而office2k也是前不着村,后不着店,前后兼容性都差)

6,由于以上历史原因,现在就是GB2312,GBK,GB18030,UTF-8并存了。

7,如果不是万恶的微软,我们早就用上UTF-8了。

8,所以说微软和政府关系一直很僵,不是说着玩的,微软太目中无政府了。

9,以上是我从其他地方看来的,可能记得不是太真切了,说的不对请大家指正。

【按】这是在水母Linux版上的讨论所引发的。只有用Linux的普通用户才会关心编码问题,因为选择太多了,选哪个好确实是个问题。从长远看,应该选 utf-8,可从一般使用角度来看,GBK足够也适合以前的文件现状,并且也可以同UTF-8编码的人交流,程序支持就是了。所以我目前还是用GBK。也 许应该用Utf-8。香港政府倒是在推广ISO10646的,还有免费字体供应。



Zheng YAN

unread,
Sep 17, 2007, 9:31:32 PM9/17/07
to min...@googlegroups.com
那个时候的 GB13000 的确是不够成熟啊
要人家商业公司来担风险怎么可能

cathayan

unread,
Sep 17, 2007, 9:34:48 PM9/17/07
to min...@googlegroups.com
有什么不成熟的呢?国际标准啊,就是ISO10646,现在也在用啊

唯一不成熟的就是微软,它到Win2000才有底层的支持吧

Zheng YAN

unread,
Sep 17, 2007, 9:36:32 PM9/17/07
to min...@googlegroups.com
那时候还是草案吧

Fwolf

unread,
Sep 17, 2007, 9:52:36 PM9/17/07
to min...@googlegroups.com
gb2312是国标,不过确实是有些过时了。

On Tue, Sep 18, 2007 at 10:24:24AM +0900, Zheng YAN wrote:
> 也不一定
> 再说GBK也不是国家标准
> 是人家为了做做好,多支持点字,自己搞得兼容方案
>

--
http://www.fwolf.com/
He is now rising from affluence to poverty.
-- Mark Twain

signature.asc

Zheng YAN

unread,
Sep 17, 2007, 9:55:36 PM9/17/07
to min...@googlegroups.com
以前的国标,现在不是国标了
别把1949年宪法拿出来当令牌了啊 haha

> -----BEGIN PGP SIGNATURE-----
> Version: GnuPG v1.4.6 (GNU/Linux)
>
> iD8DBQFG7y9kSXA0uLfTfucRAqgWAJ9d0Xp0z8/nedbBZ038A7UZhV4sWQCfdJxg
> bx3WsPIgH55MQd97/q2AIbw=
> =VzCV
> -----END PGP SIGNATURE-----
>
>

cathayan

unread,
Sep 17, 2007, 10:01:38 PM9/17/07
to min...@googlegroups.com
现在是18030,推广也不怎么样。

我想微软现在也未必很爽,有很大的向前兼容的包袱,底层全面的unicode了,上面的api还要会大量的这类老编码特别考虑,能不累吗

On 9/18/07, Zheng YAN <zhe...@gmail.com > wrote:

CHEN,Zizhao

unread,
Sep 17, 2007, 11:54:17 PM9/17/07
to min...@googlegroups.com
unicode就好啊。新版的TM是unicode程序了,虽然是中文版的可是也可以在日文版上面使用。

以前的非unicodeQQ就有这个问题----中文版QQ在其他语言的操作系统上使用就有乱码。

On 9/18/07, cathayan <cath...@gmail.com> wrote:

Zheng YAN

unread,
Sep 17, 2007, 11:56:06 PM9/17/07
to min...@googlegroups.com
你说的unicode和 utf8 应该不是一个意思
呵呵

On 9/18/07, CHEN,Zizhao <CH...@sep24th.com> wrote:

CHEN,Zizhao

unread,
Sep 17, 2007, 11:57:28 PM9/17/07
to min...@googlegroups.com
某些不规范的邮件程序,标着gb2312的编码,可是却出现了gb2312意外的字符。导致,我的KMail(linux下的很多东西,都死板的跟着规范走)使用gb2312的编码来查看,就导致了个别字符无法显示。

GMail好像有时候就是这样。不知道大家和我是否有同感。

On 9/18/07, CHEN,Zizhao <CH...@sep24th.com> wrote:

Zheng YAN

unread,
Sep 18, 2007, 12:00:08 AM9/18/07
to min...@googlegroups.com
因为gb2312已经变成 GBK 的 alias 了
你照GBK解码就不会出错了

CHEN,Zizhao

unread,
Sep 18, 2007, 12:02:03 AM9/18/07
to min...@googlegroups.com
的确。unicode是一个字符集。utf8不过对该字符集的一个编码方式。

CHEN,Zizhao

unread,
Sep 18, 2007, 12:05:30 AM9/18/07
to min...@googlegroups.com
标准就是标准。不应该改变。

"GB2312-80仅收汉字6763个,这大大少于现有汉字,随着时间推移及汉字文化的不断延伸推广,有些原来很少用的字,现在变成了常用字,例如:朱镕基的"镕"字,未收入GB2312-80,"

不过,因为gbk和gb18030是gb2312的超级。以gb18030去解码gb2312编码后的东西,是不会出错的。可是KMail就是不这么干。我也没办法。

Fwolf

unread,
Sep 18, 2007, 2:14:33 AM9/18/07
to min...@googlegroups.com
gmail好多了,mutt就无法识别一封邮件中,
既有gb2312,又有big5编码的情况。

On Tue, Sep 18, 2007 at 12:57:28PM +0900, CHEN,Zizhao wrote:
> 某些不规范的邮件程序,标着gb2312的编码,可是却出现了gb2312意外的字符。导致,我的KMail(linux下的很多东西,都死板的跟着规范走)使用gb2312的编码来查看,就导致了个别字符无法显示。
>
> GMail好像有时候就是这样。不知道大家和我是否有同感。
>

--
http://www.fwolf.com/
Behold, the fool saith, "Put not all thine eggs in the one basket"--which is
but a manner of saying, "Scatter your money and your attention;" but the wise
man saith, "Put all your eggs in the one basket and--WATCH THAT BASKET."
-- Mark Twain, "Pudd'nhead Wilson's Calendar"

signature.asc
Reply all
Reply to author
Forward
0 new messages