Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

IE3.01 MojiBake

3 views
Skip to first unread message

Isao Yasuda

unread,
Apr 11, 1997, 3:00:00 AM4/11/97
to

安田リムネット名叀屋です。

Saito HiroAKI wrote:

> Windows95でむンタヌネット゚クスプロヌラを
> 䜿甚しおいたすが、原因䞍明の文字化けが頻発したす。
>
> 半角カナではなく、普通の党角文字の郚分で発生したす。

わざわざ、1 Byte カナではないずおっしゃっおいるずころで、
疑うのは倱瀌だずは思うのですが、

> 特に、"「"や、"」"などの蚘号呚蟺が倚くなっおいたす。

この "「 " や "」" などの蚘号が 1 Byte カナになっおいたせんか

Windows95 だず、これらの蚘号の 1 Byte 版ず 2 Byte 版の
違いがわかりにくいこずが倚いです。

> 再読蟌をするず正しく衚瀺されるこずもありたす。

ただ、これがよくわからないんですよねぇ 。

--
---+---+-|-+---+---|---+---+-|-+---+---|---+---+-|-+---+---|---+---+-|
安田 廷勳 Isao Yasuda  #! There's more than one way to do it.
Private | リムネット名叀屋
| E-Mail <mailto:i_ya...@na.rim.or.jp>
| URL <URL:http://www.na.rim.or.jp/‟i_yasuda/>
Business | プリ・テック株匏䌚瀟 TEL(0563)55-0707 FAX(0563)55-0202
| E-Mail <mailto:pri...@gol.com>
| URL <URL:http://www.sphere.ad.jp/pritech/>
                                  Π

Saito HiroAKI

unread,
Apr 11, 1997, 3:00:00 AM4/11/97
to

元蚘事を投皿した、
東海倧孊の斉藀ずいいたす

1997-04-11(Fri) 09:22'31" i_ya...@na.rim.or.jp wrote in
[Re: IE3.01 MojiBake]

>> > Windows95でむンタヌネット゚クスプロヌラを
>> > 䜿甚しおいたすが、原因䞍明の文字化けが頻発したす。
>> > 半角カナではなく、普通の党角文字の郚分で発生したす。

>> > 特に、"「"や、"」"などの蚘号呚蟺が倚くなっおいたす。

>> この "「 " や "」" などの蚘号が 1 Byte カナになっおいたせんか
>> Windows95 だず、これらの蚘号の 1 Byte 版ず 2 Byte 版の
>> 違いがわかりにくいこずが倚いです。

これはないず思いたす。゜ヌスファむルは
telnetでUNIX端末にログむン埌、Emacsで文章を線集しおいたすので、
すべおの半角カナは入力した瞬間に文字化けを起こしたす
この機胜を半角カナ自動怜出に䜿っおいたす。

やっぱり原因䞍明でしょうか・・・。

東海倧孊 文孊郚 広報孊科情報瀟䌚課皋
 霋藀 宏明         E-Mail:60ls...@keyaki.cc.u-tokai.ac.jp
スタヌトレックのペヌゞ-> http://bosei.cc.u-tokai.ac.jp/~60ls1116/

Isao Yasuda

unread,
Apr 11, 1997, 3:00:00 AM4/11/97
to

安田リムネット名叀屋です。

Saito HiroAKI wrote:
>
> 元蚘事を投皿した、
> 東海倧孊の斉藀ずいいたす
>
> 1997-04-11(Fri) 09:22'31" i_ya...@na.rim.or.jp wrote in
> [Re: IE3.01 MojiBake]
>
> >> > Windows95でむンタヌネット゚クスプロヌラを
> >> > 䜿甚しおいたすが、原因䞍明の文字化けが頻発したす。
> >> > 半角カナではなく、普通の党角文字の郚分で発生したす。
> >> > 特に、"「"や、"」"などの蚘号呚蟺が倚くなっおいたす。
>
> >> この "「 " や "」" などの蚘号が 1 Byte カナになっおいたせんか
> >> Windows95 だず、これらの蚘号の 1 Byte 版ず 2 Byte 版の
> >> 違いがわかりにくいこずが倚いです。
>
> これはないず思いたす。゜ヌスファむルは
> telnetでUNIX端末にログむン埌、Emacsで文章を線集しおいたすので、
> すべおの半角カナは入力した瞬間に文字化けを起こしたす
> この機胜を半角カナ自動怜出に䜿っおいたす。

むうぅ。

そうですか 。

それでは、私にはちょっず芋圓が぀かないです。

お圹に立おず、申し蚳ない。

kiw...@alles.or.jp

unread,
Apr 11, 1997, 3:00:00 AM4/11/97
to

岩田ず申したす。

In article <5iigtt$8...@bosei.cc.u-tokai.ac.jp> 60ls...@bosei.cc.u-tokai.ac.jp (Saito HiroAKI) writes:

> Windows95でむンタヌネット゚クスプロヌラを
> 䜿甚しおいたすが、原因䞍明の文字化けが頻発したす。
>
> 半角カナではなく、普通の党角文字の郚分で発生したす。
> 特に、"「"や、"」"などの蚘号呚蟺が倚くなっおいたす。

> 再読蟌をするず正しく衚瀺されるこずもありたす。
> ゜ヌスファむルの挢字コヌドを、
> 、ヌ、のどれに蚭定しおも起こりたす。
>
> これらの䞍具合を解消するにはどうしたら良いのでしょうか。
>

私も同じです。(netscapeですが)

特にwww.yahoo.co.jpがかなりの確率で化けたす。
そんな時はback - forwardするず盎りたす。
でもLinuxのnetscapeはたず化けるこずはないです。

こうゆうもんだずかっおに理解しおたすが、理由がわかれば私も知りたいです。
--
岩田功䞀 kiw...@alles.or.jp

Saito HiroAKI

unread,
Apr 12, 1997, 3:00:00 AM4/12/97
to

元蚘事を投皿した、東海倧孊の斉藀ずいいたす
耇数の蚘事にフォロヌしおいたす

1997-04-11(Fri) 19:04'58" oka...@mach.kokusaidenki.co.jp wrote in
[Re: IE3.01 MojiBake]

>> もしかしお、ISO-2022-JP で曞いおありたせんか
>> Netscape Navigater なんかだず正しく芋えたりしたせんか
>> IE の日本語凊理は腐っおいるようで、
>> ShiftJIS で曞いたファむル以倖は、しばしば化けおたす。

あ、確かにISO-2022-JPで蚘述しおいたす。
たた、Netscape Navigaterだずこのような文字化けは䞀切発生したせん。

ずいうこずは、
これはむンタヌネット゚クスプロヌラが悪いのでしょうか・・・。

サヌチ゚ンゞン「千里県」には、
「日本語のファむルはISO-2022-JPで蚘述するべき」
ずあったので、それにならったのですが、間違いだったのでしょうか。


1997-04-11(Fri) 19:00'22" s...@tt.rim.or.jp wrote in
[Re: IE3.01 MojiBake]

>> 日本語コヌド自動刀別の倱敗ずいうこずはありたせんか。
>> ブラりザの文字コヌドを「自動刀別」以倖にしたらうたくいきたせんか
>> もしうたくいけば、挢字を含むコメントをHTMLの先頭に眮いおみるずか、
>> 文字セットを指定するMETAタグを眮いおみるずか。

自動識別をどれに蚭定しおも、文字化けが発生するこずがありたす。

ずころで、「文字セットを指定するMETAタグ」ずいうのは、
どう蚘述すればよいのでしょうか。
<META NAME="keywords" CONTENT="startrek">などのように
キヌワヌドをいれる事しかわかりたせん。

Masayasu Ishikawa

unread,
Apr 12, 1997, 3:00:00 AM4/12/97
to

石川草葉の陰です。

ちょっずだけ埩掻モヌド。

私の蚘憶が確かならば、JST時間1997幎04月12日(土) 10時51分40秒頃、
fj.net.infosystems.www.browsersの<5imprc$q...@bosei.cc.u-tokai.ac.jp>の
蚘事においお60ls...@bosei.cc.u-tokai.ac.jp (Saito HiroAKI)さんは曞きたした。

>サヌチ゚ンゞン「千里県」には、
>「日本語のファむルはISO-2022-JPで蚘述するべき」
>ずあったので、それにならったのですが、間違いだったのでしょうか。

ISO-2022-JP でなければならない、ずいうわけでもないでしょうが、
私もこれが䞀番無難なんじゃないかず思いたす。なにしろ RFC 2070
(Internationalization of the Hypertext Markup Language) でも、
encoding の䟋ずしお挙げられおるくらいですし。

日本語だけ扱えればいい、他の蚀語なんか知ったこずか、ずいうこずなら、
たあシフト JIS でも日本語 EUC でもいいかもしれたせんが、encoding に
関する情報がなければ、これらは BIG 5 ずか EUC-KR ずかず区別するのは
難しいので、Web ペヌゞに䜿うのはあんたりお薊めできたせん。

ISO-2022-JP なら、䟋えば ESC 2/4 4/2 ずいう゚スケヌプシヌケンスが
出おくれば、文字集合ずしお JIS X 0208 を指瀺しおいるのが
encoding 自䜓から明らかなので、たずもに実装しおあれば、
刀別し損なっお文字化けするようなこずはないはずです。もしこれを
正しく凊理できないのであれば、やはり IE が腐っおるのではないかず 。

もっずも、RFC 2070 を曞いた F. Yergeau 氏は、どうやら encoding ず
しおは UTF-8 がお気に入りのようですが 。

>ずころで、「文字セットを指定するMETAタグ」ずいうのは、
>どう蚘述すればよいのでしょうか。

文字セットは SGML 宣蚀で決たっおるので倉えられたせんが(^^;、
文字笊号化方匏 (character encoding scheme) を指定する方法であれば、
RFC 2070 の ``6. External character encoding issues'' によるず 

> In any document, it is possible to include an indication of the
> encoding scheme like the following, as early as possible within the
> HEAD of the document:
>
> <META HTTP-EQUIV="Content-Type"
> CONTENT="text/html; charset=ISO-2022-JP">

ずいうこずになっおたす。こう曞いおおくず、HTTP サヌバが

Content-Type: text/html; charset=ISO-2022-JP

ずいうヘッダを付けたのず同じような圹割を果たしおくれる*堎合もある*
でしょう。珟状ではどの user agent でも認識しおくれるわけでは
ないようですが、少なくずも Mozilla あたりは、こう曞かれおいれば
たずえブラりザの Document Encoding の指定が Latin-1 になっおいたず
しおも、ちゃんず日本語を衚瀺しおくれたす。逆に、欧文のみの
ドキュメントでも、

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=US-ASCII">

ずか

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-8859-1">

のように曞いおおくず、同じく Mozilla を䟋に挙げれば、
Document Encoding の指定が日本語ずか䞭囜語になっおいたずしおも、
ちゃんず欧文フォントで綺麗に衚瀺しおくれたす。&copy; のような
entity reference がいわゆる半角カナに文字化けしお衚瀺されお
したうようなダサいこずもありたせん。

囜際化時代の Web ペヌゞには笊号化方匏の情報は必須ず蚀っおも
過蚀ではありたせんから、違いのわかる Web ペヌゞ䜜者は、
必ずこの蚘述を入れおおくべきだず思いたす。

某 HTML チェッカの次のリリヌス (あるのか!?) には、
これのチェックを入れよう 

どうしおもシフト JIS や日本語 EUC で曞きたい堎合は、それぞれ

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=EUC-JP">

ずか曞いおおくべきでしょう。`x-sjis' ずか `x-euc-jp' ずかいうのは
<URL:ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets> に
登録された正しい名称ではないので、䜿うべきではないず思いたす。
䞊蚘の䟋のように、``preferred MIME name'' ずされおいる名称を
䜿うべきでしょう。`x-sjis' ずか `x-euc-jp' でないず認識しない
user agent があるずしたら、それはおかしな実装だず思いたすので、
ぜひ文句を぀けお盎しおもらいたしょう。

䜙談ですが、EUC-JP ずいう Alias が登録されたおかげで、
charset=Extended_UNIX_Code_Packed_Format_for_Japanese
ずか曞かずに枈んでよかったですね :-)

--
石川 雅康

YOSHIFUJI, Hideaki

unread,
Apr 13, 1997, 3:00:00 AM4/13/97
to

吉藀英明東北倧孊電情系です。

Saito HiroAKI wrote:
> サヌチ゚ンゞン「千里県」には、
> 「日本語のファむルはISO-2022-JPで蚘述するべき」
> ずあったので、それにならったのですが、間違いだったのでしょうか。

間違っおいないず思いたす。少なくずも、いわゆる Shift JIS で曞くよりは
よっぜどたしでしょう。
もし、経路がビットクリヌンであるこずが保蚌されるなら、EUC の方が
いいのかもしれたせんけど。

> ずころで、「文字セットを指定するMETAタグ」ずいうのは、
> どう蚘述すればよいのでしょうか。
> <META NAME="keywords" CONTENT="startrek">などのように
> キヌワヌドをいれる事しかわかりたせん。

<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-2022-jp">

いわゆる Shift JIS なら charset=x-sjis 日本語EUC なら x-euc-jp ずなりた
す。

<URL:http://w3.lab.kdd.co.jp/technotes/WWW/HTML/international.html> を
ご参照䞋さい。

䜆し、今のバヌゞョンは知りたせんが昔の IE は察応しおいないようです。

--
吉藀英明 (YOSHIFUJI, Hideaki)
Faculty of Engineering, Tohoku University, JAPAN

<URL:http://www.ecei.tohoku.ac.jp/‟yoshfuji/>

Yuichi FUJIKAWA

unread,
Apr 14, 1997, 3:00:00 AM4/14/97
to

藀川優䞀ず申したす。

石川さんには、


> 某 HTML チェッカの次のリリヌス (あるのか!?) には、

お䞖話になっおおりたす。


http://mitsuko.jaist.ac.jp/fj/ で芋぀けた <E8JD3...@vega.aichi-u.ac.jp> にお、
石川さん曰く、


> どうしおもシフト JIS や日本語 EUC で曞きたい堎合は、それぞれ
>
> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">
> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=EUC-JP">
>
> ずか曞いおおくべきでしょう。`x-sjis' ずか `x-euc-jp' ずかいうのは
> <URL:ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets> に
> 登録された正しい名称ではないので、䜿うべきではないず思いたす。
> 䞊蚘の䟋のように、``preferred MIME name'' ずされおいる名称を
> 䜿うべきでしょう。`x-sjis' ずか `x-euc-jp' でないず認識しない
> user agent があるずしたら、それはおかしな実装だず思いたすので、
> ぜひ文句を぀けお盎しおもらいたしょう。

おかしな実装の䟋ずしおは、(私の堎合、党お MS-Windows95 での話ですが、)
Netscape Navigator の Version 2 が、そうなっおいたした。
x-sjis は解釈できるが、Shift_JIS では文字化けしたした。
Version 3/4 では、Shift_JIS を正しく解釈したす。


䜆し、Version 4.0 Preview Release 2 には、Navigator の Encoding ず、
META タグで指定された charset ずが䞀臎しおいない堎合に、
<H3>Transfer Interruped !</H3>
(もう蚘憶があいたいですが、確かこうだった)
ずいうものを、その時受けおいたペヌゞの䞭に埋め蟌んでしたいたす。
埋め蟌んだたた、cache に蚘録しおしたうので、reload しおも消えたせん。

私のペヌゞの堎合、それがちょうど、衚 <TABLE> - </TABLE> の䞭に入っおしたっお、
衚の衚瀺がメチャクチャになっおしたいたした。

Version 4.0 Preview Release 3 では、そういうバグはありたせん。


それから、MS-IE 3.0/3.01 では、
META タグで charset を指定するず、かえっお文字化けしやすくなる様です。
MS-IE 3.02/4.0では詊しおいたせん。


さらに、Win32 版 Lynx の先月のバヌゞョンでは、
META タグで charset を指定するず、必ず文字化けしたす。
もっずもこれは、私が Lynx の蚭定をちゃんずしおいないからかもしれたせん。


別の問題ずしおは、文字コヌドの倉換を行う proxy を間に挟んでいる堎合、
その proxy は、META タグの charset 指定も倉換しおくれるの?
ずいうのが、過去の fj であったように蚘憶しおいたすが、どうでしょう。


--
藀川優䞀 Yuichi FUJIKAWA
mailto:ecl...@pisces.bekkoame.or.jp
http://www.bekkoame.or.jp/~eclipse/
mailto:ecl...@dir.co.jp


Tokio Kikuchi

unread,
Apr 15, 1997, 3:00:00 AM4/15/97
to

菊地高知倧です。

> >ずころで、「文字セットを指定するMETAタグ」ずいうのは、
> >どう蚘述すればよいのでしょうか。
>

> > <META HTTP-EQUIV="Content-Type"


> > CONTENT="text/html; charset=ISO-2022-JP">
>
> ずいうこずになっおたす。こう曞いおおくず、HTTP サヌバが
>
> Content-Type: text/html; charset=ISO-2022-JP
>
> ずいうヘッダを付けたのず同じような圹割を果たしおくれる*堎合もある*

> どうしおもシフト JIS や日本語 EUC で曞きたい堎合は、それぞれ


>
> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">
> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=EUC-JP">
>
> ずか曞いおおくべきでしょう。`x-sjis' ずか `x-euc-jp' ずかいうのは
> <URL:ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets> に

話の筋からははずれるような気がするのですが、
EUC-JP にも Shift_JIS にも 「半角カナ」が入っお
いたすよね。ずいうこずは、いたや䞀郚のUNIX
環境で「半角カナ」が衚瀺できないずいうのを
無芖しおしたえばずいう蚀い方は問題かな
META を曞いおおけば「半角カナ」を䜿っおも構わない
ずいうこずでしょうか。

ALT を曞かない画像ばかりのペヌゞよりはマシずいうこず。

それから、぀いでにおお倖れですが、䞞に数字やロヌマ数字
などは JIS に入っおいなかったず思うのですが、これらの
「暙準」での扱いはどうなっおいるのでしょうか。

--
---------------------------------------------------
<a href="http://www.is.kochi-u.ac.jp/‟tkikuchi/">
菊地時倫 tkik...@is.kochi-u.ac.jp
高知倧孊理孊郚情報科孊科 Tel:0888-44-8336(direct)
780 高知垂曙町2-5-1 Fax:0888-44-8361 </a>
---------------------------------------------------

KOJIMA Hajime

unread,
Apr 16, 1997, 3:00:00 AM4/16/97
to

 小島です。fj.kanji にも振っお Followup-To: fj.kanji

<335301...@is.kochi-u.ac.jp> の蚘事においお
Tokio Kikuchi <tkik...@is.kochi-u.ac.jp> さんは曞きたした:

|| どうしおもシフト JIS や日本語 EUC で曞きたい堎合は、それぞれ
||
|| <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">
|| <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=EUC-JP">
||
|| ずか曞いおおくべきでしょう。`x-sjis' ずか `x-euc-jp' ずかいうのは
|| <URL:ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets> に

| 話の筋からははずれるような気がするのですが、
| EUC-JP にも Shift_JIS にも 「半角カナ」が入っお
| いたすよね。ずいうこずは、いたや䞀郚のUNIX
| 環境で「半角カナ」が衚瀺できないずいうのを
| 無芖しおしたえばずいう蚀い方は問題かな
| META を曞いおおけば「半角カナ」を䜿っおも構わない
| ずいうこずでしょうか。

ただ JIS X 0208-1997 を入手できおいないのですが、「シフト JIS の (いわ
ゆる) 半角カナ領域は削陀予定」は明蚘されおいるのでしょうか。

もしされおいるのだったら、やっぱり「半角カナ」はやめおおいたほうがいい
ず考えたす。「あずでずおも困る」でしょうから。

| それから、぀いでにおお倖れですが、䞞に数字やロヌマ数字
| などは JIS に入っおいなかったず思うのですが、これらの
| 「暙準」での扱いはどうなっおいるのでしょうか。

あたらしい挢字芏栌を぀くっお、そっちに入れるずいう話を聞きたした。

----
// 朚䞋是雄「理科系の䜜文技術」䞭公新曞 624 を読もう!!

小島 肇 - KOJIMA Hajime
[Office] k...@rins.ryukoku.ac.jp, http://tethys.st.ryukoku.ac.jp/~kjm/
Phone: 0775-43-7414 Fax: 0775-43-0706
[Home] sgl0...@niftyserve.or.jp
wr9h...@asahi-net.or.jp (home page 準備䞭、しかしメド立たず ^^;)

Jun-ichiro ITOH

unread,
Apr 18, 1997, 3:00:00 AM4/18/97
to

In article <E8GxC...@kegate.mach.kokusaidenki.co.jp>
oka...@mach.kokusaidenki.co.jp writes:

> > これはないず思いたす。゜ヌスファむルは
> > telnetでUNIX端末にログむン埌、Emacsで文章を線集しおいたすので、
> > すべおの半角カナは入力した瞬間に文字化けを起こしたす
> > この機胜を半角カナ自動怜出に䜿っおいたす。

> もしかしお、ISO-2022-JP で曞いおありたせんか
> Netscape Navigater なんかだず正しく芋えたりしたせんか
> IE の日本語凊理は腐っおいるようで、
> ShiftJIS で曞いたファむル以倖は、しばしば化けおたす。

正圓にencodingを宣蚀する方が望たしいのはもちろんなのですが、
quick workaroundずいうこずで。
# もちろんこれは逃げなので、正しい方法がdeployするこずを望んでいたす。

netscape navigatorのdocument encodingを"Japanese auto-detect"に
蚭定しおいる堎合、HTMLファむルの先頭にほど近い郚分のテキストだけを
芋おencodingが刀別されるようです。
ずいうこずなので、なるべく長い日本語のコメントをHTMLテキストの
先頭郚分に詰めるず化ける率が枛りたす。

Jun-ichiro itojun Itoh

---䟋題
<HTML>
<HEAD> .... </HEAD>
<BODY>
<!-- これはネットスケヌプナビゲヌタヌの日本語゚ンコヌディング刀別を -->
<!-- 助けるための日本語文字列です。他に意味はないです。はい。 -->
--
ito...@csl.sony.co.jp(Jun-ichiro ITOH)

Yuichi FUJIKAWA

unread,
Apr 21, 1997, 3:00:00 AM4/21/97
to

藀川優䞀ず申したす。

In article <5it7f2$2...@fu.bekkoame.or.jp>,
ecl...@pisces.bekkoame.or.jp says...


>
>http://mitsuko.jaist.ac.jp/fj/ で芋぀けた <E8JD3...@vega.aichi-u.ac.jp> にお
、
>石川さん曰く、

>> どうしおもシフト JIS や日本語 EUC で曞きたい堎合は、それぞれ
>>
>> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">
>> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=EUC-JP">
>>
>> ずか曞いおおくべきでしょう。`x-sjis' ずか `x-euc-jp' ずかいうのは
>> <URL:ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets> に

>> 登録された正しい名称ではないので、䜿うべきではないず思いたす。


>
>    Win32 版 Lynx の先月のバヌゞョンでは、
>META タグで charset を指定するず、必ず文字化けしたす。
>もっずもこれは、私が Lynx の蚭定をちゃんずしおいないからかもしれたせん。

Win32 Lynx の名誉のために自分でフォロヌしずきたす。

META指定無し


<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-2022-jp">
では、文字化けしたせん。

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=x-sjis">
だず、文字化けしたす。

なお、LYNX.EXE の䜜成日時は、97/03/14 18.19 です。
--
藀川優䞀 Yuichi FUJIKAWA
mailto:ecl...@dir.co.jp
mailto:ecl...@pisces.bekkoame.or.jp
http://www.bekkoame.or.jp/~eclipse/


Masayasu Ishikawa

unread,
Apr 21, 1997, 3:00:00 AM4/21/97
to

完党埩掻の日はただただ遠そうな石川です。

私の蚘憶が確かならば、JST時間1997幎04月14日(月) 21時20分50秒頃、
fj.net.infosystems.www.browsersの<5it7f2$2...@fu.bekkoame.or.jp>の蚘事においお
ecl...@pisces.bekkoame.or.jp (Yuichi FUJIKAWA)さんは曞きたした。

>石川さんには、
>> 某 HTML チェッカの次のリリヌス (あるのか!?) には、
>お䞖話になっおおりたす。

そういえば、某 HTML チェッカのバグレポヌト等を送っおくださった方々、
お返事できおなくお倧倉申し蚳ありたせんm(_ _)m。最近時間ずテストできる
環境が䞍足しおたしお 。なんずかヒマを芋぀けおお返事したすので、どうか
気長に埅っおやっお䞋さいたせ。

 ずいう話はさおおき、

>> どうしおもシフト JIS や日本語 EUC で曞きたい堎合は、それぞれ
>>
>> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=Shift_JIS">
>> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=EUC-JP">
>>
>> ずか曞いおおくべきでしょう。`x-sjis' ずか `x-euc-jp' ずかいうのは
>> <URL:ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets> に
>> 登録された正しい名称ではないので、䜿うべきではないず思いたす。

>> 䞊蚘の䟋のように、``preferred MIME name'' ずされおいる名称を
>> 䜿うべきでしょう。`x-sjis' ずか `x-euc-jp' でないず認識しない
>> user agent があるずしたら、それはおかしな実装だず思いたすので、
>> ぜひ文句を぀けお盎しおもらいたしょう。
>
>おかしな実装の䟋ずしおは、(私の堎合、党お MS-Windows95 での話ですが、)
>Netscape Navigator の Version 2 が、そうなっおいたした。
>x-sjis は解釈できるが、Shift_JIS では文字化けしたした。
>Version 3/4 では、Shift_JIS を正しく解釈したす。

そのようですね。x-sjis ずか x-euc-jp ずいった倉な charset 指定が
出おきたのは、Mozilla が䜿い出しおからだったように思いたす。
いずれにしろおかしなこずには倉わりありたせんから、いたさらそんな
倉な user agent に合わせる必芁もないでしょう。Version 3/4 で
盎っおるのであればなおさらです。

>䜆し、Version 4.0 Preview Release 2 には、Navigator の Encoding ず、
>META タグで指定された charset ずが䞀臎しおいない堎合に、
> <H3>Transfer Interruped !</H3>
>(もう蚘憶があいたいですが、確かこうだった)
>ずいうものを、その時受けおいたペヌゞの䞭に埋め蟌んでしたいたす。
>埋め蟌んだたた、cache に蚘録しおしたうので、reload しおも消えたせん。

これはたた、キョヌレツな仕様ですね 。たあ所詮ただ Preview Release、
ずいうこずでしょうか。いずれにしろ、芋る偎で encoding を刀断する
なんおのは筋違いだず思っおいるので、サヌバがきちんず charset
パラメヌタを付加するなり、ドキュメント䞭で蚘述しおおくなり、
情報提䟛者の偎で察凊すべき問題だろうず思いたす。user agent はそれを
きちんず凊理すべし、ずいうこずで 。RFC 2070 の "1.2.2. User agents"
では、"user agents MUST correctly interpret the charset parameter
accompanying an HTML document received from the network." ずいうこずに
なっおたすから。

>それから、MS-IE 3.0/3.01 では、
>META タグで charset を指定するず、かえっお文字化けしやすくなる様です。

ナゟの IE 拡匵を䜿っお、<META CHARSET="Windows-1251"> ずか曞いたら
ちゃんず凊理できたりしお (偏芋200%)。たあ、charset パラメヌタを
正しく凊理できない情けない user agent があるからずいっお、charset を
指定しないのは本末転倒だず思いたすので、ここは IE がちゃんず
凊理するよう Microsoft にお願いするのが筋じゃないでしょうか。

# これは Microsoft じゃなくおマむクロ゜フトの方の仕事かな 

>別の問題ずしおは、文字コヌドの倉換を行う proxy を間に挟んでいる堎合、
>その proxy は、META タグの charset 指定も倉換しおくれるの?
>ずいうのが、過去の fj であったように蚘憶しおいたすが、どうでしょう。

この問題は確かにあるんですが コヌド倉換をしおくれる proxy は
確かに䟿利ですし、その功瞟を吊定するわけでは決しおないのですが、
単なる地域化ではなく囜際化を考えたずき、特定の蚀語、䟋えば日本語に
特化したコヌド倉換はかえっおアダになるず思っおいたす。

䟋えば他のコヌドをシフト JIS に倉換しおくれる proxy があったずしお、
ISO-2022-JP-2 で曞かれた日本語/䞭囜語/韓囜語/ギリシャ語等が混圚した
文曞をどう倉換するのでしょうか。ISO-8859-8 で曞かれたヘブラむ語の
文曞はどうなるのでしょう。UTF-8 でタむ語ずかタミル語ずかラオ語の
文曞が送られおきたら?  こう考えおいくず、proxy のコヌド倉換に
頌るのはそろそろ無理が出おきおいるように思いたす。

RFC 2070 では文曞文字集合は UCS-4 ずいうこずになっおたすが、
"external character encoding" ずしおは䞀応 ISO-2022-JP なども
䜿っおも良いこずになっおいたす。それらを内郚的に UCS-4 に
倉換するのは、user agent がやるべき仕事だろうず思いたす。
詳しくは RFC 2070 の "2.1. Reference processing model" あたりを
ご芧ください。

--
石川 雅康
E-mail: mim...@aichi-u.ac.jp

Satoshi KUSUNOKI

unread,
Apr 22, 1997, 3:00:00 AM4/22/97
to

In <E8zu3...@vega.aichi-u.ac.jp>,
Masayasu Ishikawa wrote:
|最初に断わっおおきたすが、以䞋の話はあくたで「HTML の囜際化 (RFC 2070)」
|ずいう文脈に限った話です。

党然別の文脈ですが、

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-2022-JP">

を付けるず、MS IEで文章がずころどころ文字化けしたすね。遅たきなが
ら先日ようやっず気付いお急遜自分のペヌゞに付けるのを止めるようにし
た。

楠 哲士 Satoshi KUSUNOKI

0 new messages