In article <3992298...@rananim.ie.u-ryukyu.ac.jp>
ko...@ie.u-ryukyu.ac.jp (Shinji KONO) writes:
> > 結局、xterm は、漢字については、iso10646 を参照するわけです
> -lc は、luit で encoding を処理するようですね。一応、JISは cover
> されているはずなんですが、fj.kanji の議論のようなことがあるので...
xterm で、-lc は無くても平気に見えます。たしかに、JIS は、そ
のまま通りますね。
この luit (Locale and ISO 2022 support for Unicode
terminals) コマンドですが、X11 の付属物のようですが、その他
の UTF-8 系の端末でも使えるんじゃないですか。今一つ、使い方
がはっきりしないんだけど。こんな例が載っています。
(1) xterm -u8 -e luit
(2) env LC_ALL=fr_FR luit ssh legacy-machine
(env LANG=ja_JP.eucJP luit ssh legacy-machines)
(3) luit -encoding 'ISO 8859-1' emacs -nw
(M-x set-terminal-coding-system RET iso-2022-8bit-ss2 RET)
結局、端末と luit の間は、UTF-8 ということですか。
逆はできないんですかね。
ところで、fj.kanji の議論とは何でしょうか?
\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報 \\
In article <YAS.05Au...@kirk.is.tsukuba.ac.jp>
y...@is.tsukuba.ac.jp (Yasushi Shinjo) writes:
> http://www.ie.u-ryukyu.ac.jp/~kono/pub/software/
ここにある k14 の iso10646-1 版で、xterm を実行すると、「■」
が表示できません。
「■」には、黒い四角が入っています。Black Square というやつ。
JIS 0x2223 (1-02-03), Shift_JIS 81A1 です。これは、Unicode
25A0, UTF-8 E2 96 A0 だと思います。
xterm で font を Large など他のものにすると表示されるので、
たぶん、河野さんの k14
-misc-fixed-medium-r-normal-ja-14-130-75-75-c-140-iso10646-1
の問題なんじゃないかと思います。といいつつ、xfd で見ると、ちゃ
んと入っていますね。なんなんでしょうか。
原因としては、何が考えられるでしょうか。
あと、このように表示されない文字は他に何がありますか。
うちの若いものの話では、Unicode 挟むと、JISのロシア文字が壊
滅だとか。「Д」とか。JIS 0x2725 (1-07-05), Shift_JIS 0x8444
です。Unicode だと、0x0414, UTF-8 D094 かな。Cyrillic
capital Letter DE。
なんで A は、unify されてないんだろう。ぶつぶつ。
> なんで A は、unify されてないんだろう。ぶつぶつ。
カテゴリーの違う文字は unify しない、というのが JIS の見解です。
カタカナの「ニ」と漢字の「二」は字形がほぼ同じでルーツも同じだから統合す
る、と言われたら納得のいかないものがありますよね、それと同じです。
========================================================================
飯嶋 浩光 / でるもんた・いいじま http://www.ht.sakura.ne.jp/~delmonta/
IIJIMA Hiromitsu, aka Delmonta mailto:delm...@ht.sakura.ne.jp