Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

漢字コードの問題

835 views
Skip to first unread message

Kiyotaka ATSUMI

unread,
May 1, 2008, 1:43:55 AM5/1/08
to
鈴鹿高専の渥美と申します.

漢字コードで問題を見付けたので,報告します.

「濵」(浜の異体字)は私のgnome termおよびemacs上で正しく表示されますが,

\documentclass{jarticle}
\begin{document}

\end{document}

のようなtex codeを書いてコンパイルした結果dviファイルでは何故か

「髭」(ひげ?)

の字になってしまうことが分かりました.debian specificでは無いかもしれ
ませんが,報告します.

--
Kiyotaka ATSUMI, Suzuka National College of Technology

Kenshi Muto

unread,
May 1, 2008, 2:46:42 AM5/1/08
to
武藤@Debianぷろじぇくとです。

該当箇所を黒■に変更しています。

At Thu, 1 May 2008 14:43:55 +0900,
Kiyotaka ATSUMI wrote:
> 漢字コードで問題を見付けたので,報告します.
>
> 「■」(浜の異体字)は私のgnome termおよびemacs上で正しく表示されますが,

> \documentclass{jarticle}
> \begin{document}
> ■
> \end{document}

>
> のようなtex codeを書いてコンパイルした結果dviファイルでは何故か
>
> 「髭」(ひげ?)
>
> の字になってしまうことが分かりました.debian specificでは無いかもしれ
> ませんが,報告します.

該当文字はJISX0212補助漢字文字(Unicode 0x6ff5)じゃないでしょうか。
検索するとわかるように、JISX0212をpTeXで使うには細工が必要です。

otf TeXパッケージを入れているなら、

\documentclass{jarticle}
\usepackage{otf}
\begin{document}
\CID{8531}
\UTF{6ff5}
\end{document}

のようにしてdvipdfmxに通せば出てきますね。
--
武藤 健志@ kmuto @ kmuto.jp
Debian/JPプロジェクト (km...@debian.org, km...@debian.or.jp)
株式会社トップスタジオ (km...@topstudio.co.jp)
URI: http://kmuto.jp/ (Debianな話題など)

Kiyotaka ATSUMI

unread,
May 1, 2008, 3:19:38 AM5/1/08
to
渥美です.

武藤様、情報ありがとうございます.

Kenshi Muto <km...@kmuto.jp> wrote (Thu, 1 May 2008 15:46:42 +0900)
> > 「■」(浜の異体字)は私のgnome termおよびemacs上で正しく表示されますが,
(snip)


> > のようなtex codeを書いてコンパイルした結果dviファイルでは何故か
> >
> > 「髭」(ひげ?)
> >
> > の字になってしまうことが分かりました.

> 該当文字はJISX0212補助漢字文字(Unicode 0x6ff5)じゃないでしょうか。
> 検索するとわかるように、JISX0212をpTeXで使うには細工が必要です。

はい.奥村先生のページでも指摘されていることに後から気がつきました.そ
れはそうとして,■や?になるのならともかく、何故「髭」になってしまうの
でしょうか?■や?ならすぐに気がつくのですが,普通に漢字が入ってしまっ
たので,今回,この話題で気がついたきっかけが人名で、気が付くのが遅れた
ためセンシティブな問題になりかけました.

# 「■田君」が「髭田君」では,友人から冷やかされる事間違いなし. ^^;

漢字コードの当て方にバグがあるかなと勘ぐったのですが違うのでしょうか?
そうでないなら、一般論になるかも知れませんが,TeXを通した文書について,
一字一字チェックするしかないのでしょうか?願わくば■や?に化けてくれる
か,TeXで扱えないコードであることを示すwarningが出るなどの反応になるこ
とを期待したいです.

あ、でもこれはdebian specificでは無いですね.

Atsuhito Kohda

unread,
May 2, 2008, 1:01:54 AM5/2/08
to
On Thu, 1 May 2008 16:19:38 +0900, Kiyotaka ATSUMI wrote:

> 漢字コードの当て方にバグがあるかなと勘ぐったのですが違うのでしょうか?
> そうでないなら、一般論になるかも知れませんが,TeXを通した文書について,
> 一字一字チェックするしかないのでしょうか?願わくば■や?に化けてくれる
> か,TeXで扱えないコードであることを示すwarningが出るなどの反応になるこ
> とを期待したいです.

面白そうなので遊んでみました ^^;
そもそもこの異字体が普通に変換では出なかったりしますね。
それを Win で試そうと思って SJIS に nkf で変換しても
ダメっぽくて emacs で開くと utf に扱われてました。
普通に変換される字体(濱)だと問題なさそうですね。

ptexlive で utf-8 と euc にして処理してみると utf-8
だと問題の文字は空白になって,当たり前ですが euc だと
髭みたいに表示されました。otf な指定だと問題ないです。

更に uptex で試すと utf-8 にしておけば xdvi でも正しく
表示されて問題ないようでした。euc にするとやはり髭になる
みたいです。

On Thu, 1 May 2008 14:43:55 +0900, Kiyotaka ATSUMI wrote:

> (浜の異体字)は私のgnome termおよびemacs上で正しく表示されますが,

と言っても少し古い euc な設定だと emacs で正しく表示され
ないような(?)。utf な環境で素の pTeX は苦しい気がします。
# いっそ XeTeX にするとか。。。

平成20年5月2日(金)
--
***************************
香田 温人(こうだ あつひと)
http://www1.pm.tokushima-u.ac.jp/%7Ekohda/

Kiyotaka ATSUMI

unread,
May 2, 2008, 3:37:01 AM5/2/08
to
香田様

渥美です.情報ありがとうございます.

Atsuhito Kohda <ko...@pm.tokushima-u.ac.jp> wrote (Fri, 2 May 2008 14:01:54 +0900)

> 面白そうなので遊んでみました ^^;

助かります^^/~

> ptexlive で utf-8 と euc にして処理してみると utf-8
> だと問題の文字は空白になって,当たり前ですが euc だと
> 髭みたいに表示されました。otf な指定だと問題ないです。
>
> 更に uptex で試すと utf-8 にしておけば xdvi でも正しく
> 表示されて問題ないようでした。euc にするとやはり髭になる
> みたいです。

なるほど.いずれにせよutf-8で処理するようにすれば,「髭田君」は避けら
れそうですね.試してみます.

0 new messages