Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Emacs で分離した濁点をもどすには ucs-normalize-NFC-region

337 views
Skip to first unread message

Yasushi Shinjo

unread,
Jun 8, 2014, 11:58:28 AM6/8/14
to
新城@筑波大学です。こんにちは。

端末で動く Emacs ではなくて、ウインドウ・システムを使っているEmacs の場
合、コピー&ペーストでテキストを持ってくると、仮名の濁点が分離すること
があります。PDFからペーストするとよくなります。こんな感じ。

テ゛ィレクトリ

MacOSX の iTerm は、自動的に元にもどしてくれるのでありがたいです。
Emacs 単体でできないかと思ったのですが、そういう関数がありました。

ucs-normalize-NFC-region

NFC や NFD は、Normalization Form Composition
Composition/Decomposition。濁点に関しての説明は、このページがわかりやす
いです。MacOSX のファイル名の話として書かれています。

http://www.sakito.com/2010/05/mac-os-x-normalization.html
2010年5月16日, sakito
Mac OS X におけるファイル名に関するメモ(NFC, NFD等)

「テ゛」が Decomposition された状態で、「ディ」が Composition 。
ucs-normalize-NFC-region の逆の ucs-normalize-NFD-region もあります。
Emacs 23.3 から入ったようです。

http://www.gnu.org/software/emacs/news/NEWS.23.3

これは、-regsion なのですが、バッファ全体にやりたい人は、次の関数を使っ
ても良いのでしょう。

http://sky-y.hatenablog.jp/entry/20120805/1344169124
2012-08-05, sky-y
Emacs小ネタ: MacでPDFからコピーすると濁点が分離する問題を直す

これはなくても、M-< M-> してから ucs-normalize-NFC-region でも大丈夫です。

\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 システム情報系     \\

Yasushi Shinjo

unread,
Jun 8, 2014, 12:13:58 PM6/8/14
to
新城です。少し訂正。

Yasushi Shinjo <y...@is.tsukuba.ac.jp> writes:
> NFC や NFD は、Normalization Form Composition
> Composition/Decomposition。

NFC: Normalization Form Canonical Composition
NFD: Normalization Form Canonical Decomposition

短縮形に Canonical がどこかに飛んでいるなあ。Unicode で composition と
か precomposed characters を言い出した人は、反省して欲しい。

\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 情報工学        \\
0 new messages