uim-1.8.0

KIHARA Hideto

unread,

Apr 4, 2012, 7:37:24 AM4/4/12

to tc...@googlegroups.com

uim-1.8.0が2012-03-31にリリースされました。
http://code.google.com/p/uim/downloads/list
漢直関係では以下の機能が追加されています。

* uim-tutcode
** 候補ウィンドウの遅延表示
入力時に予測入力やヘルプの処理完了を待たずにすむようになります。
+ 一定時間キー入力が無い場合のみ予測入力候補やヘルプ(仮想鍵盤等)を表示
(迷わず入力している間は余計なヘルプは表示しない)。(tc2と同様)
** 後置型変換(*)の追加:
+ カタカナ変換
+ 漢字→入力シーケンス変換:
TUT-Codeオン・オフのモード切り替えなしで英単語を入力して、
後から英字化するための機能です。
例:"undo "と打鍵すると"趣・"と表示され、変換開始キーで、"undo"に変換。
+ 入力シーケンス→漢字変換:
TUT-Codeオンにし忘れてTUT-Codeを入力した場合に、
後から漢字に変換するための機能です。
** セレクションに対する変換(*):
+ 交ぜ書き変換
+ カタカナ変換
+ 漢字→入力シーケンス変換
+ 入力シーケンス→漢字変換
「漢字→入力シーケンス変換」と「入力シーケンス→漢字変換」は、
1つキーを打ちもらした場合など、一度キーシーケンスに戻して修正した後、
再度漢字に変換する場合に利用可能です。
** クリップボード関係の機能追加(*)
+ クリップボード内文字列に対するヘルプ表示
+ クリップボードからpreeditへの貼り付け
(部首合成変換中に部首合成シーケンス(例:"言▲▲西一早")の貼り付け可能)
+ クリップボード内の文字列に対して、入力シーケンス→漢字変換して貼り付け
** カーソル位置の文字のヘルプ表示(*)
** 確定取り消し(*)
** 仮想鍵盤上のボタンクリックをキー入力とみなす
** 設定追加
+ 部首合成変換アルゴリズムを選択可能に:
(従来のtc-2.1相当に加え)tc-2.3.1と漢直Winのアルゴリズムを追加。
+ 交ぜ書き変換の学習で、先頭から指定個数の候補は順番を変えない設定を追加
+ 漢字に変換できない入力シーケンスはそのまま残す設定を追加
(「漢字→入力シーケンス変換」用)
+ 候補確定に使うラベル文字の選択肢を追加:
(従来は'alwaysと'neverのみ。'alwaysにすると、
対応する候補の無いラベル文字を入力すると無視されていた)
'always ラベル文字全て
'havecand 候補に対応するラベル文字のみ
'candwin 候補ウィンドウ表示中に、候補に対応するラベル文字のみ
'never ラベル文字による候補確定は行わない
+ 入力シーケンスにユーザ定義プロシージャを割り当て可能に:
セレクション(*)に対して外部フィルタコマンドを使って整形するなどの機能も、
uim-external-filterの関数を使うことで可能。
** trycodeのコード表を更新

(*)セレクション、クリップボード、カーソル位置の文字取得、確定取り消し、
後置型変換は、uimのtext aquisition API(surrounding text API)を使っている
ので、uim-gtk, uim-qt4, uim-qt3でのみ使用可能です(uim-ximは未対応)。
なお、確定取り消しや後置型変換は、
tutcode-enable-fallback-surrounding-text?を#tに設定すれば、
限定的ながら動作可能な場合があります。

* 参考:部首合成変換アルゴリズムの違い
4772件の部首合成にかかった時間は以下(ONKYO BX Atom Z515 1.2GHzで測定)。
# 参考:Emacs 22.3上のtc-2.1+ml1925では54s程度、tc-2.3.1-22.6では3m30s程度。
# (keyboard macroで実行。ding中断回避のためtc-bushu.el 997行目を(ding t)に変更)

real user sys
7m23.110s 7m22.010s 0m01.050s tc-2.1+ml1925
12m20.460s 2m38.780s 9m41.480s kw-yamanobe
45m04.130s 2m36.900s 42m27.020s tc-2.3.1-22.6

また、合成される文字の違いは以下に置きました。
http://www1.interq.or.jp/~deton/tutcode/uimb_dif.txt.gz
# [tcode-ml:2660]のkwb_diff.txtに、tc2とuimの結果を追加したものです。
# 部首1,部首2,OKA(漢直Win),YAMANOBE(漢直Win),tc-2.1,tc-2.1+tcode-ml1925,tc-2.3.1,tc-2.3.1-22.6,tc-2.1+tcode-ml1925(uim),kw-yamanobe(uim),tc-2.3.1-22.6(uim)

# uim-tutcodeで部首合成を行うスクリプト(uim-sh $PWD/bushuconvi.scm)
# "b1b2"ファイルは部首1と部首2のみ(","無し)を抜き出したファイル。
(require "tutcode.scm")
(require "fileio.scm")
(tutcode-custom-load-rule! tutcode-rule-filename)
(set! tutcode-bushu-help-filename "")
;(set! tutcode-bushu-conversion-algorithm 'kw-yamanobe)
(call-with-open-file-port
(file-open "b1b2" (file-open-flags-number '($O_RDONLY)) 0)
(lambda (port)
(let loop ((line (file-read-line port)))
(if (and line (not (eof-object? line)))
(let*
((lst (tutcode-bushu-parse-entry line))
(res (tutcode-bushu-convert (car lst) (cadr lst))))
(if (string? res)
(display res))
(newline)
(loop (file-read-line port)))))))
--
木原英人 / KIHARA, Hideto / de...@m1.interq.or.jp
http://www1.interq.or.jp/~deton/

KIHARA Hideto

unread,

Apr 8, 2012, 6:10:19 AM4/8/12

to tc...@googlegroups.com

> uim-1.8.0が2012-03-31にリリースされました。

uim-tutcodeの前置型部首合成変換(対話的含む)にバグがありました。

* 現象
"5"や"3"など、コード表の入力シーケンス内に無いキーが入力できません。
そのため、「シ5→汚」や「車3→轟」などの変換ができません。

* 対処
ソースリポジトリでは修正したので、上記現象で困っている場合は、
以下からtutcode.scmをダウンロードして置き換えてください。
http://uim.googlecode.com/git/scm/tutcode.scm

KIHARA Hideto

unread,

Apr 14, 2012, 6:24:49 AM4/14/12

to tc...@googlegroups.com

On Sun, Apr 08, 2012 at 07:10:19PM +0900,
KIHARA Hideto <de...@m1.interq.or.jp> wrote:
> ソースリポジトリでは修正したので、上記現象で困っている場合は、
> 以下からtutcode.scmをダウンロードして置き換えてください。

訂正です。以下のURLのtutcode.scmを使ってください。
http://uim.googlecode.com/git-history/ec32142871492bd375302addc1bbaee97e6cd47f/scm/tutcode.scm

既にダウンロード済の場合は、ダウンロードし直す必要はありません。
# 新しいURLのtutcode.scmは、前回のメールのtutcode.scmと中身は同じなので。

# 前回のメールのURLは、開発中の最新のtutcode.scmのため、
# 今後開発が進むとtutcode.scmだけを置き換えても動かなくなります。
## tutcode.scmが依存しているtutcode-custom.scm等も合わせて置き換える必要あり。

Reply all

Reply to author

Forward