libchewing 內的拼音問題

22 views
Skip to first unread message

Andrew Lee

unread,
Nov 8, 2006, 4:17:32 AM11/8/06
to Jeff Chen, chewin...@googlegroups.com, Dan Jacobson
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Dear wiz,

記得之前在 chewing-devel 的 mailing list 上討論說要讓酷音支援多種不同
的拼音系統,這樣漢語拼音跟您之前在 0.2.x 實做的拼音(似乎是林語堂拼音?)
,就都可以同時支援並讓使用者選擇。

今天在酷音的 mailing list 上有人回報說 FC6 上面,用漢語拼音沒法打出這
兩個字:
說 [shuo1]
做 [zuo4]

所以我查看了 libchewing 的 SVN 發現您有更動過相關部份:

4440 (orig r692): wiz | 2006-06-19 22:11:24 +0800

2006-06-19 Jeff Chen <wiz....@gmail.com>

* data/pinyin.tab
A new HanYu-PinYin mapping table contributed by Alexander Beels.

* src/hanyupinyin.h (chewing_set_PinYinMethod), src/hanyupinyin.c:
Adding a new API --- "chewing_set_PinYinMethod" to support multiple
PinYin methods.
Using the implementation of 0.2.x insteads of current one.

* src/zuin.c (IsSymbolKey)
Adding "IsSymbolKey" function to make PinYin method support symbol input.
- ----------------------------------------------------------------------
r4372 (orig r653): wiz | 2006-05-19 00:14:24 +0800

2006-05-19 Jeff Chen <wiz....@gmail.com>

* data/pinyin.tab (fix key order):
put "shun" before "shuo".

* src/hanyupinyin.c (InitMap):
The upper limit of for-loop should be N_TOTAL not (N_TOTAL - 1).
- ----------------------------------------------------------------------

我看過新的 data/pinyin.tab 的內容,發現這分對照表似乎有些問題,由於不
知道如何聯絡 Alexander Beels,可否請您幫忙跟他確認一下?

另外,我先解釋一下在 0.3.0 內採用的 Hanyu Pinyin 表格出處,是由 xcin
的 source code 內的 bims_pinyin.cin 所轉換過來,這分表格是由 Jidanni
先生提供的,Jidanni 先生長期住在台灣,是一位正體中文漢語拼音使用者,並
非一般的簡體中文漢語拼音使用者。若有關於漢語拼音輸入正體中文的疑問,相
信他可以給予相當的解說。

PS. Jidanni 先生的網站已經有許多關於漢語拼音的資料,收入了很完整的相關
爭議及誤解: http://jidanni.org/lang/pinyin/index.html

- -Andrew
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.5 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFFUaCpnQYz4bYlCYURAu6uAJ9o2xs1xI5nwaZeOty2Pc+8DDstYQCgzwQy
ZrtOLJ30a/yCFExmhITY4ZU=
=LOLk
-----END PGP SIGNATURE-----

bims_pinyin.cin

Jeff Chen

unread,
Nov 15, 2006, 11:24:42 AM11/15/06
to Andrew Lee, chewin...@googlegroups.com, Dan Jacobson
Hi Andrew,

很抱歉, 這麼晚才回覆..
目前在trunk上面的實做方式和 0.3.0並不一樣, 之前經過討論後, 我還是將它改回
聲母,韻母分開比對的方式,這樣做的話,容錯能力較高,整個mapping table的資料相對也比較少,而table也已經採用"漢語拼音"的方式。
也就是說若使用trunk上最新版本就已經解決這些問題。

-wiz


2006/11/8, Andrew Lee <and...@linux.org.tw>:
%bimspin
# %tone1         1
%tone2   2
%tone3   3
%tone4   4
%tone5   1
%yinmap  begin
a        ㄚ
ai       ㄞ
an       ㄢ
ang      ㄤ
ao       ㄠ
b        ㄅ
ba       ㄅㄚ
bai      ㄅㄞ
ban      ㄅㄢ
bang     ㄅㄤ
bao      ㄅㄠ
bei      ㄅㄟ
ben      ㄅㄣ
beng     ㄅㄥ
bi       ㄅㄧ
bian     ㄅㄧㄢ
biao     ㄅㄧㄠ
bie      ㄅㄧㄝ
bin      ㄅㄧㄣ
bing     ㄅㄧㄥ
bo       ㄅㄛ
bu       ㄅㄨ
c        ㄘ
ca       ㄘㄚ
cai      ㄘㄞ
can      ㄘㄢ
cang     ㄘㄤ
cao      ㄘㄠ
ce       ㄘㄜ
cen      ㄘㄣ
ceng     ㄘㄥ
cha      ㄔㄚ
chai     ㄔㄞ
chan     ㄔㄢ
chang    ㄔㄤ
chao     ㄔㄠ
che      ㄔㄜ
chen     ㄔㄣ
cheng    ㄔㄥ
chi      ㄔ
chong    ㄔㄨㄥ
chou     ㄔㄡ
chu      ㄔㄨ
chua     ㄔㄨㄚ
chuai    ㄔㄨㄞ
chuan    ㄔㄨㄢ
chuang   ㄔㄨㄤ
chui     ㄔㄨㄟ
chun     ㄔㄨㄣ
chuo     ㄔㄨㄛ
ci       ㄘ
cong     ㄘㄨㄥ
cou      ㄘㄡ
cu       ㄘㄨ
cuan     ㄘㄨㄢ
cui      ㄘㄨㄟ
cun      ㄘㄨㄣ
cuo      ㄘㄨㄛ
d        ㄉ
da       ㄉㄚ
dai      ㄉㄞ
dan      ㄉㄢ
dang     ㄉㄤ
dao      ㄉㄠ
de       ㄉㄜ
dei      ㄉㄟ
deng     ㄉㄥ
di       ㄉㄧ
dian     ㄉㄧㄢ
diao     ㄉㄧㄠ
die      ㄉㄧㄝ
ding     ㄉㄧㄥ
diu      ㄉㄧㄡ
dong     ㄉㄨㄥ
dou      ㄉㄡ
du       ㄉㄨ
duan     ㄉㄨㄢ
dui      ㄉㄨㄟ
dun      ㄉㄨㄣ
duo      ㄉㄨㄛ
e        ㄜ
ei       ㄟ
en       ㄣ
eng      ㄥ
er       ㄦ
f        ㄈ
fa       ㄈㄚ
fan      ㄈㄢ
fang     ㄈㄤ
fei      ㄈㄟ
fen      ㄈㄣ
feng     ㄈㄥ
fo       ㄈㄛ
fou      ㄈㄡ
fu       ㄈㄨ
g        ㄍ
ga       ㄍㄚ
gai      ㄍㄞ
gan      ㄍㄢ
gang     ㄍㄤ
gao      ㄍㄠ
ge       ㄍㄜ
gei      ㄍㄟ
gen      ㄍㄣ
geng     ㄍㄥ
gong     ㄍㄨㄥ
gou      ㄍㄡ
gu       ㄍㄨ
gua      ㄍㄨㄚ
guai     ㄍㄨㄞ
guan     ㄍㄨㄢ
guang    ㄍㄨㄤ
gui      ㄍㄨㄟ
gun      ㄍㄨㄣ
guo      ㄍㄨㄛ
h        ㄏ
ha       ㄏㄚ
hai      ㄏㄞ
han      ㄏㄢ
hang     ㄏㄤ
hao      ㄏㄠ
he       ㄏㄜ
hei      ㄏㄟ
hen      ㄏㄣ
heng     ㄏㄥ
hong     ㄏㄨㄥ
hou      ㄏㄡ
hu       ㄏㄨ
hua      ㄏㄨㄚ
huai     ㄏㄨㄞ
huan     ㄏㄨㄢ
huang    ㄏㄨㄤ
hui      ㄏㄨㄟ
hun      ㄏㄨㄣ
huo      ㄏㄨㄛ
j        ㄐ
ji       ㄐㄧ
jia      ㄐㄧㄚ
jian     ㄐㄧㄢ
jiang    ㄐㄧㄤ
jiao     ㄐㄧㄠ
jie      ㄐㄧㄝ
jin      ㄐㄧㄣ
jing     ㄐㄧㄥ
jiong    ㄐㄩㄥ
jiu      ㄐㄧㄡ
ju       ㄐㄩ
juan     ㄐㄩㄢ
jue      ㄐㄩㄝ
jun      ㄐㄩㄣ
k        ㄎ
ka       ㄎㄚ
kai      ㄎㄞ
kan      ㄎㄢ
kang     ㄎㄤ
kao      ㄎㄠ
ke       ㄎㄜ
ken      ㄎㄣ
keng     ㄎㄥ
kong     ㄎㄨㄥ
kou      ㄎㄡ
ku       ㄎㄨ
kua      ㄎㄨㄚ
kuai     ㄎㄨㄞ
kuan     ㄎㄨㄢ
kuang    ㄎㄨㄤ
kui      ㄎㄨㄟ
kun      ㄎㄨㄣ
kuo      ㄎㄨㄛ
l        ㄌ
la       ㄌㄚ
lai      ㄌㄞ
lan      ㄌㄢ
lang     ㄌㄤ
lao      ㄌㄠ
le       ㄌㄜ
lei      ㄌㄟ
leng     ㄌㄥ
li       ㄌㄧ
lia      ㄌㄧㄚ
lian     ㄌㄧㄢ
liang    ㄌㄧㄤ
liao     ㄌㄧㄠ
lie      ㄌㄧㄝ
lin      ㄌㄧㄣ
ling     ㄌㄧㄥ
liu      ㄌㄧㄡ
long     ㄌㄨㄥ
lou      ㄌㄡ
lu       ㄌㄨ
luan     ㄌㄨㄢ
lue      ㄌㄩㄝ
lun      ㄌㄨㄣ
luo      ㄌㄨㄛ
luu      ㄌㄩ
lv       ㄌㄩ
m        ㄇ
ma       ㄇㄚ
mai      ㄇㄞ
man      ㄇㄢ
mang     ㄇㄤ
mao      ㄇㄠ
me       ㄇㄜ
mei      ㄇㄟ
men      ㄇㄣ
meng     ㄇㄥ
mi       ㄇㄧ
mian     ㄇㄧㄢ
miao     ㄇㄧㄠ
mie      ㄇㄧㄝ
min      ㄇㄧㄣ
ming     ㄇㄧㄥ
miu      ㄇㄧㄡ
mo       ㄇㄛ
mou      ㄇㄡ
mu       ㄇㄨ
na       ㄋㄚ
nai      ㄋㄞ
nan      ㄋㄢ
nang     ㄋㄤ
nao      ㄋㄠ
ne       ㄋㄜ
nei      ㄋㄟ
nen      ㄋㄣ
neng     ㄋㄥ
ni       ㄋㄧ
nian     ㄋㄧㄢ
niang    ㄋㄧㄤ
niao     ㄋㄧㄠ
nie      ㄋㄧㄝ
nin      ㄋㄧㄣ
ning     ㄋㄧㄥ
niu      ㄋㄧㄡ
nong     ㄋㄨㄥ
nou      ㄋㄡ
nu       ㄋㄨ
nuan     ㄋㄨㄢ
nuo      ㄋㄨㄛ
nue      ㄋㄩㄝ
nuu      ㄋㄩ
nv       ㄋㄩ
o        ㄛ
ou       ㄡ
p        ㄆ
pa       ㄆㄚ
pai      ㄆㄞ
pan      ㄆㄢ
pang     ㄆㄤ
pao      ㄆㄠ
pei      ㄆㄟ
pen      ㄆㄣ
peng     ㄆㄥ
pi       ㄆㄧ
pian     ㄆㄧㄢ
piao     ㄆㄧㄠ
pie      ㄆㄧㄝ
pin      ㄆㄧㄣ
ping     ㄆㄧㄥ
po       ㄆㄛ
pou      ㄆㄡ
pu       ㄆㄨ
q        ㄑ
qi       ㄑㄧ
qia      ㄑㄧㄚ
qian     ㄑㄧㄢ
qiang    ㄑㄧㄤ
qiao     ㄑㄧㄠ
qie      ㄑㄧㄝ
qin      ㄑㄧㄣ
qing     ㄑㄧㄥ
qiong    ㄑㄩㄥ
qiu      ㄑㄧㄡ
qu       ㄑㄩ
quan     ㄑㄩㄢ
que      ㄑㄩㄝ
qun      ㄑㄩㄣ
r        ㄖ
ran      ㄖㄢ
rang     ㄖㄤ
rao      ㄖㄠ
re       ㄖㄜ
ren      ㄖㄣ
reng     ㄖㄥ
ri       ㄖ
rong     ㄖㄨㄥ
rou      ㄖㄡ
ru       ㄖㄨ
ruan     ㄖㄨㄢ
rui      ㄖㄨㄟ
run      ㄖㄨㄣ
ruo      ㄖㄨㄛ
s        ㄙ
sa       ㄙㄚ
sai      ㄙㄞ
san      ㄙㄢ
sang     ㄙㄤ
sao      ㄙㄠ
se       ㄙㄜ
sen      ㄙㄣ
seng     ㄙㄥ
sh       ㄕ
sha      ㄕㄚ
shai     ㄕㄞ
shan     ㄕㄢ
shang    ㄕㄤ
shao     ㄕㄠ
she      ㄕㄜ
shei     ㄕㄟ
shen     ㄕㄣ
sheng    ㄕㄥ
shi      ㄕ
shou     ㄕㄡ
shu      ㄕㄨ
shua     ㄕㄨㄚ
shuai    ㄕㄨㄞ
shuan    ㄕㄨㄢ
shuang   ㄕㄨㄤ
shui     ㄕㄨㄟ
shuo     ㄕㄨㄛ
shun     ㄕㄨㄣ
si       ㄙ
song     ㄙㄨㄥ
sou      ㄙㄡ
su       ㄙㄨ
suan     ㄙㄨㄢ
sui      ㄙㄨㄟ
sun      ㄙㄨㄣ
suo      ㄙㄨㄛ
t        ㄊ
ta       ㄊㄚ
tai      ㄊㄞ
tan      ㄊㄢ
tang     ㄊㄤ
tao      ㄊㄠ
te       ㄊㄜ
teng     ㄊㄥ
ti       ㄊㄧ
tian     ㄊㄧㄢ
tiao     ㄊㄧㄠ
tie      ㄊㄧㄝ
ting     ㄊㄧㄥ
tong     ㄊㄨㄥ
tou      ㄊㄡ
tu       ㄊㄨ
tuan     ㄊㄨㄢ
tui      ㄊㄨㄟ
tun      ㄊㄨㄣ
tuo      ㄊㄨㄛ
wa       ㄨㄚ
wai      ㄨㄞ
wan      ㄨㄢ
wang     ㄨㄤ
wei      ㄨㄟ
wen      ㄨㄣ
weng     ㄨㄥ
wo       ㄨㄛ
wu       ㄨ
x        ㄒ
xi       ㄒㄧ
xia      ㄒㄧㄚ
xian     ㄒㄧㄢ
xiang    ㄒㄧㄤ
xiao     ㄒㄧㄠ
xie      ㄒㄧㄝ
xin      ㄒㄧㄣ
xing     ㄒㄧㄥ
xiong    ㄒㄩㄥ
xiu      ㄒㄧㄡ
xu       ㄒㄩ
xuan     ㄒㄩㄢ
xue      ㄒㄩㄝ
xun      ㄒㄩㄣ
ya       ㄧㄚ
yai      ㄧㄞ
yan      ㄧㄢ
yang     ㄧㄤ
yao      ㄧㄠ
ye       ㄧㄝ
yi       ㄧ
yin      ㄧㄣ
ying     ㄧㄥ
yo       ㄧㄛ
yong     ㄩㄥ
you      ㄧㄡ
yu       ㄩ
yuan     ㄩㄢ
yue      ㄩㄝ
yun      ㄩㄣ
z        ㄗ
za       ㄗㄚ
zai      ㄗㄞ
zan      ㄗㄢ
zang     ㄗㄤ
zao      ㄗㄠ
ze       ㄗㄜ
zei      ㄗㄟ
zen      ㄗㄣ
zeng     ㄗㄥ
zh       ㄓ
zha      ㄓㄚ
zhai     ㄓㄞ
zhan     ㄓㄢ
zhang    ㄓㄤ
zhao     ㄓㄠ
zhe      ㄓㄜ
zhen     ㄓㄣ
zheng    ㄓㄥ
zhi      ㄓ
zhong    ㄓㄨㄥ
zhou     ㄓㄡ
zhu      ㄓㄨ
zhua     ㄓㄨㄚ
zhuai    ㄓㄨㄞ
zhuan    ㄓㄨㄢ
zhuang   ㄓㄨㄤ
zhui     ㄓㄨㄟ
zhun     ㄓㄨㄣ
zhuo     ㄓㄨㄛ
zi       ㄗ
zong     ㄗㄨㄥ
zou      ㄗㄡ
zu       ㄗㄨ
zuan     ㄗㄨㄢ
zui      ㄗㄨㄟ
zun      ㄗㄨㄣ
zuo      ㄗㄨㄛ
%yinmap  end


Andrew Lee

unread,
Nov 18, 2006, 1:07:25 AM11/18/06
to Jeff Chen, chewin...@googlegroups.com, Dan Jacobson
Hi Jeff,

原本的實做方式是為了確保漢語拼音跟注音是 one to one mapping,既然這樣分
開聲母韻母會比較好實做的話,也沒關係。

但我直覺上懷疑,若把錯誤的拼法當作"容錯",一定會直接影響到讀音,這樣可能
會造成使用者學習/使用時的混淆吧?

Jidanni 兄的看法呢?

-Andrew

Jeff Chen wrote:
> Hi Andrew,
>
> 很抱歉, 這麼晚才回覆..
> 目前在trunk上面的實做方式和 0.3.0並不一樣, 之前經過討論後, 我還是將它改回
> 聲母,韻母分開比對的方式,這樣做的話,容錯能力較高,整個mapping table的
> 資料相對也比較少,而table也已經採用"漢語拼音"的方式。
> 也就是說若使用trunk上最新版本就已經解決這些問題。
>
> -wiz
>
>

> 2006/11/8, Andrew Lee <and...@linux.org.tw <mailto:and...@linux.org.tw>>:


>
> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
>
> Dear wiz,
>
> 記得之前在 chewing-devel 的 mailing list 上討論說要讓酷音支援多種不同
> 的拼音系統,這樣漢語拼音跟您之前在 0.2.x 實做的拼音(似乎是林語堂拼音?)
> ,就都可以同時支援並讓使用者選擇。
>
> 今天在酷音的 mailing list 上有人回報說 FC6 上面,用漢語拼音沒法打出這
> 兩個字:
> 說 [shuo1]
> 做 [zuo4]
>
> 所以我查看了 libchewing 的 SVN 發現您有更動過相關部份:
>
> 4440 (orig r692): wiz | 2006-06-19 22:11:24 +0800
>

> 2006-06-19 Jeff Chen <wiz....@gmail.com <mailto:wiz....@gmail.com>>


>
> * data/pinyin.tab
> A new HanYu-PinYin mapping table contributed by Alexander Beels.
>
> * src/hanyupinyin.h (chewing_set_PinYinMethod), src/hanyupinyin.c:
> Adding a new API --- "chewing_set_PinYinMethod" to support multiple
> PinYin methods.
> Using the implementation of 0.2.x insteads of current one.
>
> * src/zuin.c (IsSymbolKey)
> Adding "IsSymbolKey" function to make PinYin method support symbol
> input.
> -
> ----------------------------------------------------------------------
> r4372 (orig r653): wiz | 2006-05-19 00:14:24 +0800
>

> 2006-05-19 Jeff Chen <wiz....@gmail.com <mailto:wiz....@gmail.com>>

shelandy

unread,
Nov 18, 2006, 1:45:18 AM11/18/06
to chewin...@googlegroups.com
Andrew Lee wrote:
> Hi Jeff,
>
> 原本的實做方式是為了確保漢語拼音跟注音是 one to one mapping,既然這樣分
> 開聲母韻母會比較好實做的話,也沒關係。
>
> 但我直覺上懷疑,若把錯誤的拼法當作"容錯",一定會直接影響到讀音,這樣可能
> 會造成使用者學習/使用時的混淆吧?
>
雖然我不用漢語拼音,但在把錯誤的拼法當作"容錯"上我贊成Andrew的說法,

一個變通的方式是:容許輸入錯誤的拼法但提出警告"這是可能是錯誤的拼法"

Caius Chance

unread,
Nov 18, 2006, 2:08:35 AM11/18/06
to chewin...@googlegroups.com
支持ANDREW的觀點。

我提議容錯後在畫面上附註正確的拼音,以作參考。

Caius

2006/11/18, shelandy <shel...@gmail.com>:

Zhe Su

unread,
Nov 18, 2006, 3:32:01 AM11/18/06
to chewin...@googlegroups.com
Hi,
I think the attached Chinese pinyin standard should be useful for
you. IMHO, pinyin input method should follow this standard strictly.

Regards
James Su

pinyin-standard.tar.gz

wiz

unread,
Nov 18, 2006, 7:56:36 AM11/18/06
to Chewing IM Development
很抱歉..
我不應該使用"容錯"這個詞,
其實也沒有什麼特別的"容錯"能力,
只是因為聲母和韻母加上greedy比對的方式,會讓一些錯誤的輸入也可以拼出字
(如"niiiiiiiiii3"),而目前並沒有去做這樣的檢查修正。因為酷音中的拼音模組,
甚至是底層的音韻比對方式都是基於原本的注音模組,所以有很多限制,
如標點符號的輸入,目前我是先用很髒的方式,從中攔截,讓拼音輸入,
也可以輸入常用的全形標點符號。而我"直覺"或許它對改善拼音輸入方式有很大
的幫助。
Reply all
Reply to author
Forward
0 new messages