緣份(X) → 緣分(O)
夠份量(X) → 夠分量(O)
知識份子(X) → 知識分子(O)
輩份(X) → 輩分(O)
本份(X) → 本分(O)
過份(X) → 過分(O)
硬梆梆(X) → 硬邦邦(O)
鴨子呱呱叫(X) → 鴨子聒聒叫(O)
碼錶(X) → 馬表(O) 有可能嗎?
沒輒(X) → 沒轍(O) 不會吧?
嘎然而止(X) → 戛(ㄐ一ㄚˊ)然而止(O)
鬍渣(X) → 鬍碴(ㄔㄚˊ)(O)
僵屍(X) → 殭屍(O)
頒佈/宣佈/發佈(X) → 頒布/宣布/發布(O)
假藉(X) → 假借(O)
男仕(X) → 男士(O)
重覆(X) → 重複(O)
揭密(X) → 揭祕(O)
華陀(X) → 華佗(O) <<
黃蓮(X) → 黃連(O)
傢具(X) → 家具(O) <<
脈膊(X) → 脈搏(O)
蕃茄/蕃薯(X) → 番茄/番薯(O)
記賬(X) → 記帳(O)
怡人(X) → 宜人(O)
秘密(X) → 祕密(O)
高挑(X) → 高"身兆"(O)
反唇相譏(X) → 反唇相稽(O)
僱主(X) → 雇主(O)
雇用(X) → 僱用(O)(名詞用「雇」,動詞用「僱」)
嬴弱(X) → 羸(ㄌㄟˊ)弱(O)
雖然我是看到了,但我不敢說以上是百份百準確,因為都是台灣說法(好像說是跟當教育地部的修訂有關)。
但我發現新速成確有香港認同的錯別字
華陀(X) → 華佗(O) <<
傢具(X) → 家具(O) <<
其他我不敢說,以前用開速成,比如: 秘密 和 祕密 是不是錯別字,還是異體字,到現在也不敢肯定。
當然,新速成用的是香港標準,錯別字自然是越少越好,畢竟輸入法對用家的語文影響力不少。
「易速成」無疑是用作輸入中文的一種軟件。可是,在設計它時,我們並不只當它
是一件科技項目。由於深知其對語文應用的潛在影響力,我們一直亦把它視作一件
可用作語文教育的工具。閣下以上所提到的,其實正是我們堅持的其一原則。
詞庫從來只能經收集得來,而不會是某人或某團體所能做出來的。「易速成」現時
的詞組大概有十萬條。至於每次當需要作些較重要的修正時,最少也用上一個月,
最多時還需三個多月。
在平常時候,我們亦會不時留意,看看會否忙中有錯。若發現可能的錯別字,亦會
作一些基本考證,務求不會發生一錯再錯的情況。
相信所有從事與文字有關的工作者也該認同,文字由於是自古流傳下來的,當然會
有一定的規範。但有時又會約定俗成,蘊含一種奇特的生命力。因此,新造的詞語
會不時出現,但那些會被接受,而那些會被淘汰,只能經受時間考驗。
作為詞庫的編輯者,對某些詞收或不收,只能憑經驗作出平衡。而當發現了些疑似
錯別字時,改或不改,有些情況是比大家所想像到的複雜得多。
當看到閣下的帖文,腦海中已浮現了十幾個念頭。若要把它們寫下,也不可能會是
一時三刻的事。況且,為免篇幅過長,現選擇每次只會盡量環繞一個主題,去作出
適切的回應。
註: "> " 部份是「霜醉月」於2012年1月4日下午5時20分所提出。
要知道這問題的答案,方法其實很簡單。不過,在考證的過程間,本人卻發覺了些
有趣而亦可發人深省的情況,就在此分享一下。
當我們使用一些搜尋引擎(例如google)查看此等詞時,發現了關於「華陀」的,
有3,590,000項;而關於「華佗」的,則有90,500項。如果我們先告知這些數據,
再要求閣下作出估計,答案似乎會是一面倒。
若以「華佗 華陀」去查看,情況更加特別。有為數不少的網頁,竟用了一個頗為
取巧的方法——把「華陀」用在標題中,而內文則用「華佗」。
要知道,華佗是三國時代的人物。只需查看相關時期的典籍,便會知答案是較少人
採用的「華佗」。而結論是——在網絡世界中,多人說的不一定就是對。
此類錯別字相對簡單,無論是誰去說或誰去用,對就是對,錯就是錯,毋庸置辯。
而「易速成」確曾是採納了錯的那個,自會作出修正。在下一版開始,同樣的問題
該不會再出現。
另外,我作一下有關搜尋時,已感到錯別字的困難,在台灣有教育部的指引,但我個人不太認同當中的做法,比如:份和分的用法分得很明確,香港寫作 身份
證,台灣必須寫作 身分證 否則當錯別字,就字面意義好像差不多,但我認為身份證較適當,至少 份 有人字部啊。
如果真的在網路搜尋不排除會找到不適當的錯別字,也至少香港和台灣的標準不致。
最後想說想做的,只是希望易速成盡快發揚光大。。。
希望能幫到忙,而不是幫倒忙,哈哈。
難得大家萍水相逢,以筆相交,確實珍惜這份小小的友誼。為免有所誤會,似乎有
需要解釋一下。
對就是對,錯就是錯。說的時候,並沒有半點負面的感覺。
承認錯誤是需要一定的勇氣。當然,要去做是不太難。但要坦然而正面地去認錯,
我也是經過了不少年月才能做到。
有關「身份」及「身分」的問題,我也有一些意見。不過,要等下回分解。
至於再發現詞庫還有錯別字,肯定是遲早的事。因此,若有需要的話,希望大家能
多加指正。
註: "> " 部份是「霜醉月」於2012年1月7日下午1時16分所提出。
當時,確被嚇了一跳。細想之下,靈機一觸,又來「搜尋」一下。這次發現了關於
「范仲庵」的,有27,700項。而關於「施耐淹」的,也有21,500項。原來,把兩者
混淆的,並非太偶然。幸好,關於「范仲淹」及「施耐庵」的,分別有二百多萬及
一百多萬項。
記得從少開始,老師就教我們要朗讀文章。久而久之,現在看文章時,往往都會在
心中默唸。由於以上那兩個字的讀音,根本就是天南地北。若曾經過讀唸的階段,
是沒機會弄錯的。由此看來,有部分人可能是學習不得其法。
回想一下,之前弄不清「華佗」的,有可能是經常見到「佛陀」。而由於兩字讀音
相近,問題更易發生。要避免錯誤,最簡單就是把這組詞語一起記住。
另外,我發現詞庫用不了,就是沒法增加新詞組,出現“未能成功加入該詞組”。
因為近日才回歸打字創作,很久沒用詞庫功能,剛剛才發現詞庫用不了,不知道是不是新版本的詞庫未能正式應用?
這並不是版本的問題。由一開始,詞庫就有最多二十組的限制。那麼,自定及速成
詞庫兩個加起來,就有四十組詞。若是一般應用,該已有相當效果。
註: "> " 部份是「霜醉月」於2012年1月8日下午7時20分所提出。
然後我再試試隨便新增 比如:長谷川,激光劍,網遊 等同樣失敗收場。
究竟問題在哪呢?不明白,不明白啊……
我已在不同版本的電腦上測試過,全都運作正常,沒有發生閣下所描述的問題。
為了更加直截了當,我會以電郵向閣下索取更多資料,再看看有沒有辦法找出問題
所在。
當問題解決了,才在這裏作出簡報。
註: "> " 部份是「霜醉月」於2012年1月9日下午12時11分所提出。
依我的意見,這要視乎大家對另一個關鍵詞的取態。
甚麼是「傢俬」?在我手上的詞典沒有解釋。我亦不肯定香港以外的華人會否知道
它的意思。可是,在香港,這個詞是毋須解釋,人人知曉。
「寢具」是用作就寢的器具;「廚具」是用來下廚的器具;「傢具」是用作為傢俬
的器具;而「家具」則泛指用在家中的器具。除非我們堅決不接受「傢俬」一詞,
要不然,「傢具」只會是「家具」的一種。
而事實上,在「易速成」中,兩組詞都有收納。這並非想作取巧,而是基於上面所
列舉的理據。
對於這個說法,究竟讀者們同意不同意?認同不認同呢?我是無法知曉。在這裏,
我只能借用2011年的一句熱話作結——“我反正信了”。
於一月中,網友「霜醉月」曾提到他在詞庫應用方面遇上問題。經過幾輪溝通後,
問題早已解決。
不過,由於之後一直忙著研究易速成Android版及MacOS版的可行性,以致簡報遲遲
未寫。
事實上,就算是空的詞庫,檔案大小都有256b。而網友「霜醉月」的詞庫檔案卻是
176b。估計檔案是在不明的情況下給損壞了。
另外,有關錯別字的跟進,其實還未完畢。為了做到有始有終,就趁機會在這幾天
繼續寫完餘下的幾篇。
記得在讀書時,若要形容人家身材高而修長,會用「高挑」一詞。不過,根據一些
考證,其實確是「高䠷(身兆)」才對。
至於「䠷」字旁邊為何多了那(身兆)呢?原因很簡單,就是「䠷」字在很多時候,
並不能被正確顯示出來。因此,就要說明那個字本是由(身兆)兩部份所合成的。
在發展中文電腦之初,理所當然就要編輯一套常用字集作為基礎。當發現遺漏時,
便要作出補充。經過一段時間,常用的那套字集便成定案。而之後再發現遺漏時,
就把那些字放在增補字集的擴展區內。日子久了,字也多了,擴展區亦增至A及B
兩區。
在XP的年代,幾乎所有的程式只支援常用字集。因此,那些擴展A及B區的字都是
就算打得出也看不到的。然而,從Vista開始,那些字都得到了支援。可是,若我們
將那些字放上網時,類似的問題又出現了。
說出來大家也會嚇一跳,對於字集顯示方面,支援做得最好的瀏覽器竟是大家快要
遺忘的Netscape。就算是在XP上,用家根本甚麼都毋須做,便可看到含有那些字的
文件。這證明了技術上肯定是可行的。不過,不知為何現今流行的那幾個瀏覽器都
未能把問題好好解決?當然,網頁本身的設定,也會對顯示有所影響。
如果前半句是「在數學期考中」,我們便會知道——他在數學期考中,得到了很差
的成績。
不過,若前半句轉為「小玲把蛋糕一分為八」,意思就會變成——他拿了八分之一
的蛋糕來吃。
在中國文字內,有不少字都包含了多層意思。「分」字就是其中一個好例子。若要
認定實際的含義,就必須看清上文下理。
另外,不同的兩個字有時又會有相似的意思,例如「分」及「份」——兩個字都可
解作「整體中的一部分」。在某些情況下,兩個字是可相通的。
就以上面的蛋糕例子作延伸,小玲把蛋糕一分為八,分成八份。那麼,一分蛋糕和
一份蛋糕都是指一件蛋糕。不過,若蛋糕是分成四份,則一份蛋糕便會有兩件了。
在之前的帖文中,曾見到有「百份百」一詞。然而,那詞該否寫成「百分百」呢?
其實,「百分百」就是一百分之一百的縮寫。這本來是分數的口述式。「百分百」
是解作「全部」。在用法上,有表示「絕對」的意思,以作加強語氣。
當然,我們也可將「百份百」勉強去解作「一百件中的一百」。
至於在日常的應用中,我們該用那個才對呢?若能了解它們的實際意思,答案自是
不言而喻了。
可是,在所有香港成年人都規定要攜帶的那證件上,這詞卻被顯示為「身份證」。
若根據字義要勉強解釋,「身」變成「份」而需要證明,相信那證明只要法醫才能
發出。
此刻,即使香港政府有決心撥亂反正,由於現存的「身份證」是數以百萬計,實行
起來也不會是一時三刻所能完成的事。另外,在此之前的文獻中,「身份證」一詞
已被廣為應用。若想要改,又從何入手呢?
此事確給了我們一些啟示,就是對於那些重要的文件,就算簡單如用字方面,我們
也必須小心考究。
據個人的估計,由於語言從來就是約定俗成,最可能的發展就是將錯就錯。在以後
的詞典中,「身分證」一項之下,該會寫明——在香港,亦作「身份證」。
曾用之前的方法,在網絡搜尋一番,才驚覺自己孤陋寡聞。「鴨子呱呱叫」一詞,
有被用作歌曲名,也有被用作部落格的名。不過,個人還是覺得,既然是音聲詞,
就不該被濫用。要不然,狗是呱呱叫,貓又是呱呱叫,雞亦是呱呱叫,那只會污染
及糟蹋了既有的中國文字。
從來,狗是汪汪叫,貓是喵喵叫,雞是喔喔叫,而鴨子則是聒聒叫。所用的字都和
描述的那些動物的叫聲相近。若我們真是忘了常用的音聲詞,大可寫為「大叫」,
「不停地叫」或是「嘈吵地叫」,總不該去濫用「呱呱叫」。
若問那些詞有甚麼意思呢?我會用以下的一些理據作為分析的基礎。
「表」有列表的意思。「馬表」可以是個人名,亦可以是賽馬場或馬匹拍賣場上,
一些有關馬匹資料的列表。「碼」在這兒有代碼的意思。「碼表」就是一些代碼的
列表,例如倉頡或速成碼表。
另外,「錶」是指用作量度的儀器。「馬錶」就是用來量度馬速的儀器。而「碼」
則該有英制「三呎一碼」的意思,泛指距離或是單位。「碼錶」就是用來量度距離
或某些單位的儀器。
聽聞有些辭典只收「馬表」一詞,理據是「馬」及「表」才是正字及本字。那麼,
「馬表」便可以包含以上四種意思。究竟是那一個呢?只能看清上文下理,才可以
判斷。
語言是與時並進的。明明是可以清清楚楚地去用四個不同的名詞,來表達四種不同
的東西。為何要那麼迂腐,而將本來清清楚楚的概念變成含糊不清呢?
經過一輪考證,知道共出處應該是「拿他沒轍」,意思就是「拿他沒辦法」,本來
就是北方方言。「轍」字是解釋成車輪經過的痕跡,喻作途徑,再而引申為辦法。
至於「輒」字則解作每每或總是的意思,由於跟「轍」字同音,故此有時被誤用。
根據網上搜尋結果,「沒轍」和「沒輒」跟之前提過那「華佗」和「華陀」的情況
相似,就是用錯的人竟對比用對的還多。
由於語言有時會是「約定俗成」,有人或者擔心,這等錯誤會否經過一般日子後就
積非成是呢?筆者認為,這些問題只是人們不求甚解或是一知半解所致。若然知道
「拿他沒轍」意思就是「拿他沒辦法」,或「華佗」及「佛陀」的事實,相信沒有
人還會勉強去堅持一錯再錯。
不過,不可不知,這說法其實關係到「啞子吃黃連,有苦自己知」一句俚語。黃連
本來就是一種藥材,味苦。由於啞子不能說話,當吃了的是苦,也沒法告知他人,
只能有苦自己知。在此句中,若把那詞寫成「黃蓮」,便是錯誤。
可是,如果我們因而就下結論說——「黃蓮」該寫作「黃連」。那又對嗎?
若我說:「我買了半斤黃蓮,預備放進紅豆糖水內一起煮來吃。」那麼,「黃蓮」
是否還該寫作「黃連」呢?
在此之前說過的「輒」字,是解作每每或總是的意思。若以此勉強去解「沒輒」,
可以說成「不會總是」,直接一些,就可喻作「偶然」的意思。語言是有很獨特的
生命力,只要有人敢去創新,又言之成理。當用的人多了,便會流行起來,就自然
變成了語言的一部分。
因此,就算我們要寫清事實,也該用正確的敘述,例如「啞子吃黃連」後截不可以
寫作「黃蓮」,或「拿他沒轍」後半不可以寫為「沒輒」。