libchewing-data 匯入教育部《國語辭典簡編本》2021 詞庫資料的可行性?

32 views
Skip to first unread message

Hui-Hong You

unread,
Mar 30, 2026, 11:57:29 PM (5 days ago) Mar 30
to Chewing IM Development
大家好:

我看到 https://language.moe.gov.tw/001/Upload/Files/site_content/M0001/respub/index.html 有教育部《國語辭典簡編本》2021 的開放資料,想請問從這裡匯入至 libchewing-data 的可行性?會這麼問是因為在日常使用新酷音中,發現有些常用詞未收錄,雖然可以依賴新酷音的自動學習記憶機制,不過還是會想,如果能夠把這些常用詞收錄進新酷音詞庫裡,使用上應該會再稍稍增加一些便利性。

Kan-Ru Chen

unread,
Mar 31, 2026, 12:35:30 AM (5 days ago) Mar 31
to Hui-Hong You, chewin...@googlegroups.com
我自己覺得沒有問題,目前的字典格式可以標記來源跟授權資訊。

之前有另外一個想要整合教育部重編國語辭典資料的 ticket 可以參考 https://codeberg.org/chewing/libchewing-data/issues/57

On Tue, Mar 31, 2026, at 12:57 PM, Hui-Hong You wrote:
大家好:

我看到 https://language.moe.gov.tw/001/Upload/Files/site_content/M0001/respub/index.html 有教育部《國語辭典簡編本》2021 的開放資料,想請問從這裡匯入至 libchewing-data 的可行性?會這麼問是因為在日常使用新酷音中,發現有些常用詞未收錄,雖然可以依賴新酷音的自動學習記憶機制,不過還是會想,如果能夠把這些常用詞收錄進新酷音詞庫裡,使用上應該會再稍稍增加一些便利性。


--
這是 Google 網路論壇針對「Chewing IM Development」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 chewing-deve...@googlegroups.com

Hui-Hong You

unread,
Mar 31, 2026, 1:18:06 AM (4 days ago) Mar 31
to Chewing IM Development
感謝!
我把參考實作放在這裡了:

如果在收 PR 之前有什麼需要配合修改的,或覺得有何不妥之處,還請不吝提出。

Kan-Ru Chen 在 2026年3月31日 星期二中午12:35:30 [UTC+8] 的信中寫道:

Kan-Ru Chen

unread,
Mar 31, 2026, 1:35:15 AM (4 days ago) Mar 31
to Hui-Hong You, chewin...@googlegroups.com
我建議開一個新的目錄 dict/moe/ 然後把相關的 script 跟字典檔放在裡面

dict/chewing/ 是用來收錄 libchewing 原本預設的字典們

字典檔案我想可以用 moe_concised.dat

Hui-Hong You

unread,
Mar 31, 2026, 2:38:39 AM (4 days ago) Mar 31
to Kan-Ru Chen, chewin...@googlegroups.com
OK,
已經改了檔案的擺放架構,再請確認,感謝!

BTW,
配合遷移至 Codeberg,




Kan-Ru Chen <ka...@kanru.info> 於 2026年3月31日週二 下午1:35寫道:

Kan-Ru Chen

unread,
Mar 31, 2026, 3:22:52 AM (4 days ago) Mar 31
to Hui-Hong You, chewin...@googlegroups.com
Reply all
Reply to author
Forward
0 new messages