float,
我通常在這邊用 Sponge 做稱呼,可以這樣叫我
其實為了好看,也許可考慮輸出 csv / json, 有其他 tool 能直接吃,不過當然這種格式我用起來沒你們方便,只是能用 Excel 載入這樣
Python 在這二種格式應該都有 support library, 所以這個報表要轉 csv 應該很迅速
在 2013/10/18,陳鵬宇 <
a135...@gmail.com> 撰寫:
> Hi 博丞,
>
> 破音字部份是可以處理,我也還在想怎樣表示會比較容易閱讀。
>
> 至於發展的部份 jserv 是提到可以訂正一些詞庫拼音的錯誤,以往可能都是人工去修正。
>
> 博丞 詹於 2013年10月18日星期五UTC+8下午8時49分31秒寫道:
>>
>> Hi, float
>>
>> 有沒有辦法把破音字集中整理,如:
>>
>> 一 [ㄧˊ,ㄧˋ] [ㄧ]
>> 一丁不識 [ㄧ ㄉㄧㄥ ㄅㄨˊ ㄕˋ,ㄧˋ ㄉㄧㄥ ㄅㄨˊ ㄕˋ] [ㄧ ㄉㄧㄥ ㄅㄨˋ ㄕˋ]
>>
>> 另外請教一下,jserv 做這比對能替新酷音帶來怎樣的發展?
>>
>> thanks
>>
>> 在 2013/10/18,陳鵬宇 <
a135...@gmail.com <javascript:>> 撰寫:
>> > hi all,
>> >
>> > 日前參加黑客松 jserv 提到想要把酷音的詞庫拿來跟萌典的詞庫做比對,找出注音拼法不同的部份,
>> >
>> > 附件是我目前的一些成果。
>> >
>> > preprocess.sh 會先下載 kcwu 大大提供的萌典 sqlite3 詞庫,並且將詞和注音 query 出來,
>> >
>> > 並且先把格式處理成跟酷音詞庫相同。
>> >
>> > check.py 會把處理完的結果做比較並輸出。
>> >
>> > result 是目前我比對的結果。
>> >
>> > 以上不知道各位有沒有什麼建議的,謝謝。
>> >
>> > float
>> >
>> > --
>> > 您已訂閱「Google 網上論壇」的「Chewing IM Development」群組,因此我們特別傳送這封郵件通知您。
>> > 如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到
>> >
chewing-deve...@googlegroups.com <javascript:>。
>> > 如要在此群組張貼留言,請傳送電子郵件至
chewin...@googlegroups.com <javascript:>。