Asterisk 中文語音-台灣適用

650 views
Skip to first unread message

A.Lang, Hsu - ITBLOG.ITVIEW.COM.TW

unread,
Dec 4, 2008, 4:55:37 AM12/4/08
to Asterisk/Trixbox User Group in Taiwan - ITblog.ITview.Com.TW
Hi All,

最近有在對系統原先內建的英文語音,針對比較常用到的,像 Voicemail,撥號失敗,電話簿等這些功能常用到的語音提示,翻成中文語音,而且這可不是從其他網站下載的那套大陸版語音檔。

因為內建的語音檔實在太多,實在沒功夫,一口氣將它們全部都轉成中文語音,現在只好用到什麼功能,再來逐步轉換。

不過語音從英文轉中文過程,某些部份仍會遇到瓶頸,因為英文的語法與中文有很大不同,又 Asterisk 呼叫語音的方式是逐字呼叫,所以如何使中文語音能順暢念出來,還真是傷腦筋。

如果有人有需要,我可以分享這些檔案。

jun...@gmail.com

unread,
Dec 4, 2008, 8:03:28 AM12/4/08
to asterisk-tw
A-Lang,妳好
 
資料可以給我一份嗎,另外你有語音檔的英翻中的字譯嗎??
 
我自前也有試著轉錄,我是透過中研院的中文字轉語音進行語音轉檔,效果還可以接受,比用一些翻譯軟體內建的語音朗讀來的好很多,缺點就是音調太一般了,不過很接近真人的自然發音,你可以試試
 
 
 
2008-12-04

A.Lang, Hsu - ITBLOG.ITVIEW.COM.TW

unread,
Dec 4, 2008, 10:15:56 AM12/4/08
to aster...@googlegroups.com
我就是用這轉的,語音效果我覺得可以接受,有試過其他的,幾乎都是機械音,很糟糕。另外也有找到一個軟體 "文字MP3" ,好像挺不錯的,不過這要錢。

語音所對應的文字,我是參考這些連結,沒列入的,就從 CLI Log 上看
http://www.nathanpralle.com/software/ast_soundlist.html
http://www.nathanpralle.com/software/ast_masterlist.html
http://www.voip-info.org/wiki/view/Asterisk+sound+files

檔案請各位在等等,我整理完後在發佈出來。

如果有熱心網友願意共同協助語音中文化,我可以提供相關的轉換方法,共同製作出來的中文語音會公佈在 wiki 上供網友分享下載。

A.Lang


jun...@gmail.com

unread,
Dec 4, 2008, 9:46:43 PM12/4/08
to asterisk-tw
文字MP3好像也是用中研院的語音核心,目前中研院網站的核心版本好像是最新,其他技轉商用的版本核心用的還是舊的核心版本,轉出的語音幾乎是機械音還有破聲
 
 
 
2008-12-05

Sam

unread,
Dec 4, 2008, 10:54:43 PM12/4/08
to aster...@googlegroups.com
看到有人提到這個,不免讓我想起3年前在asterisk上作voicemail和 IVR的情形.在這就閒談一下, 分享一些經驗.

基本上, 以大家都熟的asterisk voicemail當例子, " you have two messages", 系統是用了3個語音檔.("you have"和"two"和"messages"三個). 這就是Lang兄指的"Asterisk 呼叫語音的方式是逐字呼叫". bundle在 asterisk系統的英文語音檔當然沒什麼大問題. 如果要用中文, 直覺想法,除開去求或找別人作好的語音, 就是自製了. 如果有人想把voicemail改成中文語音, 那就是不小的工程了.
現就記憶所以,回憶當時我個人作法是: 
1. 腳本. 必須先了解voicemail的流程中,提示語音在講什麼. 依其架構, 先寫出所有英文語句(畫個diagram出來,像組織圖一樣最好.我個人是如此作).
2. 程式檢視. 光用聽的方式去作腳本, 會有一些漏掉的東西. 所以檢視source有其必要. 這也有個好處. 會幫助你找到你漏掉的字句, 另外可以了解voicemail的作者是怎麼寫的, 和發現一些沒太多人知道的東西.之後自然會了解必要時怎麼修改程式.
3. 錄音. 腳本齊了, 自然就是錄音(包含後製及轉碼). 沒錢的找公司客服小姐或總機小姐,老婆女朋友都可以.(所以你知道要怎麼接近你想把的妹了.^^ ). 有錢的就把腳本給專業公司去錄製. 中文要流利, 錄完音自然要後製. 後製的重點其實並不在於要換到什麼語言格式.那都是很簡單的跑程式去轉.而是要針對錄音的品質及中文語法部份作觀察及調整. 在品質部份, 以剛才的例子來說, 三個檔案組成的中文句子, 一口氣聽出來就會發現有gap. 以沒錢的作法來說, 你要找到聲音(音樂)編輯程式,一個一個檔案去刪那些gap.當然你也可以在錄音時就刻意減少gap . 這樣之後要人工去刪gap會輕鬆一點. 在中文語法部份, 就是要在程式上動手腳了. 當時我修改的版本是asterisk 1.2.目前像1.4或1.6的版本, 有興趣的人要自行review source.  voicemail系統的修改地方大體上分二個部份. 一是國家代碼. 你要自己加入"tw"或"cn". 二是依中文語法去修改系統中呼叫語音檔的順序. 當然這是按之前你加入的國家代碼而改, 所以要改很多地方,改完了就大致結束了中文化的工作.
4. review. review當然指的就是反覆地聽(或欣賞)成果了. 當然, 你覺得ok的東西,你的老闆不一定覺得ok. 你的老闆或路人聽起來覺得不好/不爽的地方.你就要針對不好/不爽的地方重新再來一次修改.

當然, 如果用程式轉語音也是ok.也快多了. 只是用起來,我想自己錄音或找audio公司錄, 比較不會聲音品質上的問題.

作asterisk語音中文化這種事其實說起來簡單,作起來有一點煩瑣. 有志之士可以試試看. 有痣之士就儘量了. 

Sam

2008/12/4 A.Lang, Hsu - ITBLOG.ITVIEW.COM.TW <alan...@gmail.com>

A.Lang, Hsu - ITBLOG.ITVIEW.COM.TW

unread,
Dec 4, 2008, 11:58:30 PM12/4/08
to aster...@googlegroups.com
很感謝 Sam 兄的經驗分享。

您所提的與我實作的心得完全 match,不過這也提醒我,那個語音腳本的建立,或許我不該省略,如此才能嘉惠其他網友。

順道我在作個小小補充:Asterisk 支援的語音提示的檔案格式有 WAV 及 GSM,若選擇 WAV 格式,必須是 PCM encoded, 16 Bits, 8000 HZ。兩者從話筒聽到的語音品質,幾乎沒差,但 GSM 的檔案會小很多。

至於語音編輯的軟體,我是用 wavpad,要去除雜音或加長靜音,甚至轉檔都還不錯用,參考看看。

現在是用工研院所開發的語音引擎來轉,如果有人想聽聽運行在 Asterisk 的效果,可以撥我在論壇首頁公佈的專線,那個 IVR 就是用它轉的,是男聲,也試用過女聲,不過感覺不是很順。

A.Lang

2008/12/5 Sam <sam...@gmail.com>

Sam

unread,
Dec 5, 2008, 1:21:43 AM12/5/08
to aster...@googlegroups.com
建立語音腳本, 不管是對系統的文件化,或是研發IVR, 系統開發者來說, 都是有參考價值的. 
如果是奉命開發系統, 那在系統開發前, 拿著語音腳本和系統分析文件去"送審", 就會少走一點冤枉路, 少作白工; 如果是作自己開心的, 那也是可以幫助自己思考的.尤其是像我這種沒事就會恍惚,忘東忘西的人, 是絕對不可少的. ^^;

現在我都不再作這種東西了. 當初幫我作錄音的小姐, 如今也早被我 "逮捕歸案" 了, 所以... 

呵, 扯遠了. 

asterisk有很多有趣的東西和很讓人很煩惱的地方. 改天有空再分享今年我去馬來西亞參加asterisk conference的經驗

Sam 

2008/12/5 A.Lang, Hsu - ITBLOG.ITVIEW.COM.TW <alan...@gmail.com>
Reply all
Reply to author
Forward
0 new messages