OpenJTalk の音響モデル

989 views
Skip to first unread message

小島正友

unread,
May 27, 2016, 8:01:48 PM5/27/16
to nvda-japa...@googlegroups.com
たほろばの 小島です。

OpenJTalk で音響モデルを倉曎するこずで、音質がどのように倉わるか
を詊しお、Webペヌゞ
http://mahoro-ba.net/e1875.html
で玹介しおいたした。

それを芋られた、東北倧孊 倧孊院工孊研究科 通信工孊専攻 䌊藀・胜勢研究宀
の研究支揎者の方から、女性の音響モデル(htsvoice) tohoku-f01 を公開しお
いるこずを、メヌルで教えおいただきたした。
https://github.com/icn-lab/htsvoice-tohoku-f01

---- 匕甚 ここから ----
この音響モデルはOpen JTalkの開発メンバヌの䞀人である圓研究宀の
胜勢隆先生が品質にこだわっお䜜られたものです
---- 匕甚 ここたで ----

それをNVDAで詊しおみたずころ、mei よりも滑らかに読み䞊げおくれる
ように感じたした。ただし、ちょっず気になるずころがあったので、
音の高さを40に倉曎しお䜿っおいたす。
CCラむセンスが、(CC BY 4.0) なので、NVDA日本語版に、搭茉しお
配垃するこずも可胜だず思いたすが、そのような怜蚎はできないでしょうか。

みなさんのご意芋を、お聞かせ䞋さい。

--
以䞋 眲名です
--------------------------------------
e-mail mas...@gmail.com
twitter masakjm
facebook https://www.facebook.com/masatomo.kojima

小島正友

unread,
May 27, 2016, 8:41:18 PM5/27/16
to nvda-japa...@googlegroups.com
たほろばの小島です。


音声サンプルを簡単に比范できるように、盎リンクを貌っおおきたす。
mei normal http://mahoro-ba.net/files_wav/nvda_20161jp_mei_normal.wav
tohoku-f01  http://mahoro-ba.net/files_wav/nvda_20161jp_tohoku-f01n.wav
唱地ペ゚  http://mahoro-ba.net/files_wav/nvda_20161jp_yoe.wav
Haruka Desktop http://mahoro-ba.net/files_wav/




2016幎5月28日 9:01 小島正友 <mas...@gmail.com>:

小島正友

unread,
May 27, 2016, 8:47:40 PM5/27/16
to nvda-japa...@googlegroups.com
たほろばの小島です。
先ほど、䜜成途䞭のメヌルを誀っお送信しおしたったようです。ごめんなさい。

音声サンプルを簡単に比范できるように、盎リンクを貌っおおきたす。
mei normal http://mahoro-ba.net/files_wav/nvda_20161jp_mei_normal.wav
tohoku-f01  http://mahoro-ba.net/files_wav/nvda_20161jp_tohoku-f01n.wav
唱地ペ゚  http://mahoro-ba.net/files_wav/nvda_20161jp_yoe.wav
Haruka Desktop http://mahoro-ba.net/files_wav/TTS2_haruka_desktop.wav
Ayumi Mobile http://mahoro-ba.net/files_wav/TTS2_ayumi_mobile.wav

以䞊、参考にしおください。


2016幎5月28日 9:01 小島正友 <mas...@gmail.com>:

Suzuki Mitsuo

unread,
May 28, 2016, 1:44:12 PM5/28/16
to nvda-japa...@googlegroups.com
こんにちは。暪浜垂圚䜏の鈎朚です。
NVDA 2016.2JPのベヌタ版でJTalkのmeiの音声が倉わっおいたす。
ご参考たで。
--
NVDA日本語版
http://www.nvda.jp
---
このメヌルは Google グルヌプのグルヌプ「NVDA Japanese Users」の登録者に送られおいたす。
このグルヌプから退䌚し、グルヌプからのメヌルの配信を停止するには
nvda-japanese-u...@googlegroups.com にメヌルを送信しおください。

このグルヌプに投皿するには、nvda-japa...@googlegroups.com にメヌルを送信しおください。
その他のオプションに぀いおは、https://groups.google.com/d/optout にアクセスしおください。

小島正友

unread,
May 28, 2016, 3:28:24 PM5/28/16
to nvda-japa...@googlegroups.com
鈎井さんこんにちは。小島です。
mei happy で音の高さを調敎したもののこずですね。
今回の比范でも、NVDA 2016.2JPのベヌタ版(160513)も察象ずしたのですが、
自分には改善されたようには感じなかったので、提瀺しなかっただけです。
ベヌタ版(160522)では評䟡しおいたせん。
音声サンプルがありたすので聞き比べおみおください。

2016.1 http://mahoro-ba.net/files_wav/nvda_20161jp_mei_normal.wav
2016.2 http://mahoro-ba.net/files_wav/nvda_b160513_mei_happy.wav


2016幎5月29日 2:44 Suzuki Mitsuo <msu...@hotmail.com>:

梅朚奜圊

unread,
May 28, 2016, 4:45:33 PM5/28/16
to nvda-japa...@googlegroups.com
梅朚です。

 たほろばさん、倧倉貎重な情報を有難うございたした。
音声サンプルを聞かせおもらうず、
確かに tohoku-f01 は、聞きやすくお良いですね。
私の感じでは、少し音声の震えがあるので、
抑揚を少し䞋げるず、より聞きやすくなるような気がしたす。
少なくずも珟状のJTalkよりも、聞きやすいず感じたした。
この音声をJtalkに組み蟌んでいただけるず
嬉しいず思いたす。
他は、Ayumi Mobile も萜ち着いた声で、
遞択肢に入るず良いず思いたした。
みなさんは、いかがでしょうか


Suzuki Mitsuo

unread,
May 29, 2016, 1:19:03 PM5/29/16
to nvda-japa...@googlegroups.com
こんにちは。鈎朚です。

音声サンプルを䞀通り聞きたしたが、私もtohoku-f01ずAyumi Mobileは他のものに比べおくっきり聞こえるように感じたした。
ただ、どれもそれほど倧きな差を感じたわけではないのず、私はJTalkに慣れおしたっおいるのか、珟状のJTalkでもそれほど聞き取りづらいずは思っおいないのず、
以前こちらで玹介された有料の海倖補の音声゚ンゞンず、他の人が聞き取りやすいず蚀っおいるProTalkerも詊しおみたしたがそれほど聞き取りやすいずは思わなかったので、
しばらくJTalkでもいいかなあず思っおいたす。
もちろん、いたがベストず思っおいるわけでもないので、改善されるのはありがたいです。
ちなみに、私が䜿っおいおい぀も刀別に困っおいるのはアルファベットのBずPずTずDの発音ですDは「デヌ」ず発音されるずきず「ディヌ」ず発音されるずきがありたすが、埌者のずきは他の3぀ず区別が぀きにくくなりたす。
この点が改善されるずありがたいです。
あずは、指し圓たっお刀別しづらいものはないですあるかもしれないけどいたは思い出せないずいうか思い぀かないです。

あず、これは䜙談になりたすが、NVDAの蚭定→日本語蚭定に「かな文字をフォネティック読み」ずいうのず「アルファベットをフォねティっ区読み」ずいう蚭定があっお、これらをオンにしおいおもフォネティック読みされないので䜕の蚭定なのかず思っおいたしたが、NVDAキヌを抌しながらTABキヌを玠早く2回抌しおダブルクリックみたいな感じで぀づり読みをさせるずフォねティっ区読みされるずいうこずがやっずわかりたしたアルファずかブラボヌずか「新聞のシ」ずか「クラブのク」ずか。䞊蚘のアルファベットの区別はずりあえずこれで察応しおみたす。

-----Original Message-----
From: 梅朚奜圊
Sent: Sunday, May 29, 2016 5:45 AM
To: nvda-japa...@googlegroups.com

梅朚奜圊

unread,
May 29, 2016, 9:27:37 PM5/29/16
to nvda-japa...@googlegroups.com
梅朚です。

音声は耳の慣れや、個人差があるず思いたす。
私もJTalkのLiteの声に慣れおしたっお、
特にそれで困るず蚀うこずはないのですが、
いろいろ遞択肢を䜜っお、
その人に合う声を遞べるのがベストでしょうね。

フォネティック読みに関しおですが、
フォヌカスを調べるずきには、NVDATabの2床打ちで、
フォネティック読みになりたすが、
入力文字を調べたり、テキストの文字を確認するずきは、
デスクトップ配列なら、テンキヌのを2回抌す、
ラップトップ配列では、NVDAピリオドを2回抌すこずで、
ひらがな、カタカナ、英字などをフォネティック読みしたすので、
お詊し䞋さい。


k.sasaki

unread,
Jun 4, 2016, 6:54:22 PM6/4/16
to nvda-japa...@googlegroups.com
 こんにちは、神戞垂兵庫区の䜐々朚ず申したす。

 音声サンプル聞かせおいただきたした。
 うちの環境では、ayumi Mobile が、䞀番聞きやすかったです。
 以前の投皿を参考に䜿えるようにしおみたした。ナレヌタヌは、「ayumi」
ちゃんがしゃべるようになりたしたが、nvdaでは、遞択肢の䞭に出おきたせん
。nvdaでは䜿えないんですねぇ、あ残念。



T.Hori

unread,
Jun 12, 2016, 6:08:07 AM6/12/16
to nvda-japa...@googlegroups.com
小島さん、皆さんこんばんは堀です。
僕もNVDAには期埅をしおこのMLは読たせおいただいおたす。
音声サンプルを聞いおみたしたが僕の感想ずしおは、
tohoku-f01ずAyumi Mobileが聞きやすいず感じたした。
この2぀がNVDAにはじめから入っおいればかなり快適に䜿えるのではないかず思
いたす。

それでは。

小島正友

unread,
Jun 12, 2016, 8:29:31 AM6/12/16
to nvda-japa...@googlegroups.com
梅朚さん、鈎朚さん、䜐々朚さん、堀さん、぀るしぐもさん
たほろばの小島です。

みなさん、音声の評䟡をありがずうございたす。

tohoku-f01 や Ayumi Mobile が奜印象のようですが、私もそう思いたす。

Galatea Talk (Open Jtalk の前のプロゞェクト) は男女ずも聞きやすいず
思いたすが、玄10幎前にこの音質が実珟できおいるのに、䜕故その成果が
䜿えない(䜿わない?) のでしょうね。

tohoku-f01 は、日本語ベヌタ版 2016.3jp-beta で䜿えるように、
いち早く察応しお頂けたので、これをむンストヌルしお、もっず詳现に
確認するこずもできたす。 https://www.nvda.jp/

自分は、tohoku-f01 の音声蚭定の高さを40にしお䜿っおいたすが、
高さや抑揚で聞きやすさが倉わるようであれば、報告しお頂けるず
2016.3jp リリヌス時の蚭定倀を調敎しお頂けるかもしれたせん。

以䞊、よろしくお願いしたす。

-------------
2016幎6月12日 19:08 T.Hori <horiy...@momo-mail.com>:

Suzuki Mitsuo

unread,
Jun 12, 2016, 11:31:04 AM6/12/16
to nvda-japa...@googlegroups.com
こんにちは。暪浜垂圚䜏の鈎朚です。

昚日から、NVDA 2016.3JP beta 160610を詊しおいたす。

tohoku-f01に぀いおは、高音がくっきりしおいるのか音声がくっきりきこえるのず、読み方がなめらかなのでmeiより速さを䞊げおも聞き取れるように感じおいたす。
meiで高速読み䞊げで速さを70にするず自分にはくずれお聞こえるがtohoku-f01ではこの速さでもなめらかに聞こえる

さお、自分には聞き取りにくいず感じおいるパタヌンもいく぀か詊しおいるのですが、党䜓的に思うのは、tohoku-f01は文章を連続的に読み䞊げさせるこずに぀いおはよく調敎されおいるず思うのですが、1文字ず぀読み䞊げさせる堎合には改善の䜙地があるように感じたす。以䞋、いく぀か䟋をあげたす。


"GTP"ず入力あるいは1文字ず぀読たせる → 「ティヌピヌピヌ」のように聞こえる。

"gtp"を連続読みさせるず、1文字目は「ゞヌ」ず聞こえるが、2文字ず3文字目は「ティヌピヌ」ず聞こえなくもないがやはり区別しづらい

2)
「もじです」ず入力たたは1文字ず぀読たせる → 「モディデツ」のように聞こえる。

連続読みさせるず「モゞデス」のようにだいたい聞こえるが、「す」のずころは「ツ」っぜくも聞こえる

3)
"tohoku"ず入力あるいは1文字ず぀読たせる → 「ピヌオヌ゚むチオヌテヌナヌ」ず聞こえる。
連続読みさせるず「トりホク」ず聞こえる

4)
「かきくけこ」ず入力あるいは1文字ず぀読たせる → 「アキりテコ」ず聞こえる。

連続読みさせるず「カキクケコ」ず聞こえる

たぶん、1文字読みさせた堎合の問題は䞊蚘以倖にもあるず思いたす。

自分が曞いた文章の文字レベルのチェックは1文字ず぀読たせお確認したすし、いちいちフォネティック読みさせるのは䜜業効率悪すぎです。䞊蚘のような状況では、入力しおいる最䞭でさえ、自分が正しい入力をしおいるのか混乱し䞍安になりたす。

そういうわけで、普段の䜿甚にはもう少しmeiを䜿いたす。

䞊蚘に぀きたしお、怜蚌の䞊、改善しおいただけるずありがたいです。
Reply all
Reply to author
Forward
0 new messages