Awsome TTSを使ったAzureの音声変換について

232 views
Skip to first unread message

tetsusi11

unread,
Oct 30, 2022, 5:15:27 PM10/30/22
to AnkiDroid日本
Awesome TTSの音声変換機能を使って、Azureにて作成したデッキの漢字入りのフィールドを音声変換しました。しかし、”意見”を”い”と発音するなど、完全に変換してくれません。 そこで、調べたところ、フィードにある意見を消し、意見と打ち直して変換した結果、”いけん”とちゃんと変換してくれました。 何故なのかわからないのですが、 今やっている作業としては、 1.すでに英語⇨日本語にしてあるデッキをMacに書き出し 2.それをノート形式で読み込み、新しいデッキとして登録 3.音声変換 これをやると、フィールド中の”意見”を”い”と発音するなど、完全に変換してくれません。 しかし、その後、フィードにある意見を消し。意見と打ち直して変換した結果、”いけん”とちゃんと変換してくれます。 ただ、消して打ち直しは膨大な時間がかかるため、それは避けたいところです。 上記1−3のようなやり方で一括音声変換だとうまく変換できないのでしょうか? 音声変換エラーがないように一括変換できる方法をご存知であれば、教えてほしいです。 ※なお、上手く変換できていないmp3ファイルもパソコン内にあるファイルを探し、確認しました。再生してみましたが、やはり上手く変換されていませんでした。 よろしくお願いします。

snowtimeglass

unread,
Nov 1, 2022, 12:00:34 PM11/1/22
to ankidro...@googlegroups.com
こんにちは。
打ち直し前のデータが入ったデッキ(音声ファイル付き)のサンプルと、打ち直し後のデータが入ったデッキ(音声ファイル付き)のサンプルを送っていただいてもよろしいでしょうか。

2022年10月31日(月) 6:15 tetsusi11 <tett...@gmail.com>:
Awesome TTSの音声変換機能を使って、Azureにて作成したデッキの漢字入りのフィールドを音声変換しました。しかし、”意見”を”い”と発音するなど、完全に変換してくれません。 そこで、調べたところ、フィードにある意見を消し、意見と打ち直して変換した結果、”いけん”とちゃんと変換してくれました。 何故なのかわからないのですが、 今やっている作業としては、 1.すでに英語⇨日本語にしてあるデッキをMacに書き出し 2.それをノート形式で読み込み、新しいデッキとして登録 3.音声変換 これをやると、フィールド中の”意見”を”い”と発音するなど、完全に変換してくれません。 しかし、その後、フィードにある意見を消し。意見と打ち直して変換した結果、”いけん”とちゃんと変換してくれます。 ただ、消して打ち直しは膨大な時間がかかるため、それは避けたいところです。 上記1−3のようなやり方で一括音声変換だとうまく変換できないのでしょうか? 音声変換エラーがないように一括変換できる方法をご存知であれば、教えてほしいです。 ※なお、上手く変換できていないmp3ファイルもパソコン内にあるファイルを探し、確認しました。再生してみましたが、やはり上手く変換されていませんでした。 よろしくお願いします。

--
このメールは Google グループのグループ「AnkiDroid日本」に登録しているユーザーに送られています。
このグループから退会し、グループからのメールの配信を停止するには ankidroid-nih...@googlegroups.com にメールを送信してください。
このディスカッションをウェブ上で閲覧するには https://groups.google.com/d/msgid/ankidroid-nihon/fc98de4d-9b54-49c3-ab62-d9cacd092a74n%40googlegroups.com にアクセスしてください。

tetsusi11

unread,
Nov 1, 2022, 1:20:44 PM11/1/22
to AnkiDroid日本
お世話になります。
ご連絡ありがとうございます。

ある文の中で使われている”自動詞”という漢字の変換前(うまく変換できない)と変換後(うまく変換できた)をお送りします。

よろしくお願いします。

”自動詞”がうまく変換できない.mp3
”自動詞”がうまく変換できた.mp3

tetsusi11

unread,
Nov 2, 2022, 12:23:17 AM11/2/22
to AnkiDroid日本
すみません。今気づきました。

音声付きのデッキと音声とを取り違えました。

形式は、ankiデッキパッケージapkg形式に変えて送り直します。

もう少々お待ちください。

よろしくお願い申し上げます。

tetsusi11

unread,
Nov 2, 2022, 12:41:34 AM11/2/22
to AnkiDroid日本
”自動詞”を打ち直す前後のデッキデータになります。

よろしくお願いします。

打ち直し後.apkg
打ち直し前.apkg

snowtimeglass

unread,
Nov 3, 2022, 6:55:15 AM11/3/22
to ankidro...@googlegroups.com
お返事ありがとうございます。

「Sound(Front)」フィールドの内容について一点確認させてください。

「打ち直し後」デッキにおいては、「Sound(Front)」フィールドに

[sound:azuretts-4bfca970-72d1437e-483d28bc-4d701af5-830a2c6e.mp3]

という、AzureのTTSで作成したと思われるファイル名が記入されているのに対し、
「打ち直し前」デッキにおいては、「Sound(Front)」フィールドに

[sound:googletts-46bf7ba7-289689d9-c4a33742-667bf709-7b035dbc.mp3]

という、GoogleのTTSで作成したと思われるファイル名が記入されているようです。
実際の中身の声のキャラクターも上記の 「打ち直し後」  デッキのものとは別で、
一方「自動詞」の発音については「打ち直し前」でも正常に行われているのではないかと思います。

「打ち直し前」デッキの内容は、不具合のサンプルとして、これで合っておりますか。

2022年11月2日(水) 13:41 tetsusi11 <tett...@gmail.com>:
このディスカッションをウェブ上で閲覧するには https://groups.google.com/d/msgid/ankidroid-nihon/3b000c67-67a1-4653-bcb7-7a01ba1b3ed0n%40googlegroups.com にアクセスしてください。

tetsusi11

unread,
Nov 3, 2022, 7:15:08 AM11/3/22
to AnkiDroid日本
大変失礼いたしました。

焦って、違うものを送ってしまいました。

改めて送ります。

送る前に確認していますので、このファイルで間違いないはずです。

お手数お掛けして申し訳ありません。

よろしくお願いします。

打ち直し前.apkg
打ち直し後.apkg

snowtimeglass

unread,
Nov 7, 2022, 11:12:21 AM11/7/22
to ankidro...@googlegroups.com
デッキありがとうございます。不具合を確認しました。

打ち直し前の文字列と打ち直し後の文字列を比較したところ、
打ち直し前の「自」と打ち直し後の「自」は文字コードが異なっていました。
image.png

つまり、打ち直し前の「⾃」は、打ち直し後の「自」に酷似した別の文字です。この場面においては誤字だと言えます。
下図の「メモ帳」のように、MSゴシックフォントで表示すると、「⾃」と「自」を視覚的に判別できます。
image.png
image.png

「⾒」という文字についても、同様のことが起きているものと推測されます。
(下図参照)
image.png
image.png
おそらく、打ち直し前の文字「自」「⾒」は、Azure側で音読対象とみなされていないのではないかと思います。そしてその結果、それらの文字が無視された状態でフィールド文字列の音声変換が行われたのではないでしょうか。

もしそうだとすれば、対策は「誤字を(なるべく効率のよい方法で)訂正しておく」ということになります。

今やっている作業としては、 1.すでに英語⇨日本語にしてあるデッキをMacに書き出し 2.それをノート形式で読み込み、新しいデッキとして登録 3.音声変換 (・・・)上記1−3のようなやり方で一括音声変換だとうまく変換できないのでしょうか? 音声変換エラーがないように一括変換できる方法をご存知であれば、教えてほしいです。

2の後に、次の手順で、問題となる文字の一括置換を行ってから3を実行すると、うまく音声変換できるのではないかと思います。

(1) Ankiの「検索」ウィンドウを開く
(2) サイドバーのリストで、そのデッキをクリック
(3) メニューの[ノート]→[検索して置換]
image.png
(4) 「検索文字列:」欄に、打ち直し前の文字(読み飛ばしが生じる文字)を入力
(5) 「置換文字列:」欄に、打ち直し後の文字を入力
(6) 「対象:」欄で、「Front」を選択(または「全てのフィールド」を選択)
(7) 「選択中のノートのみ」のチェックをはずす
(8)   [OK]


2022年11月3日(木) 20:15 tetsusi11 <tett...@gmail.com>:
このディスカッションをウェブ上で閲覧するには https://groups.google.com/d/msgid/ankidroid-nihon/a716ac6e-d620-4fd2-9fe3-a81143cf68f0n%40googlegroups.com にアクセスしてください。

tetsusi11

unread,
Nov 7, 2022, 12:14:49 PM11/7/22
to AnkiDroid日本
細かく見ていただいてありがとうございます。

早速試したところ、確かに症状は治りました。

そこで問題となるのが、文字コードが異なると思われる漢字が多いということです。
自以外にも門、手、言、非。。。あまりにありすぎて作業時間がハンパないです。

一括でそこを変換することはできないと思うので、Azureでの変換が望ましかった
のですが、大量の変換にはちょっと向いていないかなといった感じです。

詳細に分析、解決策までいただいたのに大変申し訳ない限りです。

一括で変換する問題が解消したら、Azureを使いたいと思います。

ありがとうございました。
Reply all
Reply to author
Forward
0 new messages