SPRWと申します。
その後、自分自身ではいろいろと考えまして「難聴状態で聴きやすい
音声の作成」に取り組んでみることにしました。
難聴の方が音声を聴く時の代表的な状況としては
1)無声子音(「k」「s」「t」「p」など)が聴きとりにくい
2)騒音がある状況で全体として聴きとりにくい
3)反響のある状況で全体として聴きとりにくい
4)小さい音は聴きづらいが、同時に大きい音はうるさく聴こえる
などがあります。
他方で「声紋」を計算する際に前投稿に記載した「局所的位相シフト検出法」
を用いたところ、
5)無声子音(「k」「s」「t」「p」など)が「声紋」上に
高周波成分を含めて従来より明確に表れる。
6)母音などの有声音(声帯が音源+共鳴官としての声道と
口腔の形状で決まる伝達特性)は、「声紋」上で周波数
ピークが鋭くなり、周波数方向の弁別が良くなる。また
音素としての時間方向の弁別が良くなる。乱反射があると
周波数ピークが太ることは知られてるが上記はその逆。
7)「局所的位相シフト検出法」を用いて「声紋」を計算する
際に、実は「表示」用の明示的な対数変換は行っていない
(フーリエ変換を用いて行う普通の「声紋」計算では表示
する際に対数変換を行う)。
「局所的位相シフト検出法」を作用させると自然に対数
変換"様"の効果が加わっている可能性がある
などの特徴が得られてます。そこで「局所的位相シフト検出法」
を作用させて「声紋」を計算するのではなく、「音声」として
出力して聴いてみることにした次第です。
<<
http://local-phase.com/others/etc/Nanchou-Listen-20180115-sonobekazuo.pdf >>
今後のことはまだ詳しく定まっていませんが、機会がありましたら
ご鞭撻のほど何卒よろしくお願い申し上げます。