whisperについて

9 views
Skip to first unread message

TP

unread,
Nov 8, 2024, 2:45:04 AM11/8/24
to ita-dtc-th...@googlegroups.com
whisperの音声認識ってかなり時間がかかる印象を持ってますが、工夫されたポイントはありますか

桑田 健佑

unread,
Nov 8, 2024, 3:07:38 AM11/8/24
to ita-dtc-th...@googlegroups.com
テキストの文字起こしにはWhisperをそのまま使用すると時間がかかるため、軽量バージョンのfaster_whisperというモデルを使用いたしました。
また、高速化の為に使用するモデルのサイズをsmallとしております。
こちらの設定で、10秒程度の音声であれば文字起こし完了まで1秒程度まで高速化できました。
認識精度は下がりますが、日常会話の文字起こしには必要十分であると考えています。
Reply all
Reply to author
Forward
0 new messages