안녕하십니까, Lucas Jo 선생님.
스크립트에 단어가 많다는건 음성도 그 부분이 많다는건지요?
기계에 같은 단어이지만 다양한 형태의 음성을 많이 들려 주면 잘 인식 할것 같습니다
상담원이 안녕하세요 하는거랑
낭독체로 안녕하세요 하는거랑 완전 다르잖아요?
딱히 비교는 해보지 않았는데 기계에 강조하고자 하는 음성을
다양하게 많이 넣으면 그만큼 열심히 학습하여
잘 인식 할것 같다고 추측 해봅니다
저도 그런 방법으로 잘 될지 매우 궁금하네요^^
경험으로는 해당 bm으로 학습 시키고 해당 bm과 유사한 음성이 들어오면 잘
되는데 전혀 분야가 다른 bm의 음성이 들어오면 인식율은
현저히 떨어지는것은 사실인 듯 합니다
음향모델이 기계에 인간의 언어의 말하는 특징을 학습 시키는거니까
참고로 강조하려는 단어는 꼭 발음사전 및 언어모델에 포함되어 있겠지요?
저도 특정단어가 잘 디코딩되게 언어모델에 숫자값을 임의로 높게 변경 해볼까 싶었는데 그러한 시도는 하지 않아도 잘 인식이 되어
무모한 방법은 사용하지는 않았네요
안녕하십니까, Lucas Jo 선생님.