여러가지 질문

145 views
Skip to first unread message

Damir Usmanov

unread,
Mar 4, 2021, 12:51:01 PM3/4/21
to zeroth-help
안녕하세요. Lucas Jo 선생님.

여러가지 질문 있어 올립니다.

1) 음성자료의 녹음속도는 천천히 또박또박입니까 아니면 일상대화속도도 괜찮습니까?
2) 한개 녹음파일이 30초 정도 길면 안됩니까?
3) 한개 녹음파일에 두개 문장을 녹음해도 엔진성능에 어떤 영향을 줍니까?
즉 [설날을 축하합니다] [ 복많이 받으세요] 이렇게 두개 파일로 녹음하는 경우와
[설날을 축하합니다. 복많이 받으세요] 이렇게 한개 파일로 녹음하는 경우 어떤 영향이 있을수 있습니까?
4) 말뭉치에 음성본문자료도 포함시켜야 합니까?
말뭉치에 혹은 음성본문자료에 없는 단어도 인식을 잘 합니까?
말뭉치에 같은 단어를 반복하여 넣으면 인식이 잘 됩니까?
5) GPU 성능과 학습자료규모에 따르는 학습시간에 대해 경험적으로 얘기해 주십시오.
말뭉치의 크기도 학습시간에 영향을 줍니까?
zeroth의 공개된 음향모델, 언어모델을 훈련하는데 몇시간 정도 걸렸습니까?

Lucas Jo

unread,
Jul 22, 2021, 8:05:15 PM7/22/21
to zeroth-help
1) 음성자료의 녹음속도는 천천히 또박또박입니까 아니면 일상대화속도도 괜찮습니까? 

인식하려는 실제 어플리케이션과 같아야합니다.

2) 한개 녹음파일이 30초 정도 길면 안됩니까?

30초에서 60초 정도가 적당합니다. 

3) 한개 녹음파일에 두개 문장을 녹음해도 엔진성능에 어떤 영향을 줍니까?
즉 [설날을 축하합니다] [ 복많이 받으세요] 이렇게 두개 파일로 녹음하는 경우와
[설날을 축하합니다. 복많이 받으세요] 이렇게 한개 파일로 녹음하는 경우 어떤 영향이 있을수 있습니까?

2번처럼 너무 길지 않다면 텍스트가 충실하다는 전제하에 문제없습니다.

4) 말뭉치에 음성본문자료도 포함시켜야 합니까?
말뭉치에 혹은 음성본문자료에 없는 단어도 인식을 잘 합니까?
말뭉치에 같은 단어를 반복하여 넣으면 인식이 잘 됩니까?

말뭉치는 오디오/텍스트 음향모델 학습데이터와 상관이 없습니다. 
단순 반복이 성능을 좋게하지는 않습니다.

5) GPU 성능과 학습자료규모에 따르는 학습시간에 대해 경험적으로 얘기해 주십시오.
말뭉치의 크기도 학습시간에 영향을 줍니까?
zeroth의 공개된 음향모델, 언어모델을 훈련하는데 몇시간 정도 걸렸습니까?

50시간 데이터는 6 배 data augmentation 을 진행하면  GPU 1080 두 개를  기준으로  3~4 시간이면 끝납니다.



2021년 3월 5일 금요일 오전 2시 51분 1초 UTC+9에 bwall...@gmail.com님이 작성:
Reply all
Reply to author
Forward
0 new messages