안녕하세요. zeroth및 help포럼 도움받아 설치,학습 gstreamer 테스트까지 완료했습니다. 감사합니다.
인식률이 좋지 않아 이제부터 시작이구나 해서 전투력 상승중에 있습니다.
우선 kspon 데이터를 추가 학습시키는 방법부터 해보려고 합니다.
기존 음성데이터의 차이를 보니 kspon은 wav파일+txt파일 한쌍, zeroth는 falc파일+ 해당폴더 txt파일하나에 전부
이 차이더라구요.
그래서 다음과 같은 과정을 거치려고 합니다.
1. 자동 컨버터를 만들어서 zeroth에 맞는형태를 구축한다. ( ffmpeg로 wav -> flac 자동변환 , 하나의 txt파일로 뽑는 기능 )
2. zeroth_korean.tar.gz 파일로 다시 합친다.
3. 학습시킨다.
질문입니다.
1. zeroth_korean.tar.gz 풀면 나오는 저 파일들중 AUDIO_INFO정도는 자동생성을 할순 있을거 같은데 나머지 파일들 무시하고 학습 진행해도 괜찮을까요?(AUDIO_INFO도 맞춰줘야 하나요?)
2. 위 2번 zeroth_korean.tar.gz 파일로 굳이 merge 안하고 kspon데이터만 묶은압축 파일로 추가해도 되는지. -> 추후 추가되는 음성데이터 확장성.
3. zeroth데이터 학습후 kspon데이터 학습을 추가로 하는 방법이 있을까요? ->이 부분은 죄송합니다. 충분히 더 파보고 물어봐야 하는데 당장 11월말까지 동작해야 하는 작업을 혼자 하고 있습니다. ㅠ.ㅠ
이상입니다.