사용자 사전 추가

638 views
Skip to first unread message

abssss

unread,
Sep 28, 2016, 3:25:59 AM9/28/16
to 은전한닢 프로젝트
기존에 정의된 단어를 추가할 경우 기존의 사전과 사용자 사전 둘중 어떤 곳의 정보가 표시 되나요??
사용자사전을 정의된 단어를 우선적으로 선택하도록 할 수 있는 방법이 있나요??

항상 감사합니다. 

유영호

unread,
Sep 28, 2016, 3:56:36 AM9/28/16
to 은전한닢 프로젝트
네, 단어비용이 적은쪽을 선택하게 됩니다. 사전 추가시 단어비용을 명시할수있습니다.
사용하시는 패키지가 어떤건가요? seunjeon-elasticsearch 을 말씀하시는건가요?

swsw

unread,
Sep 28, 2016, 8:41:24 PM9/28/16
to 은전한닢 프로젝트
mecab-ko-dic에서 사용자 사전을 추가했습니다.
사용자 사전을 추가할때 단어 비용을 500으로 입력하여 사전 컴파일 하였습니다.
하지만 컴파일 후에 user-place.csv 파일을 보니 단어비용이 3150으로 작성돼 있던데..
제가 잘못된 방법으로 사전을 추가한건가요??
단어비용을 낮추는 방법을 알려주세요

감사합니다.

유영호

unread,
Sep 28, 2016, 8:53:18 PM9/28/16
to 은전한닢 프로젝트
아마 올바르게 하신것같아요.
두단계로 생각하시면 될것같구요.
1단계가 사전생성, 2단계가 사전 컴파일. 이렇게 두단계로 하셨을것같은데 1단계와 2단계 사이에서 임의로 비용 조정을 하시고 컴파일을 해보세요. 1단계에서 비용을 자동으로 채워줘버려서 그 전에 한게 의미가 없어져요.
조금 불편하긴합니다..
잘 이해가 안된다면 다시 말씀주세요.

swsw

unread,
Sep 28, 2016, 9:57:03 PM9/28/16
to 은전한닢 프로젝트
제가 했던 과정은
1. user-dic 폴더에 place.csv파일 작성(단어비용을 500으로 입력하였습니다.)
2. mecab-ko-dic/tools/add-userdic.sh
3.make install

이렇게 하였는데 임의로 비용을 조정하려면 어떤 파일의 값을 바꿔야 하는건가요?

2번 이후에 user-place.csv 자동생성된 값을 다시 500으로 조정하고
3번으로 했는데 아직 단어비용이 조정되지는 않는것 같습니다.

친절한 답변 정말 감사합니다.   

유영호

unread,
Sep 28, 2016, 10:07:56 PM9/28/16
to 은전한닢 프로젝트
진행하신 과정이 제가 이야기한 과정이 맞습니다.
아마 적용은 되었을것같습니다.
그래도 단어가 나오지 않는다면 비용을 더 낮춰봐야할것같습니다.
/mecab-ko-dic/tools/mecab-bestn.sh 로 문장을 분석해보시면 원인을 파악하는데 도움이 될것같습니다.

swsw

unread,
Sep 28, 2016, 11:04:40 PM9/28/16
to 은전한닢 프로젝트
그냥 make install을 하면 반영이 안되는거 같습니다.
make clean; make install 을 하였더니 단어비용이 수정되었습니다.
감사합니다. 

유영호

unread,
Sep 29, 2016, 12:55:20 AM9/29/16
to 은전한닢 프로젝트
make install은 컴파일이 아니고 설치만 하는 명령어니까. 컴파일 과정이 빠져있었네요.

make clean 후 make install 하면 컴파일을 하나보군요!!

어쨋든 해결되서 다행입니다.
Reply all
Reply to author
Forward
0 new messages