안녕하세요 mecab 형태소 분석기 사용 중 사용자 사전 추가에 궁금한점이 있어 질문 드립니다.
사용자 사전 추가 시, 공백이 있는 복합명사같은 경우 그냥 띄어쓰기가 들어간 채로 사전에 추가해도 문제가 없는 지 문의 드립니다.
예를 들어 "뷰티풀 코란도" 라는 복합명사가 있다고 할 때, 보통은 뷰티풀코란도 < 이렇게 붙여쓰지않고 뷰티풀 코란도 << 이렇게 띄어쓰는게 일반적인데요,
사용자 사전을 아래처럼 추가해봤습니다.
뷰티풀코란도,,,,NNG,*,F,뷰티풀코란도,Compound,*,*,뷰티풀/NNG/*+코란도/NNG/*
이렇게 추가하니 "뷰티풀코란도" 처럼 붙여서 나오는건 제대로 잘라주는데 "뷰티풀 코란도" 이렇게 쓰면 뷰티풀/코란도 이렇게 잘라주더라구요..
그래서 추가로
뷰티풀 코란도,,,,NNG,*,F,뷰티풀코란도,*,*,*,*,*
이렇게 추가해보니 "뷰티풀 코란도" 로 잘라주는 걸 확인 할 수 있었는데요
이런식으로 사용자 사전에 추가해서 사용해도 형태소분석에 문제가 없을 지 문의드립니다.
검색용으로는 안쓸거고 오로지 형태소 분석에만 사용할 계획입니다.