말씀하신대로 저희가 학습에 사용한 의미부류는 두가지(인명, 지명)입니다.
사전에 의미부류를 추가해서 분석에 사용할 수 있을 것 같긴합니다. 하지만 분석 자체에 영향을 주는 방식이 아니라 동음이의어를 구분해 내지는 못합니다.
배(음식), 배(탈것), 배(동물)와 같은 경우 이 세가지를 분류가 불가능합니다. 이러한 케이스가 문제가 안된다면 사전에 추가해서 분석하는 것을 추천드립니다. 또는 분석 후 후처리로 의미부류를 부여해도 좋을 것 같습니다.
다음 방법으로 mecab 학습을 다시 하는 방법이 있습니다. 말뭉치에 의미부류를 넣은체로 학습을 한다면 동음이의어에 대해서 분류를 해줄 가능성이 있습니다. 하지만 그러한 말뭉치는 없고, 다시 만드는 것은 기술이 아닌 노동인지라 단시간에는 불가능해 보입니다.
여기까지가 저의 생각인데.. 다른 방법이 있을까요?