안녕하세요.
Mecab-ko를 이용하여 parse중 특정 단어가 생각한 품사와 다르게 나와 글을 적습니다.
몇가지 상황에 대해 실행한 결과를 같이 적어 봤습니다.
"연하는" 이란 단어가 문장의 위치에 따라 품사에 영향을 주는걸로 나옵니다.
======== 실행환경
- Windows 7
- anaconda 4.5.1
- python 3.6.5
- 윤원섭님의 패키지를 사용하였습니다.
mecab-ko-msvc: https://github.com/Pusnow/mecab-ko-msvc
mecab-ko-dic-msvc: https://github.com/Pusnow/mecab-ko-dic-msvc
mecab-python-msvc: https://github.com/Pusnow/mecab-python-msvc
======= 파이썬 소스
# -*- coding: utf-8 -*-
import MeCab
import sys
import string
# 연하 : 나이가 아린 사람
sentence = "연하는 피곤해. 가수 윤하는 일본에서 활동을 했다."
t = MeCab.Tagger()
print(t.parse(sentence))
연 NNG,*,T,연,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
피곤 NNG,*,T,피곤,*,*,*,*
해 XSV+EF,*,F,해,Inflect,XSV,EF,하/XSV/*+ㅕ/EF/*
. SF,*,*,*,*,*,*,*
가수 NNG,*,F,가수,*,*,*,*
윤 NNG,*,T,윤,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
일본 NNP,지명,T,일본,*,*,*,*
에서 JKB,*,F,에서,*,*,*,*
활동 NNG,*,T,활동,*,*,*,*
을 JKO,*,T,을,*,*,*,*
했 VV+EP,*,T,했,Inflect,VV,EP,하/VV/*+았/EP/*
다 EF,*,F,다,*,*,*,*
. SF,*,*,*,*,*,*,*
EOS
sentence = "연하는 윤하는 운하는"
연 NNG,*,T,연,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
윤 NNG,*,T,윤,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
운하 NNG,*,F,운하,*,*,*,*
는 JX,*,T,는,*,*,*,*
EOS
sentence = "윤하는 연하는 운하는"
윤 NNG,*,T,윤,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
연 NNG,*,T,연,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
운하 NNG,*,F,운하,*,*,*,*
는 JX,*,T,는,*,*,*,*
EOS
sentence = "운하는 윤하는 연하는"
운 NNG,*,T,운,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
윤 NNG,*,T,윤,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
연하 NNG,*,F,연하,*,*,*,*
는 JX,*,T,는,*,*,*,*
EOS
sentence = "연하는 운하는 윤하는"
연 NNG,*,T,연,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
운 NNG,*,T,운,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
윤 NNG,*,T,윤,*,*,*,*
하 XSV,*,F,하,*,*,*,*
는 ETM,*,T,는,*,*,*,*
EOS