Mecab-ko parse시 특정 단어의 품사가 생각과 다르게 나오는 경우가 있어 질문드립니다.

555 views
Skip to first unread message

wlqgus...@gmail.com

unread,
May 9, 2018, 6:55:12 AM5/9/18
to 은전한닢 프로젝트
안녕하세요.

Mecab-ko를 이용하여 parse중 특정 단어가 생각한 품사와 다르게 나와 글을 적습니다.

몇가지 상황에 대해 실행한 결과를 같이 적어 봤습니다.

"연하는" 이란 단어가 문장의 위치에 따라 품사에 영향을 주는걸로 나옵니다.



======== 실행환경
- Windows 7
- anaconda 4.5.1
- python 3.6.5
- 윤원섭님의 패키지를 사용하였습니다.

mecab-ko-msvc: https://github.com/Pusnow/mecab-ko-msvc

mecab-ko-dic-msvc: https://github.com/Pusnow/mecab-ko-dic-msvc

mecab-python-msvc: https://github.com/Pusnow/mecab-python-msvc




======= 파이썬 소스
# -*- coding: utf-8 -*-

import MeCab
import sys
import string

# 연하 : 나이가 아린 사람
sentence = "연하는 피곤해. 가수 윤하는 일본에서 활동을 했다."

t = MeCab.Tagger()
print(t.parse(sentence))



연      NNG,*,T,연,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
피곤    NNG,*,T,피곤,*,*,*,*
해      XSV+EF,*,F,해,Inflect,XSV,EF,하/XSV/*+ㅕ/EF/*
.       SF,*,*,*,*,*,*,*
가수    NNG,*,F,가수,*,*,*,*
윤      NNG,*,T,윤,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
일본    NNP,지명,T,일본,*,*,*,*
에서    JKB,*,F,에서,*,*,*,*
활동    NNG,*,T,활동,*,*,*,*
을      JKO,*,T,을,*,*,*,*
했      VV+EP,*,T,했,Inflect,VV,EP,하/VV/*+았/EP/*
다      EF,*,F,다,*,*,*,*
.       SF,*,*,*,*,*,*,*
EOS



sentence = "연하는 윤하는 운하는"

연      NNG,*,T,연,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
윤      NNG,*,T,윤,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
운하    NNG,*,F,운하,*,*,*,*
는      JX,*,T,는,*,*,*,*
EOS




sentence = "윤하는 연하는 운하는"

윤      NNG,*,T,윤,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
연      NNG,*,T,연,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
운하    NNG,*,F,운하,*,*,*,*
는      JX,*,T,는,*,*,*,*
EOS




sentence = "운하는 윤하는 연하는"

운      NNG,*,T,운,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
윤      NNG,*,T,윤,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
연하    NNG,*,F,연하,*,*,*,*
는      JX,*,T,는,*,*,*,*
EOS



sentence = "연하는 운하는 윤하는"

연      NNG,*,T,연,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
운      NNG,*,T,운,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
윤      NNG,*,T,윤,*,*,*,*
하      XSV,*,F,하,*,*,*,*
는      ETM,*,T,는,*,*,*,*
EOS
Reply all
Reply to author
Forward
0 new messages