형태소 분석기 MeCab 한국어 사전

906 views
Skip to first unread message

cogniti

unread,
Aug 4, 2012, 6:26:06 PM8/4/12
to rub...@googlegroups.com
MeCab라는 일본어 형태소 분석기가 있습니다.
범용 설계라 한국어 사전이 있으면 한국어도 분석할 수 있습니다.
그래서 실험 삼아서 만들어봤습니다.
주소: https://github.com/cogniti/mecab-kdic

mecab 루비 바인딩이 존재하므로 루비에서도 사용가능합니다.

# coding: utf-8
require 'MeCab'
m = MeCab::Tagger.new ("-d ./final")
print m.parse ("나는 밥을 먹는다.")
print m.parse ("안녕하십니까?")

나    대명사,*,*,*,*,*,*,*,*
는    조사,주격조사,*,*,*,*,*,*,*
밥    명사,일반명사,*,*,*,*,*,*,*
을    조사,목적격조사,*,*,*,*,*,*,*
먹는다    동사,*,*,*,*,*,*,*,*
.    기호,마침표,*,*,*,*,*,*,*
EOS
안녕하십니까    감탄사,*,*,*,*,*,*
?    명사,기호,*,*,*,*,*
EOS

일본어를 몰라서 rewrite.def feature.def 를 이상하게 만들었더니 사전에 없는 단어의 추정 품사가 이상하더군요.
일본어 좀 아시는 분 있으면 http://mecab.googlecode.com/svn/trunk/mecab/doc/learn.html 에서
rewrite.def, feature.def 부분 좀 번역해 주시면 고맙겠네요.

Park Ji-In

unread,
Aug 5, 2012, 8:08:39 AM8/5/12
to rub...@googlegroups.com
해당 챕터만 번역했습니다.

2012년 8월 5일 오전 7:26, cogniti <cog...@gmail.com>님의 말:
mecab-rewrite-feature.pdf

cogniti

unread,
Aug 6, 2012, 1:45:06 AM8/6/12
to rub...@googlegroups.com
오!! 감사합니다.
방금 읽어봤는데... 일본어 동사도 활용형이 있나보군요..
덕분에 감 잡았습니다.
5단동사, 1단동사, 루동사 등을 공부하면 완전히 감이 잡히겠군요.

그리고 인터넷 검색 중에 알게된 사실인데
mecab으로 한국어 형태소를 분석한 논문과 사이트가 있더군요.
관심있는 분들 함 읽어 보세요.
번역기 돌려서 읽어봤는데 참 흥미롭습니다.

MeCabを用いた現代韓国語の形態素解析
http://porocise.sakura.ne.jp/archive/paper/mecabdic.pdf

mecab으로 웹에서 한국어 형태소 분석해 주는 사이트
MeCabによる韓国語の形態素解析
http://porocise.sakura.ne.jp/korean/morph/analyzer.html

15世紀朝鮮語の形態素解析の試み
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CFAQFjAA&url=http%3A%2F%2Fwww.adm.fukuoka-u.ac.jp%2Ffu844%2Fhome2%2FRonso%2FRonsyuA%2FVol10-3%2FA1003_0017.pdf&ei=VVcfUKXYAeLTmAWDpIDICg&usg=AFQjCNGnWWzZT1nbGBs94V1SlhvFfPV_Sw

2012년 8월 5일 오후 9:08, Park Ji-In <tis...@gmail.com>님의 말:

Reply all
Reply to author
Forward
0 new messages