책을보고 인덱싱 부분을 코딩하고 테스트 하고 있습니다
self.analyzer = lucene.StandardAnalyzer()
이부분을 http://cafe.naver.com/korlucene.cafe 에서 공개한 한글 형태소분석기
JAR 파일을 추가해서 사용하고 싶은데 이게 잘되지를 않는군요 단순하게 jar 파일을 파이썬 bin 의 lucene 관련
폴더에 추가하고 __init__.py 인가에 jar 파일을 path에 추가했는데...
다른 방법이 있는지요?
우선 Lucene에 많은 관심을 가져주셔서 감사합니다.
보통 책의 마지막에 있기 때문에 많은 분들이 안보시는거 같은데,
이렇게 자세하게 문의해주시니 내심 기분이 좋으면서도 부담도 살짝 됩니다. ^^;;
우선 질문하신 리눅스에서 PyLucene을 빌드하고 사용하는 방법은
공식적인 PyLucene 사이트(http://lucene.apache.org/pylucene/)에 자세한 설명이 나와있습니다.
대신 여러 모듈을 차례대로 빌드를 해야하고,
이 빌드 방법이 여러 페이지에 흩어져 있기 때문에 찾아서 보시는데 어려움이 있으실 겁니다.
또한 Python 3 Version에서는 발생하는 문제가 있기 때문에 이에 대해서는 도움이 될만한 내용을 작성하였습니다.
1) JDK 설치(우분투 기준)
sudo apt-get install sun-java5-jdk
sudo update-java-alternatives -s java-1.5.0-sun
2) PyLucene Code Download
http://apache.tt.co.kr/lucene/pylucene/
3) JCC 설치
http://lucene.apache.org/pylucene/jcc/documentation/install.html\
JCC 설치시 파이썬 3에서는 예외구문이 예전 방식으로 작성되어서
다음과 같이 Error가 발생합니다.
again4you@again4you-linux:jcc$ python3.0 setup.py build
File "setup.py", line 156
raise NotImplementedError, patch_st_dir()
^
SyntaxError: invalid syntax
py2to3 툴로 변환하시거나 python 2.6 Version 이하에서 설치하시면 정상적으로 됩니다.
4) Pylucene 설치
http://lucene.apache.org/pylucene/documentation/install.html
또한 문의하신 외부 jar 파일을 사용하는 방법 역시 위의 공식사이트에서 사용법을 찾으실 수 있습니다.
그럼 오늘도 즐거운 하루 되세요.
감사합니다.
On 10월29일, 오후12시41분, 우상 송 <songw...@gmail.com> wrote:
> 오늘 책과 인터넷으로 자료들을 찾아보니 빌드를 다시해야 하는가보군요
> 그래서 소스를 찾아 다운로드 받고 makefile을 보니 참 답답하네요
> 당최 먼지를 모르겠으니....
> 혹시 소스를 빌드하는 방법 자세하게 설명해주실 수는 없는지요
> 나중에 루씬을 이용한 간단한 어플을 리눅스등에서 돌려보고 싶은데
> 책에서는 윈도우에서만 가능하니 리눅스에서는 운영체제에 마춰 빌드를 다시해야 하는가 보던데..
> 자료를 찾아보려고 해도 쉽지는 않군요 특히 한글 분석기는 포함되지않아서 공개용을 한번 포함시켜 보려고 하는데....
>
> 책을보고 인덱싱 부분을 코딩하고 테스트 하고 있습니다
> self.analyzer = lucene.StandardAnalyzer()
> 이부분을http://cafe.naver.com/korlucene.cafe에서 공개한 한글 형태소분석기