charset convert 관련해서 아무리 검색을 해도 뾰족한 답변이 없어서 3일 동안 고민 끝에 질문을 올리게 되었습니다.
http://code.google.com/p/go-charset/
http://code.google.com/p/mahonia/
두군대 캐릭터 셋 변경 관련한 소스가 있는데요.
한군데는 euc-kr을 지원안하고, 둘다 소스 파악도 힘든 상태라 현재 자포자기 한 상태입니다.
특정 사이트에 html을 가져와 파싱하고 원하는 값만을 뽑아와서 통계작업하는 간단한 프로그램입니다.
우리나라 사이트에 html은 보통 euc-kr 아니면 utf-8가 대부분인데요.
utf-8은 문제가 없지만 euc-kr은 []byte로 받아서 이걸 utf-8로 변환하는게 쉽지가 않네요.
관련 기능을 찾아봐도 유니코드에서 utf-8로 변환하는 방법만 나올 뿐
euc-kr > 유니코드 나 euc-kr > utf-8로 변환하는 소스는 없더군요..
golang 소스는 바라지도 않습니다. c나 c++소스도 안보이더라구요..
자바는 한줄이면 되는데.... 자바 개발만하다가 golang을 하니 쉽지가 않네요 ^^
혹시 제가 모르는 손쉬운 방법이 없을까요?
--
* 이 그룹에 이메일로 게시하려면 다음 주소로 이메일을 보내시면 됩니다.
golang...@googlegroups.com
* 추가 옵션을 보려면 http://groups.google.com/group/golang-korea?hl=ko?hl=ko의 그룹을 방문하세요.
그런데 golang 으로만 만들어진건 구현이 쉽지 않겠죠??
딱히 다른 곳에다 질문을 올릴 데가 없어서요
답글 감사합니다.. 그런데 이렇게 해 봐도 여전히 안 되네요 ㅠㅠ