20장의 크롤러를 돌리면, 수집결과가 깨져 보이는 이유?

35 views
Skip to first unread message

레이백

unread,
Oct 14, 2009, 7:58:30 AM10/14/09
to Python 3 질문 게시판
20장의 크롤러를 돌리면,
data/xxxx/151.txt 라는 식의 파일로 수집결과가 생기잖아요~

근데 왜 열어보면.. 아래의 예와 같이 보일까요?
깨지지 않고 한글로 보여야 하는거 아닌가요?

=========================== 시작 ==============================
�꾨땲���④굅��鍮듭쭛 - �앹뾾���댁빞湲�.-�앸뭇留뚮뱾湲�

 
鍮�...諛쒗슚鍮�... 洹�以묒뿉�쒕룄 �앸뭇.
�꾨쭏���쒓뎅遺꾨뱾猿섏꽌 �쇱긽�곸쑝濡��쒖씪 留롮씠 �묓븯�쒕뒗 鍮듭씠 �꾨땺源��⑸땲��
�ㅻ뒛 �뺣쭚 �ㅻ옯留뚯뿉 �앷컖�섎뒗�곕줈 諛쒗슚�앸뭇����븳 二쇱젅二쇱젅 �섎떎瑜���蹂쇨퉴�댁슂.
�쒖옉遺�꽣 �쎄린媛�寃곷굹�쒖5?? �� ^^
 
 
=========================== 끝 ==============================


HoChul Shin

unread,
Oct 14, 2009, 8:54:34 AM10/14/09
to bak...@gmail.com, Python 3 질문 게시판
안녕하세요.
질문 주셔서 감사합니다 :)

이렇게 한글이 깨져 보이는 이유는,
현재 daum blog의 본문이 UTF-8로 되어 있는데 반해,
열어보신 에디터가 다른 인코딩(cp949 등)으로 잘못 해석하여 깨진 것으로 생각됩니다.
UTF-8을 지원하는 에디터를 사용해 보시기 바랍니다.

인코딩과 관련된 내용이 다음장이나 다다음장에도 계속 나오므로, 계속 읽어보시면 이해가 될 것이라 믿습니다 :)
혹은 다시 1부 2장으로 가셔서 문자열(unicode)에 대해서 읽고 돌아오셔도 좋을 것 같습니다.

감사합니다.


2009년 10월 14일오후 8:58, 레이백 <bak...@gmail.com>님의 말:



--
-----------------------------
http://dsphome.net/
Reply all
Reply to author
Forward
0 new messages