python(2.7) 으로 웹페이지 parsing 을 하다보면 계속 만나게 되는 문제.

매번 까먹어서 짜증나서 블로그에 포스팅해놔야지


euc-kr 로 제작된 웹페이지를 urllib 등으로 데이터를 읽어와서

작업을 하려하면 한글이 무참히 깨지거나, 폭풍 error



이렇게, unicode로 변환 후 utf-8로 encoding 해주면 대부분 잘 된다.

티스토리 툴바