본문 바로가기

cp949

(3)
인코딩을 들여다보자 아주 오래전에 회사내부에서 공유하려 만들었던 글입니다. 인코딩을 들여다보자 다음과 같은 실험으로 인코딩을 들여다보자. 준비물 : notepad, madedit, python notepad 로 동일한 문자열 여러가지 인코딩으로 저장해 보기 기본 cp949 인코딩 영문은 한 글자당 한바이트가 되고, 한글 한 글자가 두바이트가 되는 cp949 (euc-kr) 인코딩 바이트 스트림이 저장된다. utf-8 인코딩 영문은 여전히 한 글자당 한바이트, 한글은 한 글자가 3바이트가 되어 저장된다. utf 16(le) 인코딩 영문, 한글 상관 없이 모든 글자 하나가 두바이트로 저장된다. utf 16(be) 인코딩 바로 위와 동일하게 영문, 한글 모두 두바이트씩으로 저장되지만, 두바이트의 순서가 le와 반대이다. made..
pip install 중에 , setup.py 에서 UnicodeDecodeError 'cp949' codec can't decode .... illegal multibyte sequence 가 발생하며 설치가 실패한다. pip install 중에 ,setup.py 에서 UnicodeDecodeError 'cp949' codec can't decode .... illegal multibyte sequence 가 발생하며 설치가 실패한다. 파이썬에 처음 입문하고, 이런 저런 패키지(라이브러리)들을 설치해야 한다. 그런데, 간단히 성공해야 마땅한, 패키지 설치 중에 다음과 같이 UnicodeDecodeError 'cp949' codec can't decode 어쩌고 하는 에러가 발생하여, 패키지 설치가 실패하는 경우가 종종 발생한다. 여러가지 원인들 중에서, 매우 사소한 원인으로 패키지 설치가 실패하는 경우에 대해서 원인을 찾아보고, 패키지를 설치하는 방법에 대해서 알아보자. 테스트..
파이썬을 한글명이 포함된 디렉토리 아래에 깔았을 때, site.py virtual_install_main_packages 안에서 UnicodeDecodeError 가 발생. 윈도우에서 파이썬을 한글이 포함된 디렉토리 패쓰 아래에 설치하였을 때, 패쓰의 한글 문자 때문에, UnicodeError 가 발생할 수 있다. 이런 문제가 발생하는 조건을 발견하여, 기록한다. 이런 문제에 대한 간단한 해결책은 파이썬을 한글을 포함하지 않는 디렉토리 아래에 설치하면 된다. (C:\Dev\Python38 등) 보통 파이썬을 처음 설치하는 경우에, 아무런 설정을 건드리지 않으면, 디폴트로 윈도우 사용자폴더 (보통 C:\Users\철수 같은 것 ) 하위에 설치를 하게 되는데, 윈도우 사용자명이 한글인 경우에 별 생각없이 설치하면, 나중에 이런 문제에 맞닥뜨릴 수 있다. 그리고 또 한가지, 모든 UnicodeDecodeError 가 파이썬 설치폴더만 바꾸어서 해결되는 것은 아니다. 초보자들은 오..