가끔 프로젝트 관리를 하다보면 인코딩이 말썽을 일으킬 때가 있다. 

가령 원격 환경에서 GIT 작업을 했는데, 마침 에디터가 제공하는 인코딩이 달라서 저장할 때 파일 전체의 인코딩이 바뀌는 경우가 있다.

(대표적인 경우로 메모장이나 이상하게 세팅되어있던 예전 노트북의 에디터 플러스가 그랬다.)


관련 일을 하는 것이 아니라면 일반 개발자에게 크게 중요하지는 않아보이지만 어느정도 기본적인 유니코드에 대해서 지식은 필요하다고 생각한다.



일반 유니코드는 모든 글자를 2byte로 표현하는 모든 문자를 표현할 수 있는 기본적인 인코딩 형식이다

HTML로 작성이 불가능하다.


 UTF8 인코딩은 모든 문자를 표현하기 위한 개선된 인코딩 형식으로 영문/숫자/기호는 1byte, 

한글 및 한자 등은 3byte를 잘 안쓰이는 문자는 4byte로 표현한다.


통상 유니코드라 하면 UTF8인코딩을 의미하기 때문에, 웬만한 설정은 UTF-8 로 통일시켜주면 큰 문제는 일어나지 않는다.


 *참고로 EUC-KR은 한글 인코딩에 특화되어있는 유니코드 인코딩으로 한글에 2Byte를 사용한다.


+ Recent posts