가끔 프로젝트 관리를 하다보면 인코딩이 말썽을 일으킬 때가 있다.
가령 원격 환경에서 GIT 작업을 했는데, 마침 에디터가 제공하는 인코딩이 달라서 저장할 때 파일 전체의 인코딩이 바뀌는 경우가 있다.
(대표적인 경우로 메모장이나 이상하게 세팅되어있던 예전 노트북의 에디터 플러스가 그랬다.)
관련 일을 하는 것이 아니라면 일반 개발자에게 크게 중요하지는 않아보이지만 어느정도 기본적인 유니코드에 대해서 지식은 필요하다고 생각한다.
일반 유니코드는 모든 글자를 2byte로 표현하는 모든 문자를 표현할 수 있는 기본적인 인코딩 형식이다.
단 HTML로 작성이 불가능하다.
UTF8 인코딩은 모든 문자를 표현하기 위한 개선된 인코딩 형식으로 영문/숫자/기호는 1byte,
한글 및 한자 등은 3byte를 잘 안쓰이는 문자는 4byte로 표현한다.
통상 유니코드라 하면 UTF8인코딩을 의미하기 때문에, 웬만한 설정은 UTF-8 로 통일시켜주면 큰 문제는 일어나지 않는다.
*참고로 EUC-KR은 한글 인코딩에 특화되어있는 유니코드 인코딩으로 한글에 2Byte를 사용한다.
'Computer Base > Computer Engineering' 카테고리의 다른 글
프로그래밍의 2가지 로직 패턴. 도메인 모델(Domain Model) & 트랜잭션 스크립트(Transaction Script) (0) | 2018.08.09 |
---|---|
메타데이터(Meta Data) (0) | 2018.08.06 |
개발자도 알아야할 몇가지 SW 테스팅의 종류 (0) | 2018.08.05 |
MicroService란? 마이크로 서비스 아키텍처에 대하여 (0) | 2018.08.04 |
전통의 소프트웨어 아키텍처 모델 - 모놀리식(Monolithic) 아키텍처 (0) | 2018.08.03 |