출처 : http://www.bsidesoft.com/?p=3526&
UTF16 인코딩의 개요
1회차에서 유니코드 기본 개념을 살펴보고 2회차에서는 UTF8을 공부했습니다.
이번 포스팅에는 대부분의 응용프로그램 내부에서 사용되는 UTF16을 알아봅니다.
UTF16의 감을 잡기 위해 브라우저의 자바스크립트가 작동하는 절차에 대해 생각해볼까요.
- 우리가 작성한 xxx.js 파일은 UTF8로 저장합니다. W3C권장사항이고 최근에는 UTF8이 대세입니다.
- 브라우저에서는 우선 xxx.js를 읽어들여 UTF8기준으로 디코딩하여 코드포인트를 해석합니다.
- 해석된 코드포인트를 자바스크립트 엔진에게 전달하면 엔진은 코드포인트를 UTF16으로 인코딩하여 메모리에 적재합니다.
“파일용 인코딩”과 “프로그램 내부에 사용하는 인코딩”은 다를 수 있습니다.
- 파일을 디코딩하고 메모리용으로 다시 인코딩하는 작업이 중복되어 초기 작동 시에는 부담이 되지만,
- 프로그램이 실행될