유니코드 #3

출처 : http://www.bsidesoft.com/?p=3526&

UTF16 인코딩의 개요

1회차에서 유니코드 기본 개념을 살펴보고 2회차에서는 UTF8을 공부했습니다.

이번 포스팅에는 대부분의 응용프로그램 내부에서 사용되는 UTF16을 알아봅니다.

UTF8만으로는 안되는 걸까…
UTF8은 전송 시에 유리하지만 UTF16은 프로그램 실행 시 유리하니까.
그렇긴 하지만.

UTF16의 감을 … 모두 보기

유니코드 #2

출처 : http://www.bsidesoft.com/?p=3496&

심화된 인코딩 탐구

저번 포스팅에서는 유니코드에 대한 개요와 인코딩이란 무엇인가에 대한 기초개념을 살펴봤습니다.
다음과 같은 내용이 나왔죠.

  • 코드포인트 – 문자에 할당된 고유한 숫자값
  • 평면 – 코드포인트를 관리하기 위한 그룹범위
  • 코드유닛 – 일정한 크기를 하나의 문자로 바라보는
모두 보기

유니코드 #1

출처 : http://www.bsidesoft.com/?p=3435

개요

본래 우리가 작성한 문서에 있는 문자들은 그대로 저장될 수는 없습니다. 반드시 숫자로 바뀐 후 저장되죠. 따라서 문자를 숫자로 바꿔주는 표가 꼭 필요합니다.
이러한 문자를 숫자로 바꿔주는 표 중에 가장 유명한 건 아스키표입니다. 아스키표를 사용하면 영어, 숫자, … 모두 보기

[문자인코딩] 유니코드, UTF-8, UTF-16, UTF-32 간단 정리 Application

출처 : http://ggaman.com/tt/896

유니코드란?

unicode는 모든 문자에 index를 줘 놓은 것이다. 더 이상도 아니고, 더 이하도 아니다.
이 index를 code point라고 부르는데, 그냥 index라고 칭하도록 하자.

‘A’라는 글자는 0x0041 이라는 index를 가진다.
‘a’라는 글자는 0x0061 이라는 index를 가진다.
‘가’라는 글자는

모두 보기