문서의 선택한 두 판 사이의 차이를 보여줍니다.
양쪽 이전 판 이전 판 다음 판 | 이전 판 | ||
programming:문자 [2022/03/19 23:16] kwon37xi [Charset 과 Char Encoding 의 차이는 무엇인가?] |
programming:문자 [2022/03/20 00:04] (현재) kwon37xi |
||
---|---|---|---|
줄 6: | 줄 6: | ||
===== Charset 과 Char Encoding 의 차이는 무엇인가? | ===== Charset 과 Char Encoding 의 차이는 무엇인가? | ||
* 문자표(character set)과 문자 인코딩(Character Encoding)은 매우 혼란스럽게 쓰인다. | * 문자표(character set)과 문자 인코딩(Character Encoding)은 매우 혼란스럽게 쓰인다. | ||
+ | * character set 은 세상에서 쓰이는 문자와 기호들의 목록일 뿐이며 이것들은 **Code Point**라고 불리우는 어떤 숫자값으로 매핑돼 있다. | ||
+ | * encoding 은 code point 를 어떻게 byte 로 표현하느냐의 문제이다. | ||
* 유니코드는 (거의) 전 세계의 모든 문자에 번호를 부여한 문자표(Character Set) 이다. | * 유니코드는 (거의) 전 세계의 모든 문자에 번호를 부여한 문자표(Character Set) 이다. | ||
* 하지만 유니코드는 여러가지 인코딩(Character Encoding) 방식으로 표현될 수 있다. '' | * 하지만 유니코드는 여러가지 인코딩(Character Encoding) 방식으로 표현될 수 있다. '' | ||
+ | * 하나의 Unicode 문자(code point)를 '' | ||
+ | * see [[programming: | ||
+ | * **문제는 현재 아주 많은 분야에서 문자셋과 인코딩을 혼란스러워하고 있다. 대부분의 경우 '' | ||
+ | ===== 과거의 한글 '' | ||
+ | * '' | ||
+ | * 2바이트 완성형 문자셋(한글 2, | ||
+ | * Microsoft가 독자적으로 제정한 문자집합 확장완성형(통합형 한글 코드, Unifide Hangul Code) 문자셋(현대 한글 모두 포함하고 있음)이 있고 이를 표현하는 방법인 '' | ||
+ | ===== 참조 ===== | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// |