문서의 선택한 두 판 사이의 차이를 보여줍니다.
양쪽 이전 판 이전 판 다음 판 | 이전 판 | ||
programming:unicode [2022/03/19 23:50] kwon37xi |
programming:unicode [2022/03/19 23:58] (현재) kwon37xi |
||
---|---|---|---|
줄 1: | 줄 1: | ||
====== Unicode ====== | ====== Unicode ====== | ||
- | * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의 필요. | ||
* [[programming: | * [[programming: | ||
* [[http:// | * [[http:// | ||
줄 7: | 줄 6: | ||
* [[https:// | * [[https:// | ||
* '' | * '' | ||
+ | * '' | ||
- | ==== UTF-8 ==== | ||
==== UTF-8 ==== | ==== UTF-8 ==== | ||
+ | * 가변 길이(variable length) encoding | ||
+ | * 최소 1byte | ||
+ | * Unicode code point 0-127 은 1개의 바이트로 표현함. | ||
+ | * 128 이상의 code point 는 2~4byte 로 표현함. | ||
+ | * ASCII와 호환됨. ASCII를 표현할 때 1byte만 필요함. | ||
+ | * 즉, 영문만 있을 때는 ASCII와 UTF-8 이 동일하게 표현된다. ASCII가 워낙 광범위하게 쓰였기 때문에 UTF-8이 따라감. | ||
+ | |||
+ | |||
+ | ==== UTF-16 ==== | ||
+ | * 가변 길이 encoding | ||
+ | * 2byte 혹은 4byte 로 표현함. | ||
+ | * ASCII와 호환 안됨. | ||
+ | |||
+ | ==== UTF-32 ==== | ||
+ | * 고정 길이(fixed width) 인코딩 | ||
+ | * 4byte 고정 길이 | ||
- | ==== UTF-8 ==== | ||
===== 한글 ===== | ===== 한글 ===== |