문서의 선택한 두 판 사이의 차이를 보여줍니다.
다음 판 | 이전 판 | ||
programming:unicode [2022/03/19 23:16] kwon37xi 만듦 |
programming:unicode [2022/03/19 23:58] (현재) kwon37xi |
||
---|---|---|---|
줄 1: | 줄 1: | ||
====== Unicode ====== | ====== Unicode ====== | ||
- | | + | * [[programming:문자|문자]] 먼저 읽을 것. |
- | * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다. | + | |
- | | + | |
- | * [[http:// | + | |
* [[http:// | * [[http:// | ||
+ | |||
+ | ===== Encoding 방식의 차이는? ===== | ||
+ | * [[https:// | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | |||
+ | ==== UTF-8 ==== | ||
+ | * 가변 길이(variable length) encoding | ||
+ | * 최소 1byte | ||
+ | * Unicode code point 0-127 은 1개의 바이트로 표현함. | ||
+ | * 128 이상의 code point 는 2~4byte 로 표현함. | ||
+ | * ASCII와 호환됨. ASCII를 표현할 때 1byte만 필요함. | ||
+ | * 즉, 영문만 있을 때는 ASCII와 UTF-8 이 동일하게 표현된다. ASCII가 워낙 광범위하게 쓰였기 때문에 UTF-8이 따라감. | ||
+ | |||
+ | |||
+ | ==== UTF-16 ==== | ||
+ | * 가변 길이 encoding | ||
+ | * 2byte 혹은 4byte 로 표현함. | ||
+ | * ASCII와 호환 안됨. | ||
+ | |||
+ | ==== UTF-32 ==== | ||
+ | * 고정 길이(fixed width) 인코딩 | ||
+ | * 4byte 고정 길이 | ||
+ | |||
+ | |||
===== 한글 ===== | ===== 한글 ===== | ||
* '' | * '' | ||
줄 37: | 줄 60: | ||
===== 참조 ===== | ===== 참조 ===== | ||
* [[https:// | * [[https:// | ||
+ | * [[http:// | ||
+ | * [[http:// | ||