사용자 도구

사이트 도구


programming:unicode

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판 이전 판
다음 판
이전 판
programming:unicode [2022/03/19 23:50]
kwon37xi
programming:unicode [2022/03/19 23:58] (현재)
kwon37xi
줄 1: 줄 1:
 ====== Unicode ====== ====== Unicode ======
-  * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의 필요. 
   * [[programming:문자|문자]] 먼저 읽을 것.   * [[programming:문자|문자]] 먼저 읽을 것.
   * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]]   * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]]
줄 7: 줄 6:
   * [[https://javarevisited.blogspot.com/2015/02/difference-between-utf-8-utf-16-and-utf.html|Difference between UTF-8, UTF-16 and UTF-32 Character Encoding? Example]]   * [[https://javarevisited.blogspot.com/2015/02/difference-between-utf-8-utf-16-and-utf.html|Difference between UTF-8, UTF-16 and UTF-32 Character Encoding? Example]]
   * ''utf-8'', ''utf-16'', ''utf-32''는 **Character Encoding**이다.   * ''utf-8'', ''utf-16'', ''utf-32''는 **Character Encoding**이다.
 +  * ''utf-16''과 ''utf-32''는 인코딩이 Unicode code point 와 일치해보이지만 ''utf-8''은 전혀 다르다.
  
-==== UTF-8 ==== 
  
 ==== UTF-8 ==== ==== UTF-8 ====
 +  * 가변 길이(variable length) encoding
 +  * 최소 1byte
 +  * Unicode code point 0-127 은 1개의 바이트로 표현함.
 +  * 128 이상의 code point 는 2~4byte 로 표현함.
 +  * ASCII와 호환됨. ASCII를 표현할 때 1byte만 필요함. 
 +  * 즉, 영문만 있을 때는 ASCII와 UTF-8 이 동일하게 표현된다. ASCII가 워낙 광범위하게 쓰였기 때문에 UTF-8이 따라감.
 +
 +
 +==== UTF-16 ====
 +  * 가변 길이 encoding
 +  * 2byte 혹은 4byte 로 표현함.
 +  * ASCII와 호환 안됨.
 +
 +==== UTF-32 ====
 +  * 고정 길이(fixed width) 인코딩
 +  * 4byte 고정 길이
  
-==== UTF-8 ==== 
  
 ===== 한글 ===== ===== 한글 =====
programming/unicode.1647701435.txt.gz · 마지막으로 수정됨: 2022/03/19 23:50 저자 kwon37xi