사용자 도구

사이트 도구


programming:unicode

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판 이전 판
다음 판
이전 판
programming:unicode [2022/03/19 23:17]
kwon37xi [Unicode]
programming:unicode [2022/03/19 23:58] (현재)
kwon37xi
줄 1: 줄 1:
 ====== Unicode ====== ====== Unicode ======
-  +  * [[programming:문자|문자]] 먼저 읽을 것.
-  * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다. +
-  * [[http://helloworld.naver.com/helloworld/19187|hello world » 한글 인코딩의 이해 1편: 한글 인코딩의 역사와 유니코드]] +
-  * [[http://helloworld.naver.com/helloworld/76650|hello world » 한글 인코딩의 이해 2편: 유니코드와 Java를 이용한 한글 처리]]+
   * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]]   * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]]
 +
 +===== Encoding 방식의 차이는? =====
   * [[https://javarevisited.blogspot.com/2015/02/difference-between-utf-8-utf-16-and-utf.html|Difference between UTF-8, UTF-16 and UTF-32 Character Encoding? Example]]   * [[https://javarevisited.blogspot.com/2015/02/difference-between-utf-8-utf-16-and-utf.html|Difference between UTF-8, UTF-16 and UTF-32 Character Encoding? Example]]
 +  * ''utf-8'', ''utf-16'', ''utf-32''는 **Character Encoding**이다.
 +  * ''utf-16''과 ''utf-32''는 인코딩이 Unicode code point 와 일치해보이지만 ''utf-8''은 전혀 다르다.
 +
 +
 +==== UTF-8 ====
 +  * 가변 길이(variable length) encoding
 +  * 최소 1byte
 +  * Unicode code point 0-127 은 1개의 바이트로 표현함.
 +  * 128 이상의 code point 는 2~4byte 로 표현함.
 +  * ASCII와 호환됨. ASCII를 표현할 때 1byte만 필요함. 
 +  * 즉, 영문만 있을 때는 ASCII와 UTF-8 이 동일하게 표현된다. ASCII가 워낙 광범위하게 쓰였기 때문에 UTF-8이 따라감.
 +
 +
 +==== UTF-16 ====
 +  * 가변 길이 encoding
 +  * 2byte 혹은 4byte 로 표현함.
 +  * ASCII와 호환 안됨.
 +
 +==== UTF-32 ====
 +  * 고정 길이(fixed width) 인코딩
 +  * 4byte 고정 길이
  
  
줄 40: 줄 60:
 ===== 참조 ===== ===== 참조 =====
   * [[https://pat.im/1183|표준이 된 세벌식? - (3) 유니코드를 통한 요즘한글 부호계 표준화 작업]]   * [[https://pat.im/1183|표준이 된 세벌식? - (3) 유니코드를 통한 요즘한글 부호계 표준화 작업]]
 +  * [[http://helloworld.naver.com/helloworld/19187|hello world » 한글 인코딩의 이해 1편: 한글 인코딩의 역사와 유니코드]]
 +  * [[http://helloworld.naver.com/helloworld/76650|hello world » 한글 인코딩의 이해 2편: 유니코드와 Java를 이용한 한글 처리]]
  
programming/unicode.1647699441.txt.gz · 마지막으로 수정됨: 2022/03/19 23:17 저자 kwon37xi