사용자 도구

사이트 도구


unicode

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

다음 판
이전 판
unicode [2012/09/26 10:50]
kwon37xi 새로 만듦
unicode [2022/03/19 23:16]
kwon37xi 제거됨
줄 1: 줄 1:
 ====== Unicode ====== ====== Unicode ======
-  * [[http://html.nhndesign.com/blog/1079940|문자 집합(Character Set)과 인코딩(Encoding)]] +   
-    * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다.+  * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다. 
 +  * [[http://helloworld.naver.com/helloworld/19187|hello world » 한글 인코딩의 이해 1편: 한글 인코딩의 역사와 유니코드]] 
 +  * [[http://helloworld.naver.com/helloworld/76650|hello world » 한글 인코딩의 이해 2편: 유니코드와 Java를 이용한 한글 처리]] 
 +  * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]] 
 +===== 한글 ===== 
 +  * ''이 중 한글은 U+1100~U+11FF 사이에 한글 자모 영역, U+AC00~U+D7AF 사이의 한글 소리 마디 영역에 포함된다'' 
 +  * [[http://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_%EB%B2%94%EC%9C%84_%EB%AA%A9%EB%A1%9D|유니코드 범위 목록]] 
 + 
 +===== IDEOGRAPHIC SPACE ===== 
 +  * [[http://www.yunsobi.com/blog/596|replaceAll(" ","") trim() 으로 제거되지 않는 공백 제거]]<code java> 
 +//모든 공백 제거 
 +String str =originalString.replaceAll("\\p{Z}", ""); 
 + 
 + 
 +// 앞뒤 공백만 제거(trim) 
 +String str = originalString.replaceAll("(^\\p{Z}+|\\p{Z}+$)", ""); 
 +</code> 
 +  * [[http://www.fileformat.info/info/unicode/char/3000/index.htm|Unicode Character 'IDEOGRAPHIC SPACE' (U+3000)]] 
 + 
 +===== Unicode To ASCII Escape ===== 
 +  * [[http://www.rapidmonkey.com/unicodeconverter/|Web Unicode Converter]] 
 +  * [[http://stackoverflow.com/questions/6230190/convert-international-string-to-u-codes-in-java|unicode - Convert International String to \u Codes in java - Stack Overflow]]<code java> 
 +StringBuilder b = new StringBuilder(); 
 + 
 +for (char c : input.toCharArray()) { 
 +    if (c >= 128) 
 +        b.append("\\u").append(String.format("%04X", (int) c)); 
 +    else 
 +        b.append(c); 
 +
 + 
 +return b.toString(); 
 +</code> 
 + 
 +===== 참조 ===== 
 +  * [[https://pat.im/1183|표준이 된 세벌식? - (3) 유니코드를 통한 요즘한글 부호계 표준화 작업]]