사용자 도구

사이트 도구


unicode

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판 이전 판
다음 판
이전 판
unicode [2013/01/26 13:43]
kwon37xi
unicode [2022/03/19 23:16]
kwon37xi 제거됨
줄 1: 줄 1:
 ====== Unicode ====== ====== Unicode ======
-  * [[http://html.nhndesign.com/blog/1079940|문자 집합(Character Set)과 인코딩(Encoding)]] +   
-    * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다.+  * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다.
   * [[http://helloworld.naver.com/helloworld/19187|hello world » 한글 인코딩의 이해 1편: 한글 인코딩의 역사와 유니코드]]   * [[http://helloworld.naver.com/helloworld/19187|hello world » 한글 인코딩의 이해 1편: 한글 인코딩의 역사와 유니코드]]
   * [[http://helloworld.naver.com/helloworld/76650|hello world » 한글 인코딩의 이해 2편: 유니코드와 Java를 이용한 한글 처리]]   * [[http://helloworld.naver.com/helloworld/76650|hello world » 한글 인코딩의 이해 2편: 유니코드와 Java를 이용한 한글 처리]]
 +  * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]]
 ===== 한글 ===== ===== 한글 =====
   * ''이 중 한글은 U+1100~U+11FF 사이에 한글 자모 영역, U+AC00~U+D7AF 사이의 한글 소리 마디 영역에 포함된다''   * ''이 중 한글은 U+1100~U+11FF 사이에 한글 자모 영역, U+AC00~U+D7AF 사이의 한글 소리 마디 영역에 포함된다''
   * [[http://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_%EB%B2%94%EC%9C%84_%EB%AA%A9%EB%A1%9D|유니코드 범위 목록]]   * [[http://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_%EB%B2%94%EC%9C%84_%EB%AA%A9%EB%A1%9D|유니코드 범위 목록]]
 +
 +===== IDEOGRAPHIC SPACE =====
 +  * [[http://www.yunsobi.com/blog/596|replaceAll(" ","") trim() 으로 제거되지 않는 공백 제거]]<code java>
 +//모든 공백 제거
 +String str =originalString.replaceAll("\\p{Z}", "");
 +
 +
 +// 앞뒤 공백만 제거(trim)
 +String str = originalString.replaceAll("(^\\p{Z}+|\\p{Z}+$)", "");
 +</code>
 +  * [[http://www.fileformat.info/info/unicode/char/3000/index.htm|Unicode Character 'IDEOGRAPHIC SPACE' (U+3000)]]
 +
 +===== Unicode To ASCII Escape =====
 +  * [[http://www.rapidmonkey.com/unicodeconverter/|Web Unicode Converter]]
 +  * [[http://stackoverflow.com/questions/6230190/convert-international-string-to-u-codes-in-java|unicode - Convert International String to \u Codes in java - Stack Overflow]]<code java>
 +StringBuilder b = new StringBuilder();
 +
 +for (char c : input.toCharArray()) {
 +    if (c >= 128)
 +        b.append("\\u").append(String.format("%04X", (int) c));
 +    else
 +        b.append(c);
 +}
 +
 +return b.toString();
 +</code>
 +
 +===== 참조 =====
 +  * [[https://pat.im/1183|표준이 된 세벌식? - (3) 유니코드를 통한 요즘한글 부호계 표준화 작업]]