unicode

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

--- unicode [2012/09/26 10:50]
kwon37xi 새로 만듦
+++ unicode [2022/03/19 23:16]
kwon37xi 제거됨
@@ 줄 1: / 줄 1: @@
 ====== Unicode ======
-  * [[http://html.nhndesign.com/blog/1079940|문자 집합(Character Set)과 인코딩(Encoding)]]
-    * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다.
+  * java환경에서는 euc-kr이 KSC5601-87로 사용되어 CP949의 확장 완성형과 호환되지 않을 수도 있으니 주의해야 합니다.
+  * [[http://helloworld.naver.com/helloworld/19187|hello world » 한글 인코딩의 이해 1편: 한글 인코딩의 역사와 유니코드]]
+  * [[http://helloworld.naver.com/helloworld/76650|hello world » 한글 인코딩의 이해 2편: 유니코드와 Java를 이용한 한글 처리]]
+  * [[http://www.utf8-chartable.de/unicode-utf8-table.pl|Unicode UTF-8 Table]]
+===== 한글 =====
+  * ''이 중 한글은 U+1100~U+11FF 사이에 한글 자모 영역, U+AC00~U+D7AF 사이의 한글 소리 마디 영역에 포함된다''
+  * [[http://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_%EB%B2%94%EC%9C%84_%EB%AA%A9%EB%A1%9D|유니코드 범위 목록]]
+===== IDEOGRAPHIC SPACE =====
+  * [[http://www.yunsobi.com/blog/596|replaceAll(" ","") trim() 으로 제거되지 않는 공백 제거]]<code java>
+//모든 공백 제거
+String str =originalString.replaceAll("\\p{Z}", "");
+// 앞뒤 공백만 제거(trim)
+String str = originalString.replaceAll("(^\\p{Z}+|\\p{Z}+$)", "");
+</code>
+  * [[http://www.fileformat.info/info/unicode/char/3000/index.htm|Unicode Character 'IDEOGRAPHIC SPACE' (U+3000)]]
+===== Unicode To ASCII Escape =====
+  * [[http://www.rapidmonkey.com/unicodeconverter/|Web Unicode Converter]]
+  * [[http://stackoverflow.com/questions/6230190/convert-international-string-to-u-codes-in-java|unicode - Convert International String to \u Codes in java - Stack Overflow]]<code java>
+StringBuilder b = new StringBuilder();
+for (char c : input.toCharArray()) {
+    if (c >= 128)
+        b.append("\\u").append(String.format("%04X", (int) c));
+    else
+        b.append(c);
+}
+return b.toString();
+</code>
+===== 참조 =====
+  * [[https://pat.im/1183|표준이 된 세벌식? - (3) 유니코드를 통한 요즘한글 부호계 표준화 작업]]