Javaでの文字のバイト列の表示
作る必要があったので、メモがてら残しておく。
なお、String#codePointAtで返ってくる値は常にUTF-16BEとしてのコードポイントという点に注意。
public static void main(String[] args) { String string = "あいうえお"; for (int i = 0; i < string.length;) { int codePointAt = string.codePointAt(i); System.out.printf("\\u%s\n", Integer.toHexString(codePointAt)); i += Character.charCount(codePointAt); } }
実行結果は以下。
\u3042
\u3044
\u3046
\u3048
\u304a