Convertir caracteres hexadecimales a chinos
(byte)0xE5,(byte)0xA8,(byte)0x81, // wai
(byte)0xE6, (byte)0x8C, (byte)0x87, // dedo
(byte)0xE5, (byte)0x8D, (byte)0x97 } // Nan
Cadena s;
probar
{
s=new String(bn, "utf-8"); sistema utf-8
}
catch(Exception e)
{
s="error";
}
// Muestra la cadena s, que de hecho es la "guía definitiva"
// La longitud de utf-8 es variable. La codificación ASCII (como el inglés) es de un byte, lo cual es muy beneficioso para los países occidentales;
el latín, el árabe, etc. son dos bytes
los caracteres chinos y otros son tres bytes; , que es más largo que Unicode.
.
Por lo tanto, la "guía autorizada" para cadenas de caracteres chinos es 3X4=12 bytes,
Baidu:
UTF-8 (formato de conversión Unicode de 8 bits ) es una codificación de caracteres de longitud variable de Unicode, también conocida como Unicode. Creado en 1992 por Ken Thompson. Ahora estandarizado por RFC 3629, UTF-8 codifica caracteres UNICODE de 1 a 6 bytes. Se puede utilizar en páginas web para mostrar chino simplificado, chino tradicional y otros idiomas (como inglés, japonés y coreano) en la misma página.
Las respuestas a las preguntas están disponibles. Si está satisfecho, ¡adoptelas a tiempo!