Red de conocimientos turísticos - Conocimientos sobre calendario chino - Todo el corpus de poesía Tang está en formato json. ¿Cómo utilizar Python para dividir los caracteres chinos simplificados y tradicionales del corpus en dos archivos json o archivos TXT diferentes?
Todo el corpus de poesía Tang está en formato json. ¿Cómo utilizar Python para dividir los caracteres chinos simplificados y tradicionales del corpus en dos archivos json o archivos TXT diferentes?
Hola, para python3, podemos probar: la codificación es big5hkscs, que es chino tradicional sin excepción. Aquí hay un código de muestra: ¿línea?=?Fuimos a cenar hoy'?
l?=?Fuimos a comer hoy'?
¿intentar:?
print(line.encode('big5hkscs'))?
excepto:?
print("Nuevo ? estilo?")