Red de conocimientos turísticos - Información de alquiler - Utilice VC para leer información de páginas web y utilice cadenas para almacenar el código fuente. ¿Cómo evitar caracteres confusos?

Utilice VC para leer información de páginas web y utilice cadenas para almacenar el código fuente. ¿Cómo evitar caracteres confusos?

Primero lea el encabezado de la página web y luego use UTF8 para convertirlo. Si la codificación de la página html es gbk o gb2312, los caracteres chinos serán confusos después de la conversión, pero los caracteres en inglés se mostrarán normalmente. codificación de la página de códigos para ver si hay algo en inglés.

Generalmente, algunas páginas web tendrán "charset=gbk" y otros caracteres que representan diferentes páginas de códigos.

Luego vuelva a hacerlo. -Leer la página web completa. ¿Cómo evitar que se confunda? charset = gbk "etc. representa una página de códigos diferente

Luego, vuelva a leer la página web completa y luego use la página de códigos convertida a la codificación del sistema informático local para evitar caracteres confusos. Por supuesto, también puede convierta directamente a codificación UTF-8 o Unicode y almacene el encabezado del archivo correspondiente en el archivo TXT

La API utilizada es MultiByteToWideChar y otras funciones