¿Cuáles son las formas de obtener el contenido fuente de las páginas web en PHP?
Método 1: Obtener file_get_contents.
ltspan style="espacio en blanco: pre" >? lt/spangt. $ URL = "/";
ltspan style="white-space:pre">? lt/spangt. $fh=Archivo Obtener contenido
('/news/fzfj/'); ltspan style="white-space: pre " >? lt/spangt. echo $ fh
Método 2: Utilice fopen para obtener el código fuente de la página web.
ltspan style="espacio en blanco: pre" >? lt/spangt. $ URL = "/";
ltspan style="white-space:pre">? lt/spangt. $handle = fopen ($url, " Rb ");
ltspan style="white-space:pre" >? lt/spangt. $ contenidos =
ltspan style="white-space:pre" >? lt/spangt. Y (!feof($handle)) {
ltspan style="white-space:pre" > lt/spangt. $contenido. = fread($handle, 8192);
ltspan style="white-space: pre " >? lt/spangt. }
ltspan style="espacio en blanco: pre " >? lt/spangt. fclose($ handle);
ltspan style="espacio en blanco: pre " >? lt/spangt. echo $contents//Envía el contenido obtenido.
Método 3: Utilice CURL para obtener el código fuente de la página web
$ URL = "/"
$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0Windows NT 6.0slcc 1. Net CLR 2. 0. 50727. Net CLR 3. 5. 21022. Net CLR 1. 0. 3705)'.
$ curl = curl _init();? //Crea un nuevo recurso CURL.
curl_setopt($curl, CURLOPT_URL, $URL);? //Establece la URL y las opciones correspondientes.
curl_setopt($curl, CURLOPT_HEADER, 0);? //0 significa que no hay salida de encabezado, 1 significa salida.
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);? // Establezca si se mostrará la información del encabezado, se muestra 1, no se muestra 0. //Si tiene éxito, solo se devuelve el resultado y no se genera nada automáticamente. Si falla, devuelve FALSO.
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, falso);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, falso);
curl_setopt($curl, CURLOPT_ENCODING, ' '); );? //Establecer formato de codificación. Si está vacío, se admiten todos los formatos de codificación.
//Para el contenido de la parte "Accept-Encoding:" del // encabezado, los formatos de codificación admitidos son: "identity", "deflate" y "gzip". ?
curl_setopt($curl, CURLOPT_USERAGENT, $agente de usuario);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1
//Establezca esta opción en A); encabezado distinto de cero (como "Ubicación:"), el servidor lo enviará como parte del encabezado HTTP (tenga en cuenta que esto es recursivo, PHP enviará un encabezado con forma de "Ubicación:")).
$ datos = curl _ exec($ curl);
echo $ datos
//echo curl _ errno($ curl); Cuándo, el programa se ejecuta exitosamente.
curl_close($ curl);? //Cierre los recursos de cURL y libere los recursos del sistema.
PHP (mbth: PHP: preprocesador de hipertexto, nombre chino: preprocesador de hipertexto) es un lenguaje de programación de código abierto general. La sintaxis absorbe las características del lenguaje C, Java y Perl, lo que favorece el aprendizaje y es ampliamente utilizado. Es principalmente adecuado para el campo del desarrollo web. La sintaxis única de PHP es una combinación de C, Java, Perl y la sintaxis propia de PHP. Puede ejecutar páginas web dinámicas más rápido que CGI o Perl.
En comparación con otros lenguajes de programación, las páginas dinámicas producidas por PHP incorporan el programa en el documento HTML (una aplicación bajo el lenguaje de marcado universal estándar) para su ejecución, y la eficiencia de ejecución es mucho mayor que la de CGI. que genera completamente etiquetas HTML. PHP también puede ejecutar código compilado, lo que puede cifrar y optimizar la ejecución del código, haciendo que el código se ejecute más rápido.
Materiales de referencia:
PHP (preprocesador de hipertexto) -Enciclopedia Baidu