Red de conocimientos turísticos - Conocimientos sobre calendario chino - Utilice PHP HTML DOM simple para obtener el nombre de datos especificado y el enlace en la página web

Utilice PHP HTML DOM simple para obtener el nombre de datos especificado y el enlace en la página web

Obtener los datos de la lista en la página y la información en el contenido

1

2 include_once 'simple_html_dom.php';

3 //Obtener los datos html en un objeto

4 $html = file_get_html ('/tv-type-id-5-pg-1.html');

5 //En orden alfabético lista de A-Z Cada dato está en la etiqueta class= letter-focus-item dl en el div id=letter-focus Utilice el método de búsqueda para encontrarlo

6 $listData =$html->find(. "#letter -focus .letter-focus-item");//$listData es un objeto de matriz

7 foreach($listData as$key=>$eachRowData){

8 $ filmName =$eachRowData->find("dd span",0)->plaintext; //obtiene el nombre de la película o película

9 $filmUrl=$eachRowData->find("dd a", 0)->href;//obtener la dirección de la película o película correspondiente bajo la etiqueta dd

10 //Obtener los detalles de la película

11 $filmInfo =file_get_html( "".$filmUrl);

12 $filmDetail=$filmInfo->find(".info dl");

13 foreach($filmDetail as $film) {

14 $info=$film->find(".dd");

15 $row=null;

16 foreach($info como $childInfo) {

17 $row[]=$childInfo->texto sin formato;

18 }

19 $cate[$key ][]=unirse (", ",$row); // Almacena información de películas y TV en una matriz

20 }

21 }

Después de Simple_html_dom, puedes Ver listados de información de películas y TV y contenido en listados de películas y TV en .com. com para capturar la información de la lista de películas y TV y la información específica de la película y el TV, y luego puede continuar capturando la película y el TV. Después de eso, puede continuar capturando la información de la dirección del video en la página detallada y luego. almacene toda la información sobre la película o TV en la base de datos.

Los siguientes son algunos atributos y métodos comunes de simple_html_dom:

1 $html = file_get_html('/tv-type-id-5-pg-1.html');

p>

2 $e = $html->find("div", 0);

3 //etiquetas

4 $e->etiqueta;

5 //texto externo

6 $e->texto exterior;

7 //texto interior

8 $e->texto interior;

9 //texto sin formato

10 $e-> ; texto sin formato;

11 //elemento hijo

12 $e->hijos ( [int $index] );

13 //elemento padre

14 $e->parent ();

15 //primer elemento hijo

16 $e ->first_child();

17 //último elemento hijo

18 $e->last_child();

19 // último elemento hermano

20 $e->next_sibling();