Utilice PHP HTML DOM simple para obtener el nombre de datos especificado y el enlace en la página web
1
2 include_once 'simple_html_dom.php';
3 //Obtener los datos html en un objeto
4 $html = file_get_html ('/tv-type-id-5-pg-1.html');
5 //En orden alfabético lista de A-Z Cada dato está en la etiqueta class= letter-focus-item dl en el div id=letter-focus Utilice el método de búsqueda para encontrarlo
6 $listData =$html->find(. "#letter -focus .letter-focus-item");//$listData es un objeto de matriz
7 foreach($listData as$key=>$eachRowData){
8 $ filmName =$eachRowData->find("dd span",0)->plaintext; //obtiene el nombre de la película o película
9 $filmUrl=$eachRowData->find("dd a", 0)->href;//obtener la dirección de la película o película correspondiente bajo la etiqueta dd
10 //Obtener los detalles de la película
11 $filmInfo =file_get_html( "".$filmUrl);
12 $filmDetail=$filmInfo->find(".info dl");
13 foreach($filmDetail as $film) { p>
14 $info=$film->find(".dd");
15 $row=null;
16 foreach($info como $childInfo) {
17 $row[]=$childInfo->texto sin formato;
18 }
19 $cate[$key ][]=unirse (", ",$row); // Almacena información de películas y TV en una matriz
20 }
21 }
Después de Simple_html_dom, puedes Ver listados de información de películas y TV y contenido en listados de películas y TV en .com. com para capturar la información de la lista de películas y TV y la información específica de la película y el TV, y luego puede continuar capturando la película y el TV. Después de eso, puede continuar capturando la información de la dirección del video en la página detallada y luego. almacene toda la información sobre la película o TV en la base de datos.
Los siguientes son algunos atributos y métodos comunes de simple_html_dom:
1 $html = file_get_html('/tv-type-id-5-pg-1.html');
p>2 $e = $html->find("div", 0);
3 //etiquetas
4 $e->etiqueta;
5 //texto externo
6 $e->texto exterior;
7 //texto interior
8 $e->texto interior;
9 //texto sin formato
10 $e-> ; texto sin formato;
11 //elemento hijo
12 $e->hijos ( [int $index] );
13 //elemento padre
14 $e->parent ();
15 //primer elemento hijo p>
16 $e ->first_child();
17 //último elemento hijo
18 $e->last_child();
19 // último elemento hermano
20 $e->next_sibling();