Red de conocimientos turísticos - Lugares de interés turístico - ¿Qué framework de rastreo de Python es fácil de usar?

¿Qué framework de rastreo de Python es fácil de usar?

Para ser honesto, se siente lo mismo. Cada uno tiene sus pros y sus contras ~

Marco de rastreo general de Python

1) Scrapy: un potente marco de rastreo que puede satisfacer el rastreo de páginas simple (por ejemplo, puede conocer claramente la URL). patrón) . Con este marco, puede rastrear fácilmente datos como la información de productos de Amazon. Pero para páginas un poco más complejas, como la información de las páginas de Weibo, este marco no puede satisfacer las necesidades.

2) Crawley: captura el contenido del sitio web correspondiente a alta velocidad, admite bases de datos relacionales y no relacionales, y los datos se pueden exportar a JSON, XML, etc.

3) Portia: Captura visual de contenido web

4) Reportero: Extractos de noticias, artículos y análisis de contenido.

5) Python-Goose: una herramienta de extracción de artículos escrita en Java.

6) Meitang: Conocido, integra los requisitos de algunos rastreadores de uso común. Desventaja: no se puede cargar JS.

7) Mecanización: Ventajas: Se puede cargar JS. Desventajas: Falta mucha documentación. Sin embargo, a través de ejemplos oficiales y métodos probados con carne humana, apenas funciona.

8) Selenium: Es un controlador que llama al navegador. A través de esta biblioteca, puede llamar directamente al navegador para completar algunas operaciones, como ingresar un código de verificación.

9) cola: un framework de rastreo distribuido. El diseño general del proyecto es un poco malo y el acoplamiento entre módulos es alto.

Fuente: enlace de Internet

Espero que mi respuesta te sea útil~

上篇: ¿Cuáles son los requisitos del Documento No. 5 de 2015? 下篇: El día propicio para la mudanza de mi esposo en mayo de 2012 es el 28 de febrero de 1987. Mi esposa es un conejo y mi esposa es una casa de tigres con la puerta orientada al norte el 14 de mayo de 1986.