¿Qué framework de rastreo de Python es fácil de usar?
Marco de rastreo general de Python
1) Scrapy: un potente marco de rastreo que puede satisfacer el rastreo de páginas simple (por ejemplo, puede conocer claramente la URL). patrón) . Con este marco, puede rastrear fácilmente datos como la información de productos de Amazon. Pero para páginas un poco más complejas, como la información de las páginas de Weibo, este marco no puede satisfacer las necesidades.
2) Crawley: captura el contenido del sitio web correspondiente a alta velocidad, admite bases de datos relacionales y no relacionales, y los datos se pueden exportar a JSON, XML, etc.
3) Portia: Captura visual de contenido web
4) Reportero: Extractos de noticias, artículos y análisis de contenido.
5) Python-Goose: una herramienta de extracción de artículos escrita en Java.
6) Meitang: Conocido, integra los requisitos de algunos rastreadores de uso común. Desventaja: no se puede cargar JS.
7) Mecanización: Ventajas: Se puede cargar JS. Desventajas: Falta mucha documentación. Sin embargo, a través de ejemplos oficiales y métodos probados con carne humana, apenas funciona.
8) Selenium: Es un controlador que llama al navegador. A través de esta biblioteca, puede llamar directamente al navegador para completar algunas operaciones, como ingresar un código de verificación.
9) cola: un framework de rastreo distribuido. El diseño general del proyecto es un poco malo y el acoplamiento entre módulos es alto.
Fuente: enlace de Internet
Espero que mi respuesta te sea útil~