Red de conocimientos turísticos - Pronóstico del tiempo - ¿Qué son exactamente los reptiles? ¿Son ilegales los reptiles? Sobre el concepto de reptiles

¿Qué son exactamente los reptiles? ¿Son ilegales los reptiles? Sobre el concepto de reptiles

Esta pregunta me molestó durante mucho tiempo cuando no estaba en este campo y me confundió mucho acerca de qué son los reptiles. ¿Es una herramienta física? No fue hasta que aprendí Python y lo analicé en profundidad que descubrí su misterio.

¿Qué son los reptiles? Los reptiles incluyen reptiles simples y reptiles complejos. De hecho, un rastreador simple es un script, un programa o script que rastrea automáticamente información en la World Wide Web de acuerdo con ciertas reglas.

Los scripts son relativamente toscos, pero a menudo son pequeños programas muy prácticos (generalmente no más de unos pocos miles de líneas, a veces constan de cientos o docenas de líneas de código). Para dar un ejemplo sencillo, ahora desea ver información sobre el alquiler de apartamentos para estudiantes desde un sitio web de alquiler para estudiantes. Definitivamente no es realista copiarlos uno por uno. Entonces tenemos que usar reptiles. Puede extraer miles de mensajes de un sitio web de información a la vez. Los motores de búsqueda como Baidu y Google también pueden considerarse rastreadores, pero esta tecnología es muy compleja y no es un simple script.

¿Cómo funcionan los motores de búsqueda? De hecho, a través de la tecnología de rastreo web, decenas de miles de millones de páginas web en Internet se guardan localmente para formar archivos de imágenes, que brindan soporte de datos para todo el motor de búsqueda.

Esta tecnología implicará en primer lugar una cuestión muy importante que preocupa a todos: ¿es ilegal?

Después de una exploración cuidadosa, hemos llegado a las siguientes opiniones:

1. Cumplir con el acuerdo del robot, pero que haya un robot no significa que pueda gatear casualmente.

2. Limite el comportamiento de su rastreador y prohíba la frecuencia de solicitudes cercanas a DDOS. Una vez que el servidor está paralizado, es equivalente a un ataque a la red;

3. No se puede acceder a una página que obviamente es anti-rastreo o a la que no se puede acceder en circunstancias normales; de lo contrario, es un acto de pirata informático;

4. Vigila con atención Al subir cosas, nunca toques la línea roja de la ley.

Llegado a este punto, debes entender que los rastreadores en sí no son ilegales, pero depende de cómo y para qué los utilices, así como de su uso comercial.