Red de conocimientos turísticos - Conocimientos sobre calendario chino - ¿Por qué no puedo crear un nuevo sitio web usando Locomotive Collector?

¿Por qué no puedo crear un nuevo sitio web usando Locomotive Collector?

Introducción a los recopiladores

Los recopiladores que existen actualmente en el mercado generalmente se dividen en tres tipos: CMS integrado, escrito en lenguaje de red, y uno desarrollado en base al framework .net. Así los clasifico yo. /p> p>

En términos de función y comparación de rendimiento, el recopilador .NET y el recopilador .NET son mejores. Dongyi, Xinyun, ecms, dede, este tipo de recopilador se integra muy bien con cms. Sin embargo, debido a algunos defectos de rendimiento de php y asp, parece que no puede manejar grandes conjuntos de datos de interés.

También hay un recolector que es independiente de cms. Los representativos son Little Bee y SK. Este recolector es particularmente independiente de cms, en comparación con el recolector de cms incorporado. En comparación con cms, las funciones integradas de cms son más potentes, pero cuando se lanza este tipo de recopilador, generalmente se usa para escribir directamente en la base de datos, lo que generalmente es difícil de operar para los usuarios que no comprenden la estructura de la base de datos.

El tercer tipo está escrito en lenguaje. La mayoría de los recopiladores están escritos en base al marco .net y también están escritos en vb. El más representativo de este tipo es Locomotive. La flexibilidad es lo mejor y es altamente escalable. Por ejemplo, Locomotive se puede publicar en la web o escribirse directamente en la biblioteca, y también existe la conversión de la base de datos

en la elección del recopilador. No solicite una reunión plenaria, solo solicite refinamiento. Personalmente, recomiendo aprender un recopilador como Locomotive. Si puede usarlo, comprenderlo y aprovecharlo al máximo, básicamente ya no será un obstáculo en la recopilación de datos. .

Ahora hablemos de los problemas a los que debes prestar atención al usar el recopilador.

En primer lugar, debemos tener una cierta base HTML, es decir, debemos comprender el mínimo. código html, porque esto le ayudará a analizar el contenido del área de destino.

Además, recuerde no ser completamente supersticioso con respecto al contenido recopilado. Es mejor editarlo o modificarlo una segunda vez. Esto ayudará a los motores de búsqueda a determinar si su contenido está completamente reflejado y también ayudará. múltiples usuarios del mismo contenido. Reutilización del sitio web

Muchos webmasters dicen que sus basureros no se han movido al sitio K. ¡La mayoría de las razones se deben a la naturaleza repetitiva del contenido!

Aunque la recopilación puede mejorar la eficiencia de la creación de su sitio web en ciertos procedimientos, también aumentará su inutilidad. Además de una gran cantidad de copias repetidas, es perjudicial para usted y otros webmasters.

Los motores de búsqueda están de acuerdo con copiar, pero no pueden copiarlo por completo.

Específicamente, puede pensar en ello. Demasiado contenido idéntico ocupará mucho espacio de datos. Lo mismo ocurre con los motores de búsqueda, por lo que utilizarán algunos medios para eliminar la mayor parte del contenido duplicado. son algunos consejos para el contenido recopilado

En primer lugar, se deben realizar las modificaciones apropiadas en la organización del contenido de la página, como palabras clave en la descripción del título, etc.

Para los principales contenido de la página, no copie las plantillas de otras personas, rediseñe usted mismo. Si es div css, puede cambiar la clase de identificación y el nombre.

Para ciertas palabras clave de contenido, use collection La función de reemplazo de. el recopilador, además de algunos códigos modificados, como

target, hay un dicho que dice que después de repetidos ejercicios, en el proceso de crear las reglas del recopilador, puede usar lt;stronggt;drilllt;/stronggt;

Algunas técnicas similares

Personalmente no recomiendo el uso de plantillas publicadas por otros. Las plantillas duplicadas y el contenido duplicado darán como resultado K o efectos de inclusión desastrosos.

Está bien, no mucho más. , hablemos de la locomotora

Sí, déjame agregar, no acumule para la recolección

La estación de basura es solo un sustantivo, no un adjetivo. Tu estación puede llamarse basura. estación, pero es mejor no usar contenido. Si es así, es mejor hacer otra cosa y no perder el tiempo.

Estoy hablando de Train Conductor 3.01, porque el último 3.1 tiene un error en la recopilación. imágenes

El contenido de Ten Thousand Pieces son datos completamente reflejados, que ocupan el segundo lugar en el contenido de Thousand Pieces. La clasificación y la inclusión son cosas completamente diferentes.

De lo que estoy hablando. Se trata solo de experiencia personal, no de hechos.

Locomotive Hay varios errores que aún no se han solucionado. Yo digo:

No elimines la lista de tareas, de lo contrario no podrás. para conectarse en línea como el nuevo sitio.

De esta manera, no se pueden agregar nuevos sitios y tareas entrantes

La función de proxy parece ser básicamente ineficaz en algunos entornos para descargar imágenes y otros datos

Bien, primero haga clic en la opción de sitio web. Crear un nuevo sitio web, tome China News Network como ejemplo

Escriba el nombre del sitio web y haga clic en Guardar. Si la mayoría de las plantillas de canal en el sitio web son exactamente iguales. Primero puede formular reglas de recopilación de contenido. Si las plantillas de la mayoría de los canales de este sitio son exactamente iguales, primero puede formular reglas de recopilación de contenido. De esta forma, las nuevas tareas creadas en el directorio de este sitio heredarán las reglas de contenido de este sitio.

Haga clic en China News Network, haga clic con el botón derecho, cree una nueva tarea desde el sitio y aparecerá la ventana de tareas.

Cree un nuevo nombre de tarea

Haga clic en el asistente para agregar, usamos el canal de entretenimiento de China News Network como ejemplo. Debido a que el canal de entretenimiento es una lista de una sola página, agregue /entertainment.shtml a una sola URL, haga clic en Agregar y luego haga clic en Listo. Añadir.

El ejemplo de publicación es como se muestra arriba

Si la página de la lista es una URL de varias páginas,

Escriba

Para asegurarse Para que la lista sea correcta, debe

abrir el código fuente de la lista y encontrar el código de inicio y el código final de la lista en /entertainment.shtml

Es mejor usar unicidad, es decir, la no repetibilidad del código

Para garantizar que la lista sea correcta, debe agregar el código fuente de la lista a la lista. Lo mejor es usar unicidad, es decir, que el código no se repita

Haz clic en Iniciar prueba y aparecerá una nueva ventana

Evalúa la corrección de la lista, y si es correcta , puede escribir reglas de contenido

p>

Seleccione la dirección de cualquier página de contenido, haga clic derecho en ella para ingresar a la prueba de reglas

Abra también la dirección de la página en IE

Lo primero que debe hacer es definir el título Reglas para el título

En el encabezado del título, debe definir las reglas para el título.

p>

Hay un pequeño truco en la definición de títulos, es decir, en términos generales lt; titlegt;/titlegt; to lt; titlegt; La nueva historia de amor de Jolin Tsai expuesta - xxxx Entertainment Networklt;/titlegt;

Simplemente establezca el código final del título en -. p>

Las reglas de contenido pueden encontrar directamente el comienzo del código final, lo que permite la no unicidad

Hay otra pregunta que debe explicarse

Si hay lt; el código de la página web! --Yc94EUEtAn4YSUKCaSOM--gt; Los códigos similares deben excluirse primero en la etiqueta de contenido; de lo contrario, afectará el efecto de recopilación.

La función de exclusión en la etiqueta de contenido es muy débil. Personalmente, recomiendo agregar el código de exclusión. manualmente, como

lt;Table(*)gt;Excluir todos los códigos que comienzan y terminan con # en la tabla. gt; al final del código completo

Otros similares

Si quieres descargar las imágenes y el flash de la página de contenido, recuerda hacer clic

para automáticamente cámbielo a un nombre de archivo aleatorio, haga lo que quiera

De hecho, las reglas de producción en Locomotive son muy simples. Lo único a lo que debe prestar atención es la paginación

Todo lo enumerado. consulte 1, 2, 3, 4, 5, 6, etc.

Este tipo de número de página

Los que aparecen a continuación son la página de contenido de la página anterior y la página de contenido de la página siguiente

Lo sentimos, el contenido de noticias de China News Network es muy escaso. paginado Espérame Encuentra una paginación de contenido

Bien, /news/200703/18937.html Inicio automático

Veamos el código de paginación de esta página

lt; p align=rightgt;lt;a href=18937-2.htmlgt;gt;gt;Nextlt;/agt;lt;/pgt;lt;p align=centergt;[Página 1]lt;a href=18937 -2 .htmlgt;[página siguiente]lt;/agt;lt;/pgt;

Debido a que es un modo mixto, utilizamos el modo listar todo

Código de inicio

lt;p align= rightgt;

Código final htmlgt;[siguiente página]lt;/agt;lt;/pgt;

o [siguiente]lt; /agt ;lt;/pgt;

Parte de la paginación de contenido se captura en [next]lt;/agt;lt;/p gt;, que formará una colección repetida de páginas de contenido, por lo que htmlgt .[ next]lt;/agt;lt;/pgt;;[next]lt;/agt;lt;/pgt;, destruye su enlace, para que la locomotora ignore este enlace al analizar la paginación

Regrese a la conexión a continuación, lo que significa que la colección de páginas de contenido es la página completa, sin paginación

La función personalizada es el identificador de paginación cms que puede establecer el destino de importación

Por ejemplo, algunos cms La paginación es lt.-next-page-gt;lt;/pgt;, mientras que la paginación de algunos CMS es lt.-next-page-gt;lt;/pgt;;-next page-gt ; para que pueda configurar

Las páginas de contenido recopiladas de esta manera agregarán automáticamente etiquetas de paginación

Esto es principalmente para los foros recopilados. Seleccione las etiquetas de contenido que deben coincidir en un bucle. y puede enviar los foros recopilados nuevamente a las publicaciones.

Básicamente, las reglas de producción son estas, y luego la publicación de datos

La publicación de datos generalmente recomienda la publicación web en línea, que generalmente se usa más. en todas las publicaciones

Se pueden descargar módulos de inicio de sesión específicos desde el foro de locomotoras

Algunos módulos descargados no se pueden iniciar sesión. Puede utilizar el navegador integrado de la locomotora para iniciar sesión. El efecto es el mismo si inicias sesión usando el navegador integrado de la motocicleta y luego tomas cookies

Agrega un poco a las imágenes recopiladas, flash y otro contenido

Haz clic con el botón derecho la tarea y seleccione la configuración avanzada de la tarea

Este es el punto clave

Esta es la dirección del enlace de la imagen enviada a cms. Generalmente es mejor escribir una dirección absoluta

Por ejemplo, la dirección del sitio de destino es

upimg se establece en la carpeta guardada relativa de la imagen

Y /upimg/ debe configurarse en

Recuerde terminar con /. Las imágenes recopiladas por algunas personas no se muestran correctamente porque no hay ninguna configuración aquí.

También hay una función de actualización automática en la configuración avanzada.

Utilice esta función. Actualización automática, utilice esta función, agregue algunas listas que se actualicen periódicamente y publique el cms que genera páginas estáticas al mismo tiempo, para que el sitio web pueda realizar actualizaciones automáticas por completo.

Esto debe ser estudiado por tú mismo