¿Por qué son diferentes los resultados de diferentes motores de búsqueda?
De hecho, es probable que los resultados del mismo motor de búsqueda en diferentes momentos sean diferentes.
Respuesta detallada:
El llamado motor de búsqueda es un sistema de software que proporciona una interfaz web. Envíe una palabra o frase a través del navegador y rápidamente devolverá una lista de resultados que pueden estar relacionados con la entrada del usuario.
Aquí está el truco:
Cuando un usuario envía una consulta, los motores de búsqueda no "buscan" inmediatamente en la web, no encuentran esas páginas relevantes y le presentan al usuario una lista de resultados. En lugar de ello, se "recopilan" varias páginas web de antemano y se almacenan de alguna manera en el sistema. En este momento la búsqueda es sólo dentro del sistema.
De hecho, los motores de búsqueda modernos generalmente adoptan un flujo de trabajo de tres etapas: recopilación de páginas web, preprocesamiento y servicios de consulta. Son tres subsistemas relativamente independientes.
Recopilación de páginas web: El método más sencillo y tosco es rastrear todas las páginas web y almacenarlas. Pero esto no es realista. Primero, las páginas web masivas son dinámicas. Algunos estudios han señalado que el ciclo de vida medio de 50 páginas web es de unos 50 días (J. CHO, "Crawling: Discovery and Maintenance of Large-scale Web Data", PhD, Stanford University, 2002. En segundo lugar, el coste). de rastrear todas las páginas web es relativamente alto. Por lo tanto, generalmente se adopta la estrategia de rastrear páginas web dinámicamente: recopilación regular o recopilación incremental o ambas (esto implica la puntualidad de las actualizaciones de la página web).
También hay situaciones en las que algunas páginas web se pueden encontrar en un motor de búsqueda pero no en otro, y entonces los usuarios sentirán que diferentes motores de búsqueda encontrarán cosas diferentes.
Preprocesamiento: incluye: ① extracción de palabras clave; ② eliminación de páginas web duplicadas o reimpresas; ③ análisis de enlaces;
La importancia de una página web tiene mucho que ver con la lista de resultados relacionados con la consulta del usuario, pero como se forma en la etapa de preprocesamiento, no tiene nada que ver con la consulta del usuario. ¿Cómo podemos reflejar la importancia de una página web? Generalmente se cree que "cuantas más citas, más importantes", al igual que las referencias. PageRank, la tecnología central creada por Google, es la encarnación exitosa de esta idea (Sepandar Kamwal, Taher Haveliwala, Jean Golub, método adaptativo para calcular Pagerank, álgebra lineal y sus aplicaciones 386(2004)51–65. Hay varias búsquedas públicas Si está interesado, puede consultar los artículos sobre tecnología de motores.
Por supuesto, hay otros indicadores importantes
Servicios: que incluyen: ① Modo de consulta y coincidencia. ② Ordenar resultados; ③ Revisión de literatura
Modo de consulta y coincidencia, para los usuarios comunes, la forma más natural es "buscar lo que quieran". Por ejemplo, si también ingresa "Tsinghua" o cualquier otro. Es posible que otros estudiantes de exámenes de ingreso a la universidad solo quieran buscar información sobre el examen de ingreso a la universidad, y los académicos pueden querer buscar algunas noticias sobre Tsinghua (solo adiviné al azar, pero ¿cómo saben los motores de búsqueda lo que quieren?). quieren? más rápido lo que desea (esto también depende del algoritmo de procesamiento del lenguaje natural).
Después de que el usuario envía el término de consulta, el motor de búsqueda obtendrá un conjunto de resultados de la consulta basados en la correlación entre los términos de la consulta. y el resultado de la consulta, combinado con los indicadores de importancia relacionados con los distintos resultados mencionados anteriormente, para formar la clasificación final de los resultados de búsqueda.
Por lo tanto, diferentes motores de búsqueda implican diferentes tecnologías y algoritmos, y los resultados de la búsqueda. ser diferente.
p>
Además, los motores de búsqueda como Google y Baidu no solo proporcionan resultados de clasificación de forma gratuita, sino que también tienen sus propios programas de clasificación de ofertas que solo cobran por clic. Los programas incorporan anuncios en los resultados devueltos por los motores de búsqueda.
Nota: Lo anterior es solo el análisis más simple del principio de funcionamiento de los motores de búsqueda. No incluye varios motores de búsqueda ni analiza la situación de los servidores distribuidos (listas devueltas al mismo tiempo). mismo término de búsqueda en el mismo motor de búsqueda puede tener resultados diferentes). Contenido reproducido de:/question/22739929