¿Qué son los datos vinculados? ¿Qué ventajas tiene frente a las bases de conocimiento tradicionales?
Datos vinculados
El significado literal es datos conectados. Tim
Una introducción al blog de Berners-Lee. Desde la perspectiva del desarrollo de redes, "Net" o "Internet" es una red de comunicación de larga distancia formada por computadoras directamente a través de cables de red. o Es "world
wide
web", que es la interconexión directa de archivos en la computadora. El siguiente paso en el desarrollo de la red es realizar la interconexión directa de datos en archivos, que son los llamados "datos vinculados
".
Tim cree que este es uno de los enlaces básicos de la web
3.0 que imagina. En otras palabras, la interconexión directa de datos permite a la computadora "comprender" la semántica del archivo. Diferentes escuelas han propuesto diferentes métodos para lograrlo. Una práctica común en la actualidad es simplemente marcar cada entidad en un archivo de página web con metadatos (un ejemplo fácil de entender es que la parte "título" de un artículo está marcada con título y la parte "autor" está marcada con autor). Luego, estableciendo RDF y la ontología (RDF puede entenderse como un modelo de relación de oración como sujeto, predicado y objeto. En cuanto a la ontología, entiendo que es un modelo de relación universal entre sistemas de datos. Puede que no lo entienda correctamente, pero no intentes ir a Baidu, he probado esta palabra...) para mostrar la relación entre entidades marcadas por diferentes metadatos
(realmente no soy un estudiante técnico, así que no puedo explícalo en detalle).
Esto es muy importante para construir la "web
semántica" (es decir,
Web Semántica) o incluso la ahora muy popular "la
p>Internet
de
cosas”
(es decir, Internet de las cosas)
tiene un significado importante. Esto ha sacado a relucir muchos conceptos nuevos, como la Web Semántica y el Internet de las Cosas, pero esto está un poco alejado de la pregunta principal. Utilizaré un ejemplo de búsqueda semántica para ayudar a explicarlo a continuación. Sabemos que los principales motores de búsqueda actuales son motores de búsqueda de palabras clave. Se puede decir que el núcleo de la idea de implementación de este tipo de motor está inspirado en la recuperación de índice en la gestión inicial de la biblioteca. en Internet con antelación. El contenido de la página web se utiliza como índice y se almacena en la base de datos junto con la URL y otra información.
Por ejemplo, cuando el usuario introduce una frase de búsqueda, como "manzana", debido a que la máquina no puede determinar si "manzana" se refiere a una fruta o a una empresa Apple, buscará la palabra " apple" en la base de datos. Las páginas web se devuelven al usuario. Si la búsqueda de entrada es una oración,
Por ejemplo, "teléfono móvil de Apple", el motor de búsqueda actual aún no puede determinar que "teléfono móvil de Apple" se refiere específicamente al teléfono móvil de Apple, y una gran parte del Los resultados devueltos serán una página web que contiene palabras clave como "Apple" y "teléfono móvil" (las páginas web que contienen la palabra clave "teléfono móvil de Apple" también aparecerán en los resultados y pueden aparecer en la parte frontal debido a algunos algoritmos de optimización). para que parezca que los motores de búsqueda saben que estás buscando "iPhone").
Cuando la búsqueda del usuario se vuelve complicada, como el "teléfono Apple" mencionado anteriormente
(De hecho, no es complicado. Lo realmente complicado es: quién entre mis amigos es ¿Adecuado? Sé mi novia...), se revela el papel de los datos vinculados. Sí, a través de la anotación de metadatos y el modelo relacional RDF mencionado anteriormente, la máquina puede entender que cuando "Apple" y "teléfono móvil" aparecen juntos, se refiere en gran medida a "teléfono móvil de Apple". Cuando se conectan más datos, se formará un enorme gráfico de conocimiento. Un ejemplo de la vida real es el gráfico de conocimiento de Google. Se recomienda subir una escalera y tomar. una mirada.
Si agregamos las relaciones sociales de una persona y su participación en las redes sociales, podemos optimizar aún más los resultados de la búsqueda (juzgarnos a nosotros mismos y los intereses y pasatiempos de nuestros amigos y usar esto como base para filtrar los resultados, etc.) y ayudarme a encontrar con éxito. una novia. Bueno, esta es la intención original al escribir mi tesis de graduación, pero la pregunta está un poco fuera de tema.
En resumen,
los datos
vinculados son un medio básico para lograr inteligencia artificial. Una ventaja en comparación con las bases de conocimiento tradicionales es que pueden realizar una inteligencia más precisa. recuperación. Se aceptan discusiones, adiciones y correcciones.