¿Qué es la tecnología de big data?
Gran cantidad de datos. La primera característica es la gran cantidad de datos, incluida la recopilación, el almacenamiento y el cálculo. La unidad de medida inicial para big data es al menos P (1000 t), E (100 millones de t) o Z (100 millones de t).
Existen muchas variedades. La segunda característica es la diversidad de tipos y fuentes. Incluyendo datos estructurados, semiestructurados y no estructurados, específicamente en forma de registros web, audio, video, imágenes, información de ubicación geográfica, etc. Varios tipos de datos plantean mayores requisitos para las capacidades de procesamiento de datos.
Baja densidad de valor. La tercera característica es que la densidad de los valores de los datos es relativamente baja, o se puede decir que la arena es arrastrada por las olas, lo cual es sumamente valioso. Con la aplicación generalizada de Internet y la Internet de las cosas, la percepción de la información es ubicua, con información masiva pero baja densidad de valor. Cómo combinar la lógica empresarial y potentes algoritmos automáticos para extraer valor de los datos es el problema más apremiante en la era del big data.
Rápido, alta velocidad. La cuarta característica es que los datos crecen rápidamente, la velocidad de procesamiento es rápida y los requisitos de puntualidad son altos. Por ejemplo, los motores de búsqueda requieren que los usuarios consulten noticias de hace unos minutos, y los algoritmos de recomendación personalizados requieren recomendaciones en tiempo real tanto como sea posible. Esta es una característica importante del big data que la diferencia de la minería de datos tradicional.