Comparación de tablas de uso común para verbos (abreviatura de verbo) (20191209-15)
Tome "objetivo de visualización → preparación del conjunto de datos → selección y comparación de gráficos → resumen de experiencia" como ejemplo de comparación.
Similitudes:
La estructura de datos de histogramas y gráficos de barras consta de "un campo categórico + un campo numérico continuo".
Cuando el número de registros de datos no supera los 12 y la longitud de caracteres del campo categórico es inferior a 5, los histogramas y los gráficos de barras son intercambiables.
Diferencia:
Histograma: si el campo de clasificación es "series de tiempo", se recomienda utilizar un histograma en este momento, porque el histograma puede reflejar mejor los cambios en los datos. con el tiempo.
Gráfico de barras: Si el campo de clasificación tiene caracteres largos y el número de registros es mayor a 12, se recomienda utilizar un gráfico de barras. Por un lado, la cursiva va en contra de los hábitos de lectura del usuario, pero también ocupa espacio en la página, afectando la estética del gráfico visual.
Similitudes:
Las estructuras de datos de los histogramas y los histogramas son barras cilíndricas, con "un campo de clasificación/agrupación + un campo numérico continuo".
Diferencia:
El propósito del análisis es diferente al escenario aplicable. El "histograma" se utiliza principalmente para comparar el tamaño de los datos y el "histograma" se utiliza para mostrar la distribución de los datos.
Los atributos de datos mapeados en el eje x son diferentes. En un histograma, las variables en el eje X son datos categóricos; en un histograma, hay intervalos de agrupación continuos en el eje X, generalmente representados por números, y generalmente el espaciado entre grupos es el mismo.
Ancho significa cosas diferentes: en un histograma, el ancho de la columna no tiene significado práctico y requerirá el mismo ancho; en un histograma, el ancho de la columna representa la longitud del intervalo (es decir, intervalo; ). Dependiendo del intervalo, el ancho de la columna puede ser diferente, pero en principio debería ser un múltiplo entero del intervalo.
El tamaño de los datos se representa de diferentes maneras: histograma, que asigna el tamaño de los datos por la altura de las barras, con intervalos entre las barras; el histograma se representa por la altura (histograma de frecuencia) o el área (histograma de frecuencia). El tamaño de los datos, las columnas están estrechamente conectadas sin espacios.
Similitudes:
Tanto los histogramas apilados como los histogramas apilados porcentuales son adecuados para mostrar comparaciones de componentes de datos categóricos o tendencias en componentes a lo largo del tiempo.
Cuando los datos asignados al eje X son una serie de tiempo, puede utilizar un gráfico de áreas apiladas o un gráfico de áreas apiladas porcentuales.
Diferencia:
Histograma apilado: no solo puede comparar las diferencias numéricas de cada componente, sino también observar la diferencia general de cada conjunto de datos.
Histograma porcentual apilado: solo puede comparar la diferencia de proporción de cada componente en el conjunto, pero no puede comparar la diferencia entre diferentes conjuntos.
Los gráficos de líneas y los gráficos de áreas no son intercambiables: al mostrar componentes o proporciones, ¿debería utilizar un gráfico de áreas? Gráfico de áreas apiladas o gráfico de áreas apiladas porcentuales.
Similitudes:
Los gráficos de líneas y de áreas muestran la tendencia de los cambios de datos a lo largo del tiempo, por lo que el tipo de datos asignado al eje X generalmente es "hora/fecha". Ambos pueden mostrar la relación entre una o más variables y el tiempo, incluidos cambios cíclicos, cambios estacionales, fluctuaciones anormales, etc. En la mayoría de los casos, los gráficos de líneas y los gráficos de áreas son intercambiables.
Diferencia:
Gráfico de líneas: asigna el tamaño del valor a través de la ordenada del punto de datos. Generalmente solo se usa para representar la tendencia de los datos.
Gráfico de áreas: El tamaño del valor numérico se asigna según el área. Además de reemplazar el gráfico de líneas, el gráfico de áreas también se puede utilizar para mostrar la tendencia del conjunto y sus componentes a lo largo del tiempo.
Nota: Cuando utilice un gráfico de áreas para representar tendencias en varias series, debe establecer la transparencia para los colores de los bloques de áreas que representan diferentes series. La transparencia puede reducir la superposición entre diferentes series y ayudarnos a ver relaciones superpuestas y más información entre diferentes series. Cuando hay demasiados valores de series en un gráfico, el gráfico de líneas será más intuitivo que el gráfico de áreas porque reduce la cobertura y la superposición de las series y puede ver claramente los cambios de tendencia de cada serie.
Similitudes:
Tanto los gráficos de áreas apiladas como los gráficos de áreas apiladas porcentuales son series de tiempo asignadas al eje x.
Puede mostrar la tendencia cambiante de cada componente a lo largo del tiempo, pero el "Gráfico de áreas apiladas" muestra la tendencia cambiante del valor real del componente a lo largo del tiempo, y el "Gráfico de áreas apiladas porcentuales" muestra la proporción del componente a lo largo del tiempo.
Diferencia:
Gráfico de áreas apiladas: no solo puede mostrar la tendencia cambiante de cada componente a lo largo del tiempo, sino también la tendencia cambiante general a lo largo del tiempo.
Gráfico de área apilada porcentual: solo puede mostrar el cambio de la proporción de cada componente en el conjunto a lo largo del tiempo, pero no puede observar la tendencia de cambio del conjunto a lo largo del tiempo. Cortado verticalmente desde cualquier nodo de tiempo, la suma de las proporciones de cada parte es 100%, que es igual a todo el nodo.
Similitudes:
Los formatos de conjunto de datos de los gráficos de áreas apiladas y los gráficos de columnas apiladas son similares: ambos constan de "un campo categórico + múltiples campos numéricos continuos", y múltiples campos numéricos continuos son partes integrantes de un todo.
Ambos pueden observar el valor general de un nodo y los valores específicos de cada componente, y ambos tienen la función de comparación de datos.
Diferencia:
Gráfico de áreas apiladas: un campo categórico para un gráfico de áreas apiladas, generalmente una serie de tiempo. Cuando necesite analizar la tendencia general de cambio a lo largo del tiempo y comprender los cambios en cada componente del conjunto a lo largo del tiempo, debe utilizar un gráfico de áreas apiladas. Como puede verse por su propósito, los campos categóricos (es decir, series de tiempo) del gráfico de áreas apiladas están organizados en orden cronológico.
Histograma apilado: el campo categórico del histograma apilado generalmente son datos categóricos que no son de tipo temporal. Se deben utilizar histogramas apilados al comparar la cantidad de datos de diferentes conjuntos y la cantidad de datos de cada componente del conjunto observado. Si hay demasiados componentes en el conjunto, para resaltar los puntos clave, los componentes deben reclasificarse para mostrar la clasificación de TOP5, y el resto se clasifica como "otros".
Similitudes:
Los diagramas de dispersión y los gráficos de burbujas son gráficos que se utilizan para mostrar la distribución de datos.
Tanto los diagramas de dispersión como los gráficos de burbujas asignan dos campos a las posiciones del eje X y del eje Y. El valor de (X, Y) determina la posición de un punto o burbuja en el sistema de coordenadas cartesianas. .
Diferencia:
Gráfico de dispersión: generalmente se utiliza para mostrar la distribución de datos bidimensionales (x, y), centrándose en la relación entre las dos variables x, y de las dos. -Datos dimensionales Relevancia. En un diagrama de dispersión, también se pueden mostrar comparaciones de múltiples conjuntos de secuencias de datos, como comparaciones de patrones de distribución.
Gráfico de burbujas: Generalmente se utiliza para mostrar la distribución de datos tridimensionales (x, y, z). En comparación con los diagramas de dispersión, los gráficos de burbujas agregan una dimensión a la presentación de datos, asignando valores a tamaños de burbujas. Los gráficos de burbujas también pueden mostrar la distribución de múltiples conjuntos de series de datos, descubriendo así los patrones de distribución y las diferencias de diferentes series.
Nota:
En términos generales, los diagramas de dispersión se utilizan principalmente para estudiar los patrones de distribución y las correlaciones de conjuntos de datos, y no prestan mucha atención a los valores específicos de cada dato. punto. Cuando el número de conjuntos de datos es demasiado grande, no es adecuado mostrar todos los puntos de datos en un diagrama de dispersión. En este momento, es necesario muestrear y mostrar a toda la población, generalmente mediante muestreo estratificado, pero la base y los factores que influyen en el muestreo estratificado deben determinarse de acuerdo con el escenario comercial específico.
En comparación con los gráficos de dispersión, los gráficos de burbujas no son adecuados para situaciones en las que el volumen de datos es demasiado grande. Demasiadas burbujas dificultarán la lectura del gráfico. Además, para cierta información de datos oculta en el gráfico de burbujas, generalmente se puede utilizar la interacción para ayudar a leer la información del icono, como pasar el cursor para mostrar datos detallados, hacer zoom para observar puntos de datos cubiertos, etc.
1. ¿Quiere conocer la distribución de los precios unitarios de todos los artículos entregados, con un rango de cada 10 yuanes?
? Debido a que es una distribución (precio unitario), se considera un diagrama de dispersión, pero debido a que hay demasiados artículos para clasificar (usando subcategorías), se usa una escala logarítmica en el eje vertical para resolver el problema de la distribución desigual de precios.
2. ¿Mostrar la segunda categoría de productos con las 5 mayores ventas?
TOP5 se filtra de la clasificación secundaria y se puede mostrar con un histograma normal.
3. ¿Mostrar las tendencias de ventas de productos por mes?
Como es para mostrar la tendencia, elegimos el gráfico de líneas.
4. ¿Muestre el volumen de ventas de bienes en diferentes años y la proporción de los tres modos de transporte en diferentes años?
Como necesitas mostrar cantidad y proporción, elige un gráfico circular.
Antes de la visualización, debemos aclarar el propósito de la visualización y esperar mostrar o explorar los patrones de datos. Esto determina qué tipo de gráficos debe elegir, cómo contar y ensamblar sus conjuntos de datos y si la visualización puede lograr los objetivos deseados.
Lectura de referencia:
1. Cómo elegir gráficos de datos con elegancia: comparación de gráficos de uso común