¿Cuáles son los resúmenes de la capacitación en visualización de datos?
Resumen del entrenamiento en visualización de datos
Un resumen es un material escrito que analiza y estudia la experiencia o situación en una determinada etapa del trabajo, estudio o pensamiento que nos puede permitir encontrar. a tiempo Cometa errores y corríjalos, escribamos juntos un resumen cuidadosamente. ¿Cómo escribir un resumen para que no sea lo mismo? El siguiente es un resumen de la capacitación en visualización de datos que compilé cuidadosamente. Es solo como referencia, espero que pueda ayudar a todos.
Resumen de la capacitación en visualización de datos 1
La visualización de datos se refiere a mostrar visualmente la relación entre los datos mediante gráficos. A través de la visualización de datos, una gran cantidad de conjuntos de datos se forman en imágenes de datos y cada valor de atributo de los datos se representa en forma de datos multidimensionales. Los datos se pueden observar desde diferentes dimensiones, lo que permite una observación y un análisis más profundos. los datos.
1. Los tipos de gráficos más utilizados para la visualización de análisis de datos son los siguientes:
1. Tablas
2. Diagramas de dispersión
3 . Gráfico de líneas
4. Gráfico de columnas
5. Gráfico de barras
2. Análisis visual
2.1 Quiere analizar la cantidad de compra. ¿Los 10 usuarios principales son clientes habituales o tienen una gran cantidad de pedidos?
Utilice el análisis de tablas para este análisis. Los 10 usuarios principales clasificados por cantidad de compras se analizan en función del número de fechas de compra: todas son compras únicas, no clientes recurrentes. Las empresas deben encontrar formas de mantenerlas. estos grandes grupos de clientes.
2.2 Según los resultados del análisis de 2.1, ¿cuál es la intensidad de compra de esos clientes habituales? Por ello, volvemos a contar las fechas post-compra y analizamos a los usuarios que más compras realizaron: se concluyó que en este análisis *** había 29.944 usuarios, de los cuales sólo 25 eran clientes recurrentes, representando el 0,083% de ellos; solo 1 usuario compró 4 veces y los 24 usuarios restantes solo compraron 2 veces. Los comerciantes necesitan atraer clientes recurrentes y considerar si la calidad es aceptable o si la actividad no es lo suficientemente fuerte.
Utilice un gráfico circular para ver más directamente la pequeña proporción de clientes habituales.
2.3 Estadísticas de las 10 ventas principales de categorías de productos basadas en la categoría de producto cat_id y utilice un gráfico de barras para análisis visual:
2.4 Realice un análisis visual de gráfico de líneas sobre el volumen total de ventas en 20xx y 20xx mensual y trimestralmente respectivamente. Está claro que la tendencia de cambio de ventas es la siguiente; Noviembre es el más alto y el volumen de ventas en el cuarto trimestre es el más alto.
2.5 Analizando los datos de la Tabla 2, quiero saber ¿qué grupo de edad tiene mayores ventas de ropa infantil? Como se muestra a continuación, se utilizan gráficos de barras y diagramas de dispersión para el análisis de gráficos visuales (creo que el gráfico de puntos es un poco mejor. Se puede ver que las tendencias de ventas de niños y niñas del mismo grupo de edad son consistentes y las ventas). El volumen muestra una tendencia a la baja a medida que aumenta la edad.
Si se toma como etapa los 3 años, el volumen de ventas es mayor durante el período infantil de 0 a 3 años, y la demanda del mercado en Taobao y Tmall es enorme.
3. Resumen de ideas como responsabilidad del análisis de datos
Aquí hay dos experiencias preliminares en el aprendizaje del análisis de datos: El análisis de datos primero debe dominar los métodos y herramientas de análisis de datos comúnmente utilizados. , y luego ajuste y combine de manera flexible según los productos de su empresa. A continuación, quiero aprender sistemáticamente conocimientos sobre análisis de datos. El analista de datos es un puesto práctico y requiere formación continua en proyectos reales para convertirse en un maestro.
Como analista de datos, creo que mi principal responsabilidad es presentar los datos comerciales a los usuarios de datos y a los tomadores de decisiones de manera clara, precisa y clara, como predecir la rotación de usuarios, clasificar automáticamente a los usuarios, etc. El valor que puedes aportar es fantástico. Los tomadores de decisiones y los gerentes pueden realizar ajustes oportunos y razonables a las actividades comerciales en función de los resultados de los datos presentados para maximizar las ganancias corporativas. Resumen de la capacitación en visualización de datos 2
1. Definición de visualización de datos
La visualización de datos (visualización de datos) involucra tecnología de la información, ciencias naturales, análisis estadístico, gráficos, interacción e información geográfica. Es una tecnología que representa información y conceptos abstractos o complejos mediante la visualización de información no numérica en diversos campos interdisciplinarios. En pocas palabras, esta tecnología presenta datos en forma de gráficos para transmitir información.
Los seres humanos tienen cinco sentidos y pueden experimentar el mundo material a través de cinco canales, entonces, ¿por qué preferimos sólo los métodos visuales para transmitir información? Esto se debe a que la cantidad de información que los humanos obtienen a través de la visión es enorme. El ojo humano combinado con el cerebro forma un procesador paralelo de gran ancho de banda que ingresa enormes cantidades de señales visuales. Tiene capacidades de reconocimiento de patrones y más del 50% de sus funciones. se utilizan para el procesamiento relacionado con la percepción visual. En el cerebro, se procesa una gran cantidad de información visual en la etapa subconsciente. Los seres humanos pueden procesar imágenes 60.000 veces más rápido que el texto, por lo que la visualización de datos es una forma de comunicación de información de gran ancho de banda.
Si nuestra visión es más amplia, la visualización de datos a grandes rasgos engloba tres ramas: Visualización Científica (Scientific Visualization), Visualización de Información (Visualización de Información) y Visual Analytics (Visual Analytics). La visualización científica es un campo de investigación y aplicación interdisciplinario que se centra en la visualización de fenómenos tridimensionales. Se utiliza ampliamente en diversos sistemas en arquitectura, meteorología, medicina o biología. Los datos estudiados en este campo tienen estructuras geométricas naturales. magnetismo). Líneas sensoriales, distribución de fluidos, etc.).
scientific_data_viz. png
La visualización de información estudia la representación visual interactiva de datos abstractos para mejorar la cognición humana. Los datos abstractos incluyen datos numéricos y no numéricos, como información geográfica y texto. Los datos estudiados en este campo tienen estructuras abstractas, como gráficos de barras, gráficos de tendencias, diagramas de flujo y diagramas de árbol. Estos gráficos transforman conceptos abstractos en información visual. A menudo se refleja en forma de paneles de datos.
info_data_viz. png
El análisis visual combina representaciones visuales interactivas con procesos analíticos básicos (procesos estadísticos, técnicas de minería de datos) para realizar actividades complejas de alto nivel (razonamiento, toma de decisiones).
viz_analysis. png
2. Posición en todo el proceso de la ciencia de datos
Los componentes principales de la ciencia de datos incluyen tres etapas principales: clasificación de datos, análisis exploratorio de datos y visualización de datos. Desde una perspectiva superior, la visualización de datos está relativamente atrasada en la ciencia de datos y pertenece a la etapa de visualización de resultados finales. Si queremos empezar desde el principio, en primer lugar, en la etapa de clasificación de datos, nuestra tarea principal es la adquisición y análisis de datos, incluida una serie de limpieza y procesamiento de datos originales. Esta área del conocimiento involucra principalmente a la computadora. ciencia. A esto le sigue la fase de análisis de datos exploratorios, que requiere un uso extensivo de experiencia en estadística y extracción de datos. También requiere dibujar gráficos para explicar y explorar los datos. Las principales tareas de esta fase son el filtrado y la extracción. Pero el análisis visual en esta etapa es sólo un "diálogo" entre usted y los datos, lo que los datos quieren decirle, mientras que la visualización de datos es un diálogo entre los datos y sus lectores, lo que quiere decirles a los lectores a través de los datos. Ésta es la mayor diferencia entre ellos. Después de completar las dos etapas anteriores, hemos llegado a nuestra etapa final de visualización de datos. Este es un campo multidisciplinario que involucra diseño gráfico, visualización de información e interacción persona-computadora. Nuestra tarea principal es refinar la información y luego representarla visualmente. interactuar con los lectores. Sin embargo, sería un error entender estas tres etapas de la ciencia de datos como un modelo "lineal" que avanza en una secuencia estricta y pasa por un proceso iterativo y no lineal. Los siguientes pasos le brindarán una mejor comprensión del trabajo que ha realizado antes. Quizás cuando llegue a la etapa de visualización de datos, se dé cuenta de que todavía hay demasiadas dudas por resolver. Necesitamos volver al paso anterior y volver. -Haga el trabajo anterior, como un pintor dando vueltas una y otra vez para finalmente obtener el resultado final. Al igual que completar una obra maestra, el proceso de visualización de datos no consiste en agregar un poco de guinda al pastel recién horneado del análisis de datos. proceso de iteración repetida y optimización continua.
3. Pila de tecnología de visualización de datos
La visualización de datos es un campo multidisciplinario típico. Se puede decir que el conocimiento requerido para la visualización de datos es que la ciencia de datos es enorme. Esbozo de un cuerpo de conocimientos. Sentirás el lado racional de la ciencia de datos y también sentirás su lado emocional. Puedes pasar toda tu vida explorando este vasto campo, siempre aprendiendo y divirtiéndote sin fin.
4. Proceso de visualización de datos
La esencia de la visualización de datos es realizar un análisis y extracción de datos en profundidad basándose en una comprensión completa del negocio, para luego utilizar la información y El conocimiento obtenido al explorar los datos se muestra en forma visual. En otras palabras, el trabajo que hacemos es en realidad mapear desde el espacio de datos al espacio de gráficos. El primer paso que debemos hacer es comprender completamente los datos junto con el negocio y luego utilizar ciertos métodos para seleccionar el tipo de gráfico apropiado, lo que a su vez requiere que tengamos una comprensión relativamente completa de los tipos de gráficos. ¿Se hace después de dibujar el gráfico? No precisamente. También necesitamos optimizar el gráfico. Los objetivos de optimización son varios elementos del gráfico. Para ello, presentaremos este conocimiento paso a paso.
4.1 Combinar la comprensión del negocio con los datos
Hablar de análisis de datos sin entender el negocio es una tontería. Aquí presentamos un método para comprender rápidamente los datos y los negocios para una mayor exploración y análisis, llamado "método 5W2H".
Paso 1: ¿QUÉ, de qué negocio se trata? ¿Qué tema de negocio describen los datos?
Paso 2: ¿CÓMO, es decir, cómo recopilar los datos? Las reglas de recopilación afectarán el análisis posterior. Por ejemplo, si se trata de un punto oculto de datos de back-end, entonces los datos generalmente son en tiempo real y si se trata de un punto oculto de datos de front-end, entonces es necesario aclarar más; ¿En qué estado de la red se cargarán los datos? ¿Cómo afrontarlo cuando no hay red? Estos afectarán la calidad de los datos finales y, por tanto, la calidad del análisis.
Paso 3: ¿POR QUÉ, para qué se recopilan estos datos? ¿Qué queremos saber de los datos? ¿Cuál es el objetivo del análisis de datos?
Paso 4: ¿CUÁNDO, están los datos comerciales en qué periodo?
Paso 5: ¿DÓNDE, cuáles son los datos comerciales en el ámbito geográfico?
Paso 6: QUIÉN, quién recopiló los datos (¿Quién)? Dentro de la empresa, se puede prestar más atención al sistema empresarial del que proviene.
Paso 7: ¿CUÁNTO, qué tamaño tienen los distintos datos y son suficientes para respaldar el análisis? Los métodos de análisis son diferentes cuando los datos son suficientes e insuficientes. Si la respuesta a una de las siete preguntas no es satisfactoria, esto indica que hay margen de mejora en este ámbito.
4.2 Seleccionar el tipo de gráfico
Puedes elegir el tipo de gráfico apropiado en tres sencillos pasos: primero, mira el tipo de datos, segundo, mira las dimensiones de los datos y, tercero, mirar el contenido a expresar.
Tenemos dos tipos de datos y cada tipo de datos tiene dos subcategorías. Primero, tenemos datos categóricos y cuantitativos. Los datos categóricos se utilizan para representar categorías, como manzanas, plátanos, peras y uvas, que son las cuatro categorías de frutas, llamadas clasificación, algunas variables categóricas tienen un orden determinado, por ejemplo, la calidad del vino tinto se puede dividir en baja; , medio, alto tres niveles, los cuerpos de las personas incluyen delgado, normal, obeso, etc. Esta variable categórica especial se llama secuenciación categórica. Los datos cuantitativos también se pueden dividir en dos categorías: una se denomina datos de valores continuos, como la edad de una persona; la otra se denomina datos de valores discretos, como el número de gatos.