¿Cuáles son los métodos de análisis de datos?
1. Desmontaje de fórmulas
El llamado método de descomposición de fórmulas consiste en utilizar fórmulas para descomponer los factores que influyen en un indicador capa por capa.
Por ejemplo, para analizar las razones de las bajas ventas de un determinado producto, utilice el método de fórmula para descomponerlo.
Segundo análisis comparativo
El método de contraste consiste en comparar dos o más conjuntos de datos y es el método más utilizado.
Sabemos que los datos aislados no tienen sentido, sólo la comparación puede marcar la diferencia. Por ejemplo, comparaciones interanuales y mensuales, tasas de crecimiento, ratios de base fija, comparaciones con competidores, comparaciones entre categorías, comparaciones de características y atributos, etc. El método de comparación puede descubrir patrones de cambios de datos, se usa con más frecuencia y, a menudo, se usa en combinación con otros métodos.
Al comparar las ventas de la empresa AB en la siguiente figura, aunque las ventas de la empresa A generalmente aumentaron y fueron más altas que las de la empresa B, la tasa de crecimiento de la empresa B fue muy rápida y superior a la de la empresa A, incluso si las ventas aumentaron en el último período. La velocidad disminuyó, pero las ventas finalmente se recuperaron.
Tres. prueba a/b
A/Btest se refiere a dos o más versiones de una interfaz o proceso web o de aplicación, a las que acceden grupos de visitantes similares al mismo tiempo y recopilan datos de experiencia de los usuarios de cada grupo. Los datos comerciales se analizan y evalúan para determinar la mejor versión para la adopción oficial. El proceso de prueba A / B es el siguiente:
(1) Análisis de la situación actual y establecimiento de hipótesis: analizar datos comerciales, determinar los puntos de mejora más críticos en la actualidad, proponer hipótesis de optimización y mejora, y proponer optimización. sugerencias, por ejemplo, encontramos que los usuarios La tasa de conversión no es alta. Suponemos que la tasa de conversión que genera la página de destino promocionada es demasiado baja y necesitamos encontrar formas de mejorarla.
(2) Establecer objetivos y formular planes: establecer objetivos principales y medir los pros y los contras de cada versión optimizada; establecer objetivos auxiliares y evaluar el impacto de las versiones optimizadas en otros aspectos;
(3) Diseño y desarrollo: Realizar dos o más versiones optimizadas de prototipos de diseño y completar la implementación técnica.
(4) Distribución del tráfico: determine la proporción de distribución de cada versión de prueba en línea. En la etapa inicial, la configuración del tráfico del plan de optimización puede ser muy pequeña y el tráfico se puede aumentar gradualmente según la situación.
(5) Recopilar y analizar datos: recopilar datos experimentales y juzgar la validez y el efecto: si la significación estadística alcanza 95 o más y se mantiene durante un período de tiempo, el experimento se puede finalizar si es así; inferior a 95, puede ser necesario ampliar el tiempo de la prueba; si la significación estadística no alcanza 95 o incluso 90 durante mucho tiempo, es necesario decidir si se detiene el experimento.
(6) Finalmente, según los resultados de la prueba, decida lanzar una nueva versión, ajuste la tasa de desvío y continúe con las pruebas, o si no se logra el efecto de la prueba, continúe optimizando el plan de iteración y vuelva a desarrollar la prueba en línea.
El diagrama de flujo es el siguiente:
Cuarto análisis de cuadrantes
Al dividir dos o más dimensiones, el valor esperado se expresa en forma de coordenadas. Cambie directamente de valor a estrategia, para realizar alguna promoción práctica. El método del cuadrante es un pensamiento impulsado por la estrategia que a menudo se asocia con el análisis de productos, análisis de mercado, gestión de clientes, gestión de productos básicos, etc. Por ejemplo, la siguiente figura muestra la distribución de los clics en anuncios en cuatro cuadrantes. El eje X de izquierda a derecha representa de menor a mayor y el eje Y de abajo hacia arriba representa de menor a mayor.
Los anuncios con altas tasas de clics y altas tasas de conversión indican que el público objetivo es relativamente preciso y son anuncios eficientes. Un anuncio con una tasa de clics alta y una tasa de conversión baja indica que la mayoría de las personas que hacen clic se sienten atraídas por el anuncio. Una tasa de conversión baja indica que existe cierta discrepancia entre las personas a las que se dirige el contenido publicitario y la audiencia real. el producto. Los anuncios con altas conversiones y pocos clics indican que la audiencia objetivo del contenido del anuncio es muy consistente con la audiencia real del producto, pero el contenido del anuncio debe optimizarse para atraer a más personas a hacer clic. Los anuncios con tasas de clics y tasas de conversión bajas se pueden descartar. También existe el modelo RFM clásico, que divide a los clientes en ocho cuadrantes en función de tres dimensiones: actualidad, frecuencia y actualidad.
Ventajas del método del cuadrante:
(1) Descubra la * * * causa del problema.
A través del análisis de cuadrantes, realizar análisis de atribución sobre eventos con las mismas características y resumir las * * * causas.
Por ejemplo, en el caso publicitario anterior, los eventos en el primer cuadrante pueden extraer estrategias y canales de promoción efectivos, y los cuadrantes tercero y cuarto pueden excluir algunos canales de promoción ineficaces;
(2) Establecer estrategias de optimización grupal
p>El método de análisis del cuadrante de entrega puede establecer estrategias de optimización para diferentes cuadrantes. Por ejemplo, en el modelo de gestión de clientes de RFM, los clientes se dividen en diferentes tipos según cuadrantes, como clientes clave de desarrollo, clientes clave de retención, clientes de desarrollo general y clientes de retención general. Ofrezca a los clientes clave en desarrollo más recursos, como servicios VIP, servicios personalizados y ventas adicionales. Vender productos de mayor valor a clientes potenciales u ofrecer incentivos para atraerlos nuevamente.
Análisis de Pareto del verbo (abreviatura de verbo)
La regla de Pareto se deriva de la clásica regla 80-20. Por ejemplo, en términos de riqueza personal, se puede decir que el 20% de la población mundial controla el 80% de la riqueza. En el análisis de datos, se puede entender que el 20% de los datos produce el 80% del efecto, y es necesario extraer alrededor de este 20% de los datos. Cuando se utiliza la regla 80/20, a menudo se relaciona con la clasificación. Los 20 primeros se consideran datos válidos. El método "28" se centra en el análisis y es aplicable a cualquier industria. Encuentre los puntos clave, encuentre sus características y luego piense en cómo convertir los 80 restantes en estos 20 para mejorar el efecto.
Normalmente, se utilizará para la clasificación de productos para medir y construir modelos ABC. Por ejemplo, una empresa minorista tiene 500 SKU y las ventas correspondientes a estos SKU ¿Qué SKU son más importantes? Se trata de priorizar las operaciones comerciales.
Un enfoque común es utilizar el SKU del producto como dimensión y el volumen de ventas correspondiente como indicador de medición básico. Organice estos indicadores de ventas de mayor a menor para calcular las ventas totales acumuladas del SKU del producto actual como. una parte del total de las ventas.
Si el porcentaje está entre 70~90 (inclusive), se clasifica como Categoría A. Si el porcentaje está entre 70~90 (inclusive), se clasifica como Categoría B. Si el porcentaje está dentro de 90~ 100 (inclusive), se clasifica como Categoría B. Para la Categoría C. Las proporciones anteriores también se pueden ajustar según su situación real.
El modelo de análisis ABC se puede utilizar no sólo para dividir productos y ventas, sino también para dividir clientes y transacciones de clientes. Por ejemplo, ¿quiénes son los clientes que aportan el 80% de las ganancias de la empresa y cuál es su proporción? Supongamos que hay 20 clientes, entonces, con recursos limitados, sabemos que debemos centrarnos en mantener a esos 20 clientes.
6. Análisis de embudo
El método del embudo es un gráfico de embudo, un poco como una pirámide invertida. Es una forma simplificada de pensar que a menudo se utiliza para el desarrollo de nuevos usuarios, cambios en las tasas de conversión de compras y el análisis de ciertos procesos.
La imagen de arriba es un embudo de marketing clásico, que muestra vívidamente un subvínculo en todo el proceso, desde la adquisición de usuarios hasta su conversión final en compras. La tasa de conversión de la cadena adyacente se refiere al uso de indicadores de datos para cuantificar el desempeño de cada paso. Por lo tanto, todo el modelo de embudo consiste en dividir todo el proceso de compra en pasos, luego usar la tasa de conversión para medir el rendimiento de cada paso y, finalmente, identificar enlaces problemáticos a través de indicadores de datos anormales, resolviendo así el problema, optimizando los pasos y, en última instancia, mejorar la tasa de conversión de compra general.
La idea central de todo el modelo de embudo en realidad se puede clasificar como descomposición y cuantificación. Por ejemplo, al analizar la transformación del comercio electrónico, lo que tenemos que hacer es monitorear las conversiones de los usuarios en cada nivel y encontrar puntos de optimización en cada nivel. Para los usuarios que no siguen el proceso, su modelo de conversión está especialmente diseñado para acortar el camino y mejorar la experiencia del usuario.
También existe un modelo clásico de crecimiento de los hackers, el modelo AARRR, que se refiere a adquisición, activación, retención, ingresos y referencias, es decir, adquisición de usuarios, activación de usuarios, retención de usuarios, ingresos de usuarios y comunicación de usuarios. . Este es un patrón común en las operaciones de productos. Combine las características del producto en sí y su posición en el ciclo de vida, preste atención a diferentes indicadores de datos y, en última instancia, formule diferentes estrategias operativas.
Se puede ver claramente en el diagrama del modelo AARRR a continuación que todo el ciclo de vida del usuario disminuye gradualmente. Al desmantelar y cuantificar todos los aspectos de todo el ciclo de vida del usuario y realizar comparaciones de datos horizontales y verticales, podemos descubrir los problemas correspondientes y, en última instancia, llevar a cabo iteraciones de optimización continua.
7. Análisis de ruta
El análisis de ruta de usuario rastrea la ruta de comportamiento del usuario desde un determinado evento inicial hasta un evento final, es decir, monitorea el flujo de usuarios y puede usarse para medir el efectividad de la optimización del sitio web o el efecto de la promoción de marketing, y comprender las preferencias de comportamiento del usuario. Su objetivo final es lograr los objetivos comerciales, guiar a los usuarios para que completen la ruta óptima del producto de manera más eficiente y, en última instancia, incitar a los usuarios a pagar. ¿Cómo realizar un análisis de la ruta del comportamiento del usuario?
(1) Calcule cada primer paso cuando un usuario usa un sitio web o una aplicación, y luego calcule el flujo y la conversión de cada paso por turno, y use los datos para reproducir verdaderamente todo el proceso, desde abrir la aplicación hasta dejando al usuario.
(2) Ver la distribución de rutas de los usuarios cuando utilizan el producto. Por ejemplo, después de visitar la página de inicio de un producto de comercio electrónico, qué porcentaje de usuarios realizó una búsqueda, qué porcentaje de usuarios visitó la página de categorías y qué porcentaje de usuarios visitó directamente la página de detalles del producto.
(3) Optimización de la ruta de análisis. Por ejemplo, qué ruta es más visitada por los usuarios; qué paso es donde es más probable que pierdan.
(4) Identificar características de comportamiento del usuario a través de rutas. Por ejemplo, analice si los usuarios navegan orientados a objetivos o sin rumbo.
(5) Segmentar usuarios. Los usuarios suelen clasificarse según la finalidad de uso de la APP. Por ejemplo, los usuarios de aplicaciones para automóviles se pueden subdividir en usuarios basados en atención, basados en intención y usuarios basados en compra, y se lleva a cabo el análisis de ruta de diferentes tareas de acceso para cada tipo de usuario. Por ejemplo, para los usuarios orientados a la intención, ¿cuáles son los caminos y los problemas al comparar diferentes modelos? Otro método consiste en utilizar un algoritmo para realizar un análisis de conglomerados basado en todas las rutas de acceso de los usuarios, clasificar a los usuarios según la similitud de las rutas de acceso y luego analizar cada tipo de usuario.
Tomemos el comercio electrónico como ejemplo. Desde iniciar sesión en el sitio web//APP hasta realizar el pago, los compradores deben pasar por el proceso de navegar por la página de inicio, buscar productos, agregarlos al carrito de compras, enviar pedidos y pagarlos. Sin embargo, el proceso de compra real de los usuarios es un proceso enredado e iterativo. Por ejemplo, después de realizar un pedido, el usuario puede regresar a la página de inicio para continuar buscando productos o cancelar el pedido. Hay diferentes motivaciones detrás de cada camino. Después de un análisis en profundidad con otros modelos de análisis, se pueden encontrar motivaciones rápidas para guiar a los usuarios hacia la ruta óptima o la ruta deseada.
Ejemplo de mapa de ruta de comportamiento del usuario:
8. Análisis de retención
La retención de usuarios significa que los nuevos miembros/usuarios aún tienen acceso, inicio de sesión y uso después de un cierto período de tiempo O conversión y otros atributos y comportamientos determinados, la proporción de usuarios retenidos a nuevos usuarios en ese momento es la tasa de retención. La tasa de retención se divide en tres categorías según diferentes períodos, tomando como ejemplo la retención identificada por el comportamiento de inicio de sesión:
El primer tipo de retención diaria se puede subdividir en las siguientes categorías:
(1) Tasa de retención al día siguiente: (entre los nuevos usuarios del mismo día, el número de usuarios que iniciaron sesión el segundo día)/el número total de nuevos usuarios el primer día.
(2) Tasa de retención al tercer día: (Entre los usuarios agregados el primer día, también hay usuarios que iniciaron sesión el tercer día)/Número total de usuarios agregados el primer día.
(3) Tasa de retención el séptimo día: (entre los usuarios agregados el primer día, también hay usuarios que iniciaron sesión el séptimo día)/Número total de usuarios agregados el primer día.
(4) Tasa de retención de 14 días: (Entre los nuevos usuarios del primer día, también hay usuarios que iniciaron sesión el día 14)/Número total de nuevos usuarios el primer día.
(5) Tasa de retención el día 30: (Entre los usuarios agregados el primer día, también hay usuarios que iniciaron sesión el día 30)/Número total de usuarios agregados el primer día.
El segundo tipo de retención semanal, la tasa de retención semanal, se refiere a la cantidad de nuevos usuarios que aún inician sesión cada semana en comparación con la primera semana.
El tercer tipo de retención mensual, la tasa de retención mensual, se refiere al número de usuarios que todavía están conectados cada mes en comparación con la primera semana. La tasa de retención es para nuevos usuarios y el resultado es un informe de la mitad de la matriz (solo la mitad tiene datos). Cada fila del registro de datos es la fecha y las columnas son tasas de retención para diferentes períodos de tiempo. Normalmente, las tasas de retención disminuyen gradualmente con el tiempo. La siguiente curva de retención de usuarios mensual se genera utilizando la retención mensual como ejemplo:
9. Análisis de conglomerados
El análisis de conglomerados es un método de análisis de datos exploratorio. Normalmente, utilizamos el análisis de conglomerados para agrupar y clasificar objetos aparentemente desordenados con el fin de comprender mejor el objeto de estudio.
Los resultados de agrupación requieren una alta similitud entre los objetos de un grupo y una baja similitud entre los objetos de un grupo. En la investigación de usuarios, el análisis de conglomerados puede resolver muchos problemas, como la clasificación de la información del sitio web, la correlación del comportamiento de clics en la página web y la clasificación del usuario. Entre ellos, la clasificación de usuarios es la situación más común.
Existen muchos métodos de agrupación comunes, como K-Means, agrupación espectral y agrupación jerárquica. Tome las K-medias más comunes como ejemplo, como se muestra a continuación:
Se puede ver que los datos se pueden dividir en tres grupos diferentes: rojo, azul y verde. Cada grupo debe tener su propio grupo único. atributos. Obviamente, el análisis de conglomerados es una especie de aprendizaje no supervisado y un modelo de clasificación sin etiquetas. Cuando agrupamos los datos y obtenemos los conglomerados, generalmente analizamos cada conglomerado por separado para obtener resultados más detallados.
Para obtener más análisis de datos e información de aprendizaje, siga la cuenta oficial de WeChat de Yunhai con el mismo nombre~