Red de conocimientos turísticos - Conocimientos sobre calendario chino - Un marco para analizar fluctuaciones anormales en los indicadores de datos de productos

Un marco para analizar fluctuaciones anormales en los indicadores de datos de productos

Cuando los indicadores de datos de la línea de negocio de productos APP fluctúan de forma anormal, ¿cómo empezar a analizar las anomalías de los datos?

En términos generales, algunos indicadores de datos de productos tendrán un ciclo de fluctuación fijo y los cambios de datos en cada ciclo deberían tender a ser estables, sin embargo, en un determinado informe diario, semanal o mensual del seguimiento de datos. sistema, los indicadores de datos de repente ya no coinciden con los cambios constantes esperados. Esto es lo que llamamos fluctuaciones anormales de datos. En este caso, debemos profundizar en la causa de la anomalía de los datos.

El núcleo del análisis de anomalías de datos es combinar experiencias pasadas e información diversa para encontrar la hipótesis de la causa más probable dividiendo los indicadores de datos y luego realizar un análisis multidimensional para verificar la hipótesis y localizar el problema. Durante este proceso, se pueden establecer nuevas hipótesis basadas en las hipótesis originales o se pueden ajustar las hipótesis originales hasta que se encuentre la causa.

¡Lo más importante de usar este marco es decirle al entrevistador cómo formulas tu respuesta al comienzo de la pregunta! ¿Por qué debería decirle al entrevistador su marco de antemano?

Debe darse cuenta de que los entrevistadores no son perfectos y, en ocasiones, harán preguntas poco claras o incorrectas. Entonces, si puede decirles su marco con anticipación, podrán corregirse ellos mismos si la pregunta no se formula bien.

Lo más importante es que debes comunicarle al entrevistador cómo ves el problema. Por ejemplo, el entrevistador le pide que analice por qué nuestro producto aumentó las suscripciones en un 15%.

Si le explica su marco a un entrevistador, el entrevistador podría decir: Centrémonos simplemente en el análisis de datos y no hagamos investigaciones de la competencia o de los clientes. De esta forma podrás deducir que debes centrarte en la estacionalidad, colas, cambios de precios, etc.

Del mismo modo, si le cuenta al entrevistador todo el marco, pero el entrevistador está más interesado en el análisis competitivo, le dirá que se salte el resto del marco para que podamos centrarnos en el comportamiento de los competidores. .

En una entrevista, es imposible que expliques cada paso claramente en poco tiempo, por lo que debes comunicarte con el entrevistador para confirmar cuál es tu enfoque. Ahora, profundicemos en cada paso del marco.

Aquí enfatizamos: la autenticidad de los datos es la base.

De hecho, existen muchos indicadores anormales causados ​​por problemas en la fuente de datos. En nuestro trabajo, a menudo nos encontramos con excepciones del servidor, errores en las estadísticas de fondo de los datos, valores anormales en los informes de datos y problemas con las herramientas de medición de datos. Por tanto, antes de iniciar el trabajo de análisis, primero se debe confirmar la autenticidad de los datos.

Por lo tanto, cuando nos encontramos con un problema, la primera prioridad es asegurarnos de que los datos no tengan errores y encontrar productos y desarrollos relacionados con las estadísticas de datos para confirmar la autenticidad de los datos.

Ahora, dejemos claro que cuando los indicadores de datos son anormales: suben o bajan, generalmente se dan las siguientes situaciones:

En primer lugar, estas tres situaciones significan la gravedad del el problema en sí es diferente

Si los indicadores de datos disminuyen, las caídas cíclicas generalmente no requieren un procesamiento especial; las caídas únicas suelen ser repentinas, por lo que se debe centrar en los eventos;

Es importante tener en cuenta que no se puede simplemente mirar los gráficos de tendencias diarias, semanales y mensuales, sino que hay que prestar atención a la magnitud de las fluctuaciones: cuanto mayor es la magnitud, más notables son las anomalías. .

Por lo tanto, es necesario aclarar las siguientes cuestiones:

Después de aclarar el contenido específico de los indicadores de datos, y con el juicio de prioridad, el siguiente paso puede ser desmantelar los indicadores. y luego reducir el alcance de las sospechas y establecer hipótesis analíticas. El establecimiento de hipótesis ayuda a eliminar falsedades y retener verdades, y acercarse a las razones reales.

Por ejemplo: usuarios activos diarios = nuevos usuarios + retención de usuarios antiguos + regreso de usuarios perdidos, los indicadores secundarios se descomponen de la siguiente manera

A través de este método, puedes ubicar qué región o canal causó el problema Qué actividad diaria del grupo de usuarios ha disminuido y se ubican las razones aproximadas.

Por ejemplo, si el problema está dirigido a nuevos usuarios, necesitamos dividir la actividad diaria de los nuevos usuarios por canal nuevamente: nuevos usuarios = canal 1 + canal 2 + canal 3 + otros canales divididos por canal; , descubriremos qué canal afecta el problema específico. Luego, en el siguiente paso, haremos más suposiciones basadas en el negocio real y las analizaremos una por una.

Las anteriores son varias dimensiones de división preliminar comunes. Mediante la división preliminar, se puede localizar el alcance aproximado de la causa.

Si todos los indicadores divididos están disminuyendo, debemos averiguar cuáles son los indicadores más importantes entre ellos para obtener

Calcular el factor de impacto: cada dato debe compararse con el valor normal anterior Comparar y calcular factores de impacto.

Factor de impacto = (Volumen de operaciones de hoy – Volumen de operaciones de ayer) / (Volumen de operaciones total de hoy – Volumen de operaciones total de ayer)

Cuanto mayor sea el factor de impacto, mayor será el gran punto de caída aquí es grande y requiere un análisis más detallado.

Caso: el indicador de actividad de una aplicación cayó anormalmente en un día determinado

De acuerdo con la fórmula anterior, primero dividimos el volumen de actividad de los usuarios nuevos y antiguos, como se muestra en la figura a continuación (eje izquierdo de usuarios antiguos, usuarios nuevos Usuarios (eje derecho):

El coeficiente de impacto de los nuevos usuarios es 0,84, lo que indica que la disminución en DAU se debe a los nuevos usuarios y a un rango de segmentación claro son nuevos usuarios.

¿Qué constituye un nuevo usuario?

Nuevos usuarios = canal 1 + canal 2 + canal 3 + otros canales, por lo que dividimos las actividades de los nuevos usuarios por canales:

Sin embargo, solo encontrando la causa raíz del problema Solo así podremos encontrar la causa del problema y proponer una solución.

Entonces, contactamos con el responsable del Canal 3 para averiguar el motivo exacto: ¿se ha reducido el número de clientes potenciales en el canal? ¿La tasa de conversión del canal es baja? ¿O es un problema con la plataforma del canal? Esto lleva al siguiente paso.

El análisis específico se puede completar considerando eventos "internos-externos".

Factores de eventos internos-externos

Dentro de un período determinado, pueden suceder muchas cosas diferentes al mismo tiempo, centrándose principalmente en el punto de inicio, el punto de inflexión y el punto final de los indicadores de datos. .

1. Factores de eventos internos

Para hacer suposiciones desde tres dimensiones, se recomienda establecer un equipo específicamente responsable de las anomalías de los datos y convocar al personal técnico, operativo y de producto correspondiente para comprender el situación. Qué ajustes de producto, operativos y técnicos se realizaron cerca del momento en que ocurrió la anomalía de datos.

2. Eventos externos

Seguimos los cambios a corto plazo para encontrar causas internas y los cambios a largo plazo para encontrar causas externas.

El orden de búsqueda generalmente está de acuerdo con el orden mencionado en el artículo, primero adentro, luego afuera, primero considere a los usuarios, luego considere a los oponentes y finalmente considere el entorno.

Además de los métodos anteriores, también puede subdividir y analizar si hay demasiadas dimensiones. El punto central de su lógica es una hipótesis verificada sobre la base de que se establezca esta hipótesis, los datos pueden. dividirse en dimensiones más finas. Necesitamos recordar este tipo de análisis. Cuando la suposición es una determinada causa de anomalías en los datos, siempre que encontremos los opuestos divididos representados por la causa para comparar, podemos probar o revertir nuestra suposición hasta que finalmente encontremos la causa real. .

Comunicarse con los departamentos comerciales, retroalimentar las conclusiones del análisis y discutir la implementación de soluciones posteriores, luego resolver problemas y formular estrategias de optimización para los motivos.

Finalmente, necesitamos predecir cuándo ocurrirá el impacto; comunicarnos con las operaciones y los productos para brindar retroalimentación sobre el análisis y las conclusiones, y discutir los planes de implementación de seguimiento.

En los negocios reales, el impacto de las anomalías de los datos puede deberse a muchos factores (esta publicación solo habla de algunos factores internos, el entorno externo y la competencia en realidad afectarán los datos centrales) y, a veces, es necesario Establecer un modelo de análisis estadístico. Realizar algún análisis cuantitativo. Es posible que sean necesarios varios días de resolución constante de problemas.

Por lo tanto, debemos prestar más atención a los cambios en los datos en nuestro trabajo diario. Dentro del alcance de las condiciones, podemos combinarlo con nuestra propia experiencia comercial para determinar las diversas suposiciones que tienen más probabilidades de causar. problemas y resuelva estos supuestos. Realice un análisis en profundidad de la prioridad de la verificación de datos uno por uno. Por ejemplo, la disminución de los indicadores se debe a que las nuevas características no cumplen con las expectativas, la inversión insuficiente en el canal, los competidores demasiado fuertes y los errores importantes. actualizaciones de versiones, pérdida importante de clientes, etc.

A medida que nos familiaricemos más con el negocio y aumente la sensibilidad de nuestros datos, seremos cada vez más hábiles para analizar anomalías en los datos y descubrir problemas cada vez más rápido.

Caso: ¿Cómo utilizar los datos para analizar los motivos de la caída de las ventas de las tiendas Taobao?