Relación entre variables
La relación de correlación entre variables es la siguiente:
La relación de correlación se refiere a la relación entre cambios en múltiples variables, que cambian dentro de un cierto rango de acuerdo con una determinada regla. La correlación, incluso una correlación fuerte, no representa causalidad. Sólo podemos especular sobre la base de circunstancias relevantes.
La correlación es la relación más extendida en la vida y cubre casi todos los aspectos de la vida. Muchas personas también consideran la correlación como causalidad.
Clasificación de las relaciones de correlación
1. Por dirección
Correlación positiva: la tendencia cambiante de dos variables es la misma y una variable cambia con el aumento o disminución de la otra variable. Aumento o disminución; correlación negativa: Las tendencias cambiantes de dos variables son opuestas, y una variable disminuye y aumenta a medida que la otra variable aumenta o disminuye.
2. Según grado
Correlación perfecta: el cambio de una variable está determinado por el cambio de la otra variable, es decir, una relación funcional: si los cambios; de las dos variables son independientes entre sí, entonces las dos variables no están correlacionadas incompletamente significa que la relación entre las dos variables es entre irrelevancia y correlación perfecta.
3. Según el número de variables
Correlación única: la correlación refleja solo una variable independiente y una variable dependiente; correlación compleja: refleja la misma variable independiente para dos o más Correlación; de la variable dependiente: Al estudiar la correlación entre la variable dependiente y dos o más variables independientes, si las restantes variables independientes se consideran constantes, solo se estudia la correlación entre la variable dependiente y una de las variables independientes.
Pasos del análisis de correlación
1. Calcule el coeficiente de correlación
Primero procese el conjunto de datos y estandarice el formato de los datos. Si usa Excel, seleccione las variables que se analizarán para determinar la correlación y use la función correl() o pearson(). Estas dos funciones solo tienen fórmulas de cálculo diferentes, pero los resultados son los mismos; use "Datos" - "Análisis de datos". en Excel -El paso "coeficiente de correlación" también está disponible.
Si está utilizando Python, primero importe el conjunto de datos y luego use la función .corr() para calcular. Puede ver la correlación entre dos variables cualesquiera de los datos importados.
Si los cambios entre las dos variables son consistentes, el coeficiente de correlación rgt; 0 y la dirección del cambio es opuesta, entonces rlt si no hay una relación lineal entre las variables, r = 0, pero cabe señalar que no existe una relación lineal, lo que significa que no existe una relación. En otros casos, se pueden realizar cálculos de ajuste y regresión.
2. Visualización de datos: diagrama de dispersión
Generalmente, la relación aproximada entre variables se puede entender a través de diagramas de dispersión. Si no hay interrelación entre las variables, entonces el diagrama de dispersión aparecerá como puntos discretos distribuidos aleatoriamente; si hay algún tipo de correlación, entonces la mayoría de los puntos de datos serán relativamente densos y estarán presentes en una determinada tendencia.
Los pasos para un análisis de correlación simple son los anteriores. Si tiene necesidades, puede hacer un ejemplo o hacer más análisis de correlación más adelante.