Red de conocimientos turísticos - Información de alquiler - ¿Qué es una prueba estadística? ¿Cómo elegir un método de prueba estadístico?

¿Qué es una prueba estadística? ¿Cómo elegir un método de prueba estadístico?

Las pruebas estadísticas también se denominan "pruebas de hipótesis". Un procedimiento para rechazar o no rechazar (aceptar) la hipótesis nula de una o más distribuciones poblacionales hasta un cierto grado de confiabilidad basado en los resultados del muestreo. La decisión a menudo depende de si el valor del estadístico muestral es significativamente diferente del parámetro poblacional hipotético. Esto se llama prueba de significancia. La lógica de razonamiento de la prueba es prueba por contradicción con la naturaleza probabilística.

Selección

Nivel de significancia y región de negación

Con la distribución muestral asociada al problema, podemos dividir todos los resultados posibles en dos categorías: 1 Una categoría es resultados improbables; la otra categoría son aquellos resultados que la gente espera que sucedan con mucha probabilidad. En este caso, si los resultados que obtenemos en un muestreo real pertenecen a la primera categoría, tenemos motivos para dudar de los supuestos previos de la distribución de probabilidad.

En las pruebas estadísticas, estos resultados poco probables se denominan región negativa. Si este tipo de resultado realmente ocurre, rechazaremos la hipótesis; de lo contrario, no rechazaremos la hipótesis. La forma específica de la distribución de probabilidad está determinada por supuestos y debe haber más de un supuesto. En las pruebas estadísticas, la hipótesis que se prueba generalmente se denomina hipótesis nula (o hipótesis original, representada por el símbolo H0) y se compara con otras hipótesis alternativas (representadas por el símbolo H1).

Es importante señalar que las hipótesis sólo se pueden probar, nunca demostrar. Las pruebas estadísticas pueden ayudarnos a rechazar una hipótesis, pero no pueden ayudarnos a confirmarla. Para que la inspección sea más rigurosa y científica, se necesita más. En primer lugar, debemos determinar el alcance del riesgo de cometer errores de Tipo I y Tipo II; en segundo lugar, determinar si el dominio negativo debe abarcar ambos extremos de la distribución muestral.

El primer tipo de error es que la hipótesis nula H0 en realidad es correcta, pero se rechaza. El segundo tipo de error es que H0 en realidad es incorrecta pero no ha sido rechazada. El segundo tipo de error se produce cuando la hipótesis nula H0 es en realidad falsa pero no ha sido rechazada. Desafortunadamente, no importa cómo elijamos el dominio negativo, es imposible evitar por completo los errores de Tipo I y Tipo II, ni podemos minimizar el riesgo de cometer ambos tipos de errores al mismo tiempo.

Para cualquier prueba dada, cuanto menor es el riesgo de un error de Tipo I, mayor es la probabilidad de un error de Tipo II y viceversa. En general, no es posible estimar específicamente el valor de probabilidad de un error de Tipo 2. Este no es el caso de los errores de Tipo I. La probabilidad de cometer un error de Tipo I es la suma de las probabilidades de varios resultados en el dominio negativo.

Dado que el riesgo de cometer un error de Tipo I y el riesgo de cometer un error de Tipo II tienden a ir en direcciones opuestas, al realizar pruebas estadísticas, primero debemos equilibrar el riesgo de un error de Tipo I y el riesgo de cometer un error de Tipo II. riesgo de un error de tipo II. La probabilidad de que podamos cometer un error de Tipo I seleccionado de antemano se denomina nivel de significancia de la prueba (representado por α), que determina el tamaño del dominio negativo.

Si la distribución muestral es continua, el dominio negativo se puede establecer en cualquier nivel que desee establecer, y el tamaño del dominio negativo puede ser consistente con los requisitos del nivel de significancia (este es el caso para el posterior test de normalidad). Si la distribución muestral es discontinua, se debe utilizar el método de probabilidad acumulada para encontrar un conjunto de resultados que constituyan el dominio negativo.

Es decir, en la tabla de distribución de probabilidad conocida, comience desde la probabilidad menos probable en ambos extremos y acumule hacia el centro hasta que la suma de las probabilidades sea ligeramente menor que el nivel de significancia seleccionado. En muchos casos, podemos predecir la dirección de la desviación, o solo nos interesa la desviación en una dirección. Siempre que se pueda predecir la dirección, una prueba unilateral es más apropiada que una prueba bilateral bajo el mismo nivel de significancia.

Debido a que el dominio negativo se concentra en el lado más apropiado de la distribución muestral, se puede obtener una cola relativamente grande. De esta manera, se puede reducir el riesgo de cometer un error de Tipo II mientras que el riesgo de cometer un error de Tipo I permanece sin cambios.

Información ampliada

Se deben considerar las siguientes condiciones al elegir un método de prueba estadístico:

1. Compruebe si se conoce la distribución general. Si se conoce, vea si es una distribución normal. Si se sabe que la distribución de la muestra es una distribución normal, puede elegir el método de prueba paramétrico; si se desconoce la distribución de la población, utilice el método de prueba no paramétrico.

2. En las pruebas paramétricas, si la distribución de la población es normal y se conoce la varianza de la población, se puede utilizar la prueba Z si las dos muestras son independientes o están correlacionadas, si se desconoce la varianza de la población, t diferente; Las pruebas se adoptan en función de la prueba de varianza de la muestra. Si la distribución de la población no es normal y se conoce la varianza de la población, se utilizará la prueba Z' según la independencia o la correlación de la muestra; si se desconoce la varianza de la población, se utilizarán diferentes pruebas Z' según la independencia y la correlación.

3. Considere si utilizar pruebas unilaterales o bilaterales según el tema.

4. En las pruebas no paramétricas, se pueden utilizar métodos como la prueba de signos y la prueba de suma de rangos según la correlación e irrelevancia de dos muestras, precisión y capacidad, etc.

Enciclopedia Baidu-Prueba estadística