Red de conocimientos turísticos - Información de alquiler - Descripción general de las pruebas de hipótesis

Descripción general de las pruebas de hipótesis

Cuando se trata de estadística, eventualmente hablaremos sobre la prueba de hipótesis. Cualquiera que haya realizado análisis de datos está familiarizado con ella, pero si quiere hablar sobre el principio de la prueba de hipótesis, ¿cuál es el valor P? ¿Y por qué? Al realizar una prueba t, ¿por qué se necesita una prueba F? Supongo que se te puede ocurrir una pregunta interesante.

Como apertura de esta clase abierta, comencemos con la prueba de hipótesis y hablemos sobre los principios y procesos básicos de la prueba de hipótesis.

En primer lugar, debemos aclarar el estado de la prueba de hipótesis en estadística: la inferencia estadística es una rama importante de la estadística. Hay dos métodos importantes para hacer inferencia estadística, a saber, la estimación de parámetros y la prueba de hipótesis. La estimación de parámetros consiste en utilizar estadísticas de muestra para estimar los parámetros de la población. La prueba de hipótesis, como su nombre indica, consiste en plantear una hipótesis y luego probar, por ejemplo, suponiendo que la media es μ y luego probar si la media es μ en función de la muestra. información, de hecho, es para demostrar que la media no es μ, es decir, anular la hipótesis nula. La lógica se utiliza en el enfoque contrafactual basado en los principios estadísticos de pequeñas probabilidades.

Por ejemplo, los datos oficiales de la metrópolis de Shanghai dicen que el salario per cápita de los residentes es de 1.000, lo que plantea un gran interrogante para Beidiao como yo si calculamos un área local (si la muestra es representativa). ), el promedio estadístico es 7000. Entonces no tengo confianza en este resultado. Entonces podemos probarlo y establecer la confiabilidad en 95% y el valor P en 0.0002. Entonces puedo decir con confianza que los datos oficiales están conduciendo el tren. Puedo decir con confianza que los datos oficiales están conduciendo un tren y no se debe confiar en ellos. Porque el valor P de 0,0002 significa que si el salario per cápita de los residentes es 1w, entonces calculé que la probabilidad de que el valor promedio sea 7k es 0,0002. Obviamente, el salario per cápita real no puede alcanzar una probabilidad tan pequeña. ser 1w. Esto es para anular la hipótesis nula basada en el principio de pequeña probabilidad.

A continuación, hablaremos sobre el conjunto de pruebas de hipótesis. Durante la descripción, es posible que tengas preguntas, ¿a qué se debe esto? No te preocupes, seguiré leyendo. Si hay alguna duda, puedes mencionarla en los comentarios y la agregaré):

Conjunto 1, hipótesis, es decir, cuál supongo que será el resultado. Después de adivinar, vamos al conjunto 2, que es lo que quiero usar para probar esta hipótesis, aquí lo llamamos estadístico de prueba. No hay un bien o un mal absoluto en las pruebas, por lo que debemos establecer un nivel de significancia, que es 3, que equivale a establecer un umbral para rechazar la entrada cuando está fuera de la puerta. La estadística se llama región de rechazo, y lo que es. rechazada es la hipótesis nula. La configuración de la puerta en el cuarto paso es donde se realiza el cálculo. La estadística de prueba y el nivel de significancia se determinan en función de los dos primeros pasos. Finalmente, puedes saber si la puerta está adentro o afuera.

El siguiente paso será utilizar rutinas para proponer rutinas:

La formulación de hipótesis incluye la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es la hipótesis que queremos revertir mediante la recopilación de evidencia, y la hipótesis alternativa (H1) es la hipótesis que queremos respaldar, por lo que la hipótesis nula y la hipótesis alternativa se pueden establecer de acuerdo con la situación real. . La hipótesis nula y la hipótesis alternativa son mutuamente excluyentes. El núcleo de la prueba de hipótesis es si la hipótesis nula es verdadera. La prueba de hipótesis también implica dos tipos de errores, que implican más contenido y se presentarán por separado.

Una estadística de prueba es una estadística utilizada en decisiones de prueba de hipótesis. ¿Cómo elegir estadísticas? Esto es lo mismo que la estimación de parámetros, debe considerar el tamaño de la población de la muestra, el tamaño de la muestra (generalmente >30 muestras consideramos una muestra grande) y si se conoce la varianza de la población; de lo contrario, puede usar la muestra. aproximación de la varianza. ¿Se siente un poco mareado? Mantenga la calma. Esta es la clave para la prueba de hipótesis. Le indica qué tipo de método de prueba debe usarse y en qué circunstancias. Recuerde esto y no usará solo la prueba t descuidadamente en el futuro. . Para ser considerado, también recopilé algunas imágenes de estadísticas de prueba. Puedes ponerlas en casa y verificarlas. Cuando encuentres problemas de prueba de hipótesis en el futuro, te sentirás niu y bi.

Prueba de muestras pareadas: en el proceso de prueba de hipótesis de dos parámetros poblacionales, asumimos que las muestras son independientes, pero existe una situación en la que puede haber una dependencia entre las muestras. 2 El problema de la población normal se puede analizar según una muestra de población. Por ejemplo, si quiero probar el efecto de lavado de un determinado producto de lavado, puedo medir la limpieza de la ropa antes del lavado y la limpieza después del lavado con el producto. De esta forma se obtienen dos poblaciones, que se pueden analizar según. a la prueba t para muestras pequeñas con varianza desconocida.

Sin embargo, para la misma prenda, existe una relación correspondiente entre los datos antes y después del lavado. Puedo usar la limpieza antes y después del lavado para hacer la diferencia y probar si la diferencia es 0, que se convierte en una muestra total. Prueba t.

Las fórmulas de cálculo para estadísticas específicas no se proporcionan aquí, principalmente porque ahora se calculan utilizando software estadístico. La clave es comprender sus propios problemas estadísticos, elegir la estadística de prueba adecuada y luego puede abrirla. en software estadístico!

Significación α: Es la probabilidad de que se cometa un tipo de error, es decir, la probabilidad de rechazar la falsedad original cuando la falsedad original es verdadera. Por ejemplo, cuando la policía arresta a un ladrón, sabe claramente que es un ladrón, pero calcula mal la probabilidad de dejarlo ir como una buena persona. Esto también se denomina región de rechazo de la distribución muestral y el investigador puede determinarla de antemano.

Calcular el valor del estadístico de prueba. Una vez que se determinan el valor y la significancia α del estadístico de prueba (generalmente 0,01, 0,05, 0,001), el valor crítico del estadístico z a o z a/2, ta o t a/2 se puede obtener mediante software estadístico o búsqueda en tablas. >

Tomar decisiones estadísticas. Hay dos formas de determinar decisiones estadísticas. Una es comparar el valor absoluto del estadístico de prueba con el valor crítico del nivel α. Si el valor es mayor que el nivel α, se rechaza la hipótesis nula. que el nivel α, la hipótesis nula no puede rechazarse. Otro enfoque es utilizar valores p para la toma de decisiones. Personalmente, prefiero el segundo método, aunque el software estadístico actual le dará ambos valores al mismo tiempo. Generalmente nos referimos al valor P como el nivel de significancia observado, que es la probabilidad de obtener una observación de muestra o un resultado más extremo cuando la hipótesis original es verdadera. Si el valor P es muy pequeño, significa que la probabilidad de obtener el resultado observado es muy pequeña. Si esto sucede, según el principio de pequeña probabilidad, tengo motivos para rechazar la hipótesis nula. Si el nivel de significancia se determina de antemano, como α = 0,05, entonces en una prueba bilateral, puede decidir si rechazar la hipótesis nula comparando el valor P con 0,025; si se rechaza la hipótesis nula comparando el valor de P con 0,05 para decidir si se rechaza la hipótesis nula. Por supuesto, también es posible utilizar el valor P directamente y tomar una decisión basada en nuestro nivel de significancia deseado.

Lo anterior es el principio básico y el proceso de prueba de hipótesis. Una vez que comprenda esto, podrá resolver casi cualquier problema de prueba de hipótesis que encuentre. Algunos estudiantes suelen preguntar por qué el estándar de probabilidad pequeña se establece en 0,05 Jaja, no me pregunten, porque yo tampoco lo sé. Así lo utilizó el famoso estadístico británico Fisher, y no tiene solución.

Finalmente, ¿te doy un ejemplo y experimentémoslo juntos? Vida de una niña:

"Comer más cereales integrales puede ayudarte a perder peso". Para probar esta hipótesis, seleccionamos al azar a 35 personas y les preguntamos sobre sus recetas habituales de desayuno y almuerzo. Según sus recetas, se dividieron en dos categorías, una categoría fue la de aquellos que comen cereales con frecuencia (puntuación total 1) y la otra. la otra categoría es alguien que no come cereales con regularidad (puntuación total 2). Luego mida las calorías que cada persona consumió durante el almuerzo. Luego de un período de experimentos, se obtuvieron los siguientes resultados: Hipótesis de prueba (a = 0,05)

1. Hipótesis nula: u1-u2>=0

3. Significancia a 0,05 Rechazar la hipótesis nula horizontalmente.

4. Conclusión: No hay evidencia de que una variedad de cereales ayude a perder peso. 4.