Viajes a Zhao Xiaopang
Por lo tanto, de manera responsable, es necesario que revisemos los conceptos básicos de prueba de hipótesis en teoría de probabilidad y estadística matemática al comienzo de este artículo.
Entre ellos, el concepto de parámetros es el más digno de nuestra comprensión, porque las principales pruebas de diferencias de grupos actuales se pueden dividir en dos categorías: pruebas paramétricas y pruebas no paramétricas. Entonces, ¿qué son las pruebas paramétricas y las pruebas no paramétricas y cuál es la diferencia entre ellas? Para comprender la pregunta anterior, primero es necesario comprender el concepto de inferencia estadística.
La inferencia estadística es un método estadístico que estudia cómo utilizar datos de muestra para inferir características de la población, incluida la estimación de parámetros y la prueba de hipótesis. Los parámetros de la población generalmente se desconocen y generalmente pueden estimarse mediante estadísticas muestrales. Por ejemplo, la media muestral se puede utilizar para la estimación puntual y la distribución de la media muestral se puede utilizar para la estimación de intervalo, lo que se denomina estimación de parámetros.
La diferencia entre pruebas paramétricas y pruebas no paramétricas;
Entonces, ¿cuándo se deben utilizar pruebas paramétricas y pruebas no paramétricas? Las pruebas no paramétricas generalmente no analizan directamente los valores observados de la muestra. El cálculo estadístico se basa en la clasificación de los datos originales en toda la muestra y descarta los valores específicos de los valores observados. Por lo tanto, las pruebas paramétricas deben ser la primera opción para todos los materiales adecuados para pruebas paramétricas. Sin embargo, si no está claro si una prueba paramétrica es apropiada para los datos, se debe utilizar una prueba no paramétrica.
Quizás todos aquí esperan que el autor nos guíe a través de los cuatro pasos de la prueba de hipótesis (proponer hipótesis; estructurar estadísticas de prueba; determinar valores críticos y regiones de rechazo de acuerdo con el nivel de significancia; sin embargo, algunos arrogantes autores, no compensa el hecho de que no hemos aprendido bien la lección, compensémoslo nosotros mismos, y recurre al conocimiento que cree que es importante: la distribución muestral.
Es muy. Es importante comprender el estado general de nuestros objetos de investigación (-distribución, distribución y -distribución) son * * * isomórficos con la distribución normal y forman la base de la estadística matemática moderna. La distribución normal y la -distribución son distribuciones sobre la media; La distribución y la distribución son distribuciones sobre la varianza. Mis compañeros de clase han estado haciendo estadísticas durante muchos años, pero no saben por qué casi todos los análisis de varianza son valiosos. Se puede ver que el último paso de la estadística es la base.
Sin distribución, la prueba de hipótesis es imposible; para la prueba de hipótesis, no hay base para el análisis de varianza. Nuevamente, por razones humanitarias, revisemos la distribución muestral.
Supongamos que X1, X2,...XN son independientes entre sí y todos obedecen a la distribución normal estándar N. (0, 1), entonces la variable aleatoria χ 2 = X12 X22 ... distribución de grados, y son independientes entre sí, entonces la la distribución que obedecen las variables se llama distribución de N grados de libertad
Supongamos que obedece una distribución con grados de libertad, y obedece una distribución con grados de libertad, y son independientes entre sí, entonces la distribución que obedecen las variables La variable obedece se llama distribución, donde el primer grado de libertad es y el segundo grado de libertad. En términos generales, aquí f es la relación cuadrática media
Ya sea una prueba paramétrica o no paramétrica. Las pruebas y las pruebas de hipótesis se basan en una distribución específica. Cuando se conoce la distribución de la población, por ejemplo, la población sigue una distribución normal, podemos consultar la tabla para obtener el valor crítico según el nivel de significancia dado (generalmente). 0,01 o 0,05). Cuando se desconoce, primero se puede construir una distribución empírica mediante pruebas de permutación y luego obtener el valor crítico según el nivel de significancia.
El método de prueba estadística tradicional consiste en determinar la significancia. nivel antes de la prueba, es decir, predetermina el valor crítico y el dominio de rechazo. De esta manera, no importa si el valor de la estadística de prueba es grande o pequeño, siempre que su valor esté dentro del dominio de rechazo, la hipótesis nula será. rechazado, de lo contrario no será rechazado.
Este método, con un nivel de significancia determinado, no proporciona una medida precisa de la inconsistencia entre los datos observados y la hipótesis original. Para medir la desviación entre los datos observados y el valor supuesto en la hipótesis nula, es necesario calcular el valor p. El valor p, también conocido como nivel de significancia de la observación, se expresa como la probabilidad de obtener los resultados reales de la muestra observada si la hipótesis original es correcta. Cuanto menor sea el valor p, mayor será la inconsistencia entre los datos observados reales y los resultados de la prueba, y más significativos serán los resultados de la prueba.
Existen muchas variables y es muy común en el análisis diferencial de amplicones metagenómicos requerir múltiples pruebas para determinar las diferencias entre grupos. En este caso, el estándar de prueba basado en una sola comparación se volverá demasiado flexible, lo que hará que la tasa de error en los resultados positivos (valor FDR, tasa de falso descubrimiento) sea muy grande (ya insoportable). ¿Qué debemos hacer? La mejor manera es mejorar el estándar de juicio (valor p). La probabilidad de un solo error de juicio se reducirá y la probabilidad general de error también se reducirá. El método de elevar el nivel de juicio a través de múltiples pruebas se llama corrección de múltiples pruebas. Desde 1979, los estadísticos han propuesto muchos métodos para pruebas y correcciones múltiples. En consecuencia, los nombres de los valores P corregidos también son diferentes, como FDR, valor Q y valor P ajustado. Todos sabemos que deben corregirse en múltiples pruebas. El autor tiene tiempo para enseñarle el uso específico (este autor es realmente estúpido ~~).
Con esto concluyen los conocimientos teóricos sobre pruebas diferenciales de panel de metagenomas o amplicones. El autor cree que es necesario comprender los puntos de conocimiento anteriores y también nos dice que lo que estamos discutiendo hoy es inferencia estadística. Es decir, somos expertos en encontrar diferencias.
La gente aprende a hacer estadística para encontrar diferencias. Para ilustrar las grandes diferencias en los datos entre grupos, se desarrollaron muchas imágenes que todavía se utilizan hoy en día. Descubramos juntos estas diferentes imágenes.
Esta es una navaja suiza duradera y de uso común en la caja de herramientas del científico de datos. Casi siempre que piensas en análisis de varianza, piensas en diagramas de caja. También se desarrolló una herramienta similar a los diagramas de bloques, como los diagramas de violín.
Generalmente, existen árboles evolutivos y árboles de agrupamiento jerárquico. Si desea expresar la diferencia de distancia entre objetos, quizás la forma más intuitiva sea un diagrama de árbol. Para utilizar un diagrama para representar las relaciones de parentesco, las unidades taxonómicas se colocan en la parte superior de las ramas del diagrama. Las relaciones de parentesco se pueden expresar en función de las ramas, en dos o tres dimensiones. El diagrama de árbol utilizado para la clasificación fenotípica en taxonomía cuantitativa se denomina diagrama fenotípico, y el diagrama de árbol mezclado con razonamiento sistemático se denomina cladograma para mostrar la diferencia.
Estimado autor, los niños han enumerado los paquetes R comúnmente utilizados para implementar estos gráficos, que se pueden utilizar después de la instalación.
El significado del análisis de especies aquí es que a través del análisis estadístico, se pueden encontrar especies con diferencias significativas en abundancia entre taxones y se puede obtener el grado de enriquecimiento de diferentes especies entre diferentes taxones. Al mismo tiempo, puede comparar las diferencias dentro y entre grupos para determinar si las diferencias en la estructura comunitaria entre diferentes grupos son significativas. Es decir, se puede encontrar un biomarcador para diferenciar entre grupos.
Este tipo de prueba generalmente solo genera el valor p. El propósito es muy simple: probar si existe una diferencia en la distancia de similitud entre los grupos de comparación. Los métodos de análisis más utilizados incluyen la prueba de chi-cuadrado, la prueba t de Student, la prueba de suma de rangos de Wilcoxon, etc.
Si sólo se comparan dos muestras, la prueba de chi-cuadrado es adecuada, pero, para ser honesto, los resultados de la prueba no son confiables porque, en esta etapa, es "difícil convencer al público" de que los 16 El estudio no se repite. Por no hablar del bajo precio, no es nada difícil repetir el curso, incluso desde la perspectiva de biología y estadística, es necesario repetir el curso.
Si hay dos grupos de muestras (al menos 3 réplicas), puedes probar la prueba de suma de rangos de Student, Welchst y Wilcoxon. La prueba t de Student requiere que las muestras se ajusten a una distribución normal y que las varianzas estén alineadas. La prueba t de Welch es una buena opción cuando los tamaños de muestra entre grupos son diferentes y las varianzas no están alineadas.
La prueba de suma de rangos de Wilcoxon, también conocida como prueba U de Mann-Whitney, es un método estadístico basado en la clasificación de variables y no requiere que la muestra se ajuste a la distribución normal ni que la varianza de la muestra esté alineada. . Es un método de prueba más extenso, pero al mismo tiempo, debido a que la prueba es demasiado suelta, es fácil causar muchos falsos positivos.
Si está comparando varios grupos de muestras, puede elegir la prueba unidireccional ANOVA, TURQUÍA y Kruskal-Wallis H. El ANOVA unidireccional y Turquía en realidad se basan en el ANOVA, pero este último se realiza a posteriori, por lo que se puede conocer la contribución de los dos grupos a la diferencia general.
La prueba H de Kruskal-Wallis es esencialmente una prueba de suma de rangos. A diferencia de las dos primeras, no requiere alineación del tamaño de la muestra y la varianza, y se usa más ampliamente. La prueba de Kruskal-Wallis también se denomina análisis de varianza no paramétrico unidireccional.
Francamente hablando, las pruebas generales de suma de rangos o pruebas de permutación son pruebas no paramétricas. En esta prueba diferencial, dos métodos de conjunto merecen nuestra atención especial: LEfSe y metastatos.
Los resultados se muestran a continuación y las diferencias se reflejan en el gráfico de columnas y el gráfico de árbol. El histograma de distribución del valor de LDA muestra especies con valores de LDA superiores al valor establecido (la configuración predeterminada es 4), es decir, biomarcadores con diferencias estadísticamente significativas entre grupos. Se muestran especies con abundancias significativamente diferentes en diferentes taxones, y la longitud del histograma representa el impacto de diferentes especies (es decir, puntuación LDA).
En un árbol filogenético, los círculos que irradian de adentro hacia afuera representan los niveles de clasificación desde filo hasta género (o especie). Cada círculo pequeño en un nivel taxonómico diferente representa un taxón en ese nivel, y el diámetro del círculo pequeño es proporcional a la abundancia relativa. Principio de coloración: las especies sin diferencias significativas se colorean uniformemente de amarillo y los biomarcadores de diferentes especies se colorean según el grupo. Los nodos rojos representan los taxones microbianos que desempeñan un papel importante en el grupo rojo, y los nodos verdes representan los taxones microbianos que desempeñan un papel importante en el grupo verde. Si falta un grupo en la imagen, significa que no hay especies significativamente diferentes en este grupo, por lo que falta el grupo. Los nombres de las especies representados por letras inglesas en la figura son como se muestran en la leyenda de la derecha.
Los resultados de Metastats dan los valores p y q de diferentes especies (¡los datos de la tabla son falsos!)
El llamado método basado en la distancia significa que prueba la comunidad diferencias más que especies. De hecho, el método de inspección mencionado anteriormente solo puede indicarle si existe una diferencia significativa entre estos grupos (que puede entenderse simplemente como presencia o ausencia). Si desea conocer la magnitud de estas diferencias simultáneamente (cuánto se puede entender de manera simple), necesita los métodos de prueba Anosim, Adonis y MRPP. Estos métodos no solo pueden generar resultados de prueba de significancia (valor P), sino también resultados de grado (valor R), que se utilizan para juzgar la contribución del grupo. Anosim y Adonis, que pueden utilizarse para pruebas estadísticas multivariadas, son muy adecuados. Cabe señalar que Anosim es esencialmente un algoritmo basado en clasificaciones y, de hecho, es más adecuado para NMDS. Si se trata de un análisis de PCoA, se recomienda utilizar Adonis para detectar los resultados juntos.
Anosim (análisis de similitud) es un método de prueba no paramétrico. Primero calcula la relación (o similitud) entre muestras a través de variables, luego calcula la clasificación de la relación y finalmente determina si la diferencia entre grupos y la diferencia dentro del grupo son significativas mediante la prueba de sustitución de clasificación. Esta prueba tiene dos valores importantes. Uno es el valor p, que se puede utilizar para determinar si la comparación entre grupos es significativa y el otro es el valor r, que se puede utilizar para obtener el grado de diferencia entre y dentro de los grupos. Anosim se utiliza para probar si la diferencia entre grupos es significativamente mayor que la diferencia dentro del grupo, determinando así si la agrupación es significativa. El análisis de Anosim utiliza la función anosim del paquete R vegan y generalmente realiza pruebas de fila para detectar diferencias significativas entre grupos según el rango del valor de distancia de Bray-Curtis. Para conocer el proceso de cálculo detallado, consulte Anosim.
Este método tiene principalmente dos resultados numéricos: uno es r, utilizado para determinar si existen diferencias entre diferentes grupos, el otro es p, utilizado para indicar si existen diferencias significativas. Los dos valores se explican a continuación:
La fórmula de cálculo del valor r es la siguiente:
RB: el rango promedio de la diferencia entre grupos.
RW: Nivel medio de disimilitud dentro del grupo.
n: El número de muestras.
El rango de valores de r es [-1, 1].
R gt0 indica que la diferencia entre grupos es mayor que la diferencia dentro del grupo r
r es solo una representación numérica de si existe una diferencia entre grupos y no puede proporcionar una. explicación significativa.
El valor p indica si la diferencia entre diferentes grupos es significativa y se obtiene mediante una prueba de permutación.
Principios generales de las pruebas alternativas: (Supongamos que los grupos originales son el grupo experimental y el grupo de control)
1. Todas las muestras se dividen aleatoriamente en grupos experimentales y grupos de control.
2. Calcular el valor R del grupo actual, es decir, Ri.
3. Repita la operación actual n veces, ordene todos los Ri y el R original de mayor a menor, y la posición donde R se divide por n es el valor p de la prueba de reemplazo.
ADONIS, también conocido como análisis de varianza de permutación o análisis de varianza no paramétrico, es un análisis multivariante de varianza no paramétrico basado en la distancia de Bray-Curtis. De hecho, de manera similar al uso de Anosim, también se pueden dar el grado de explicación (valor R) y la significancia grupal (valor P) de diferentes factores de agrupación para las diferencias muestrales. La diferencia radica en los diferentes modos de prueba. ADONIS es esencialmente un análisis de varianza basado en el estadístico F, por lo que muchos detalles son similares al análisis de varianza anterior. Este método puede analizar hasta qué punto diferentes factores de agrupación explican las diferencias de muestra y utilizar pruebas de permutación para analizar la significación estadística de las agrupaciones. El análisis de adonis utiliza la función adonis del paquete R vegan para el análisis. El proceso de cálculo detallado puede ser ADONIS
El análisis de Mrpp es similar a Anosim, pero MRPP se basa en la prueba de parámetros de Bray-Curtis y se utiliza para. Analizar la estructura de la comunidad microbiana entre grupos si la diferencia es significativa. A menudo se utiliza junto con gráficos de reducción de dimensionalidad como PCA, PCoA y NMDS. El análisis MRPP utiliza la función MRPP del paquete R. El proceso de cálculo detallado se puede ver en MRPP.
El análisis de varianza molecular (AMOVA) es similar al ANOVA y es un método de análisis no paramétrico basado en la matriz de distancias Unifrac ponderada o no ponderada, que se utiliza para probar la importancia de las diferencias entre diferentes grupos. Generalmente basado en la distancia Unifrac, la función Amova del software mothur se utiliza para analizar las diferencias entre grupos. El proceso de cálculo detallado se puede encontrar en amova.
Prueba de Mantel, la prueba de Mantel es una prueba de correlación entre dos matrices. Como su nombre indica, es una prueba. Como es una prueba, debe haber una hipótesis original, y su hipótesis original es que no existe correlación entre las dos matrices. El proceso de prueba es el siguiente: expanda las dos matrices correspondientemente, con dos columnas de variables, calcule el coeficiente de correlación (teóricamente se puede calcular cualquier coeficiente de correlación, pero comúnmente se usa el coeficiente de correlación de Pearson), luego reemplace una o dos columnas al mismo tiempo. tiempo, y luego calcular un valor, de acuerdo con La posición del valor R real en la distribución del valor R resultante, miles de veces permitidas. Si es cercano al resultado obtenido por permutación aleatoria, es irrelevante, si es mucho más significativo que la permutación aleatoria. Consulte la prueba de Mantel para conocer el proceso de cálculo detallado.
El autor es demasiado vago para ceñirse a lo que otros ya han dicho, así que simplemente copia. Al final del artículo, citó un pasaje de la versión original de Zhao:
No importa qué tipo de investigación científica o encuesta estadística esté realizando, se utilizan pruebas de significancia para determinar si existe alguna diferencia entre dos o incluso múltiples conjuntos de datos. Se utilizan ampliamente diferentes métodos en diversos campos de investigación científica. Como recién llegado a la investigación científica, el autor sufrió mucho en las pruebas de significación. Más tarde, me obsesioné con la teoría estadística durante más de medio año antes de entrar en contacto con las pruebas de significancia. Quedé profundamente impresionado por la sofisticación, la diversidad y el rigor de la teoría de las pruebas de significación. Este artículo especial es una referencia para colegas de investigación no estadística que todavía están luchando en el atolladero de las pruebas de significancia. Dado que el autor no es licenciado en estadística, sus puntos de vista son toscos y superficiales, y espera recibir consejos de personas mayores de la industria y líderes en el campo. Xiaoke está aquí para agradecer a todos.
Referencia: