Red de conocimientos turísticos - Información de alquiler - Análisis | Análisis de enriquecimiento GO

Análisis | Análisis de enriquecimiento GO

Desde que llegué al grupo de investigación como estudiante de primer año, he estado escuchando las palabras análisis de enriquecimiento GO. Hasta ahora, mi segundo año de estudio básicamente ha terminado. Aún no lo he hecho y no sé cómo hacerlo.

El entendimiento general es que en el conjunto de genes de una persona, la proporción de genes con una determinada función es mayor que la proporción de genes con esa función entre todos los genes. Hay muchas personas que lo explican claramente, como las notas de estudio del análisis GO, el "Análisis de expresión genética (Parte 2) - Análisis de enriquecimiento" de Xu Chaoqun y los "Introductores del transcriptoma (8): Análisis de enriquecimiento".

No estudio plantas modelo y puede haber problemas de versión con la OrgDb existente. Por tanto, 2.2 o 2.3 es una buena opción. ¡pero! ¡pero! Del mismo modo, tengo preguntas sobre si construir OrgDb y cómo hacerlo.

Con respecto a la cuestión de si construir, vi a Chauguin Xu mencionado en "Cómo realizar un análisis de enriquecimiento después de la anotación funcional": "No es necesario construir Orgdb, porque el propósito de Orgdb es realizar genes numeración y conversión GO/KEGG. Solo necesita importar la correspondencia entre los números de genes y los números GO/KEGG en R, y luego usar clusterProfiler para analizar los datos.

También hay muchos artículos sobre cómo construirlo en línea. Para construir OrgDb, necesita gene_info y gene2go. gene_info requiere dos columnas, GID y Gene_name.

En muchos blogs, EggNOG se utiliza para anotar secuencias de proteínas de las especies en estudio y luego extraer información de los resultados de la anotación. Cuando repetí este proceso, descubrí inconsistencias. ¿Qué es este nombre_gen? Para revisar en detalle el proceso de creación de anotaciones para especies que no son modelo, elegí la columna seed_ortholog; cuando construí el orgDb de mi propia especie, elegí la columna de anotaciones eggNOG cuando usé el paquete AnnotationForge para construir fácilmente el paquete Orgdb para especies que no son modelo; -Especie de modelo, elegí la columna X .4, que aparece de la nada; seleccione la columna Preferred_name, que es una columna en el paquete Orgdb. nombre... Algunas columnas pueden incluso ser inexistentes o inconsistentes en diferentes versiones de EggNOG.

Mi pregunta es, ¿es importante elegir Gene_name? ¿Es esta otra característica de OrgDb? ¿No importaría esto si fuera sólo para el análisis de enriquecimiento de GO? Debido a la falta de conocimiento, no comparé los resultados ni profundicé en qué más puede hacer exactamente OrgDb. Quizás eso se resuelva hacia el final de RL4. Además, debido a la falta de otras pruebas, todos definieron EVIDENCIA como "IEA".