Red de conocimientos turísticos - Información de alquiler - Importación de datos de una sola celda y control de calidad

Importación de datos de una sola celda y control de calidad

####################################

Crea el siguiente directorio

p>

Me he encontrado con estas situaciones hasta ahora;

Los tres archivos se refieren a "barcodes.tsv", "features.tsv" y "matrix.MTX" respectivamente;

Este caso es más fácil de manejar, códigos de barras.tsv es la identificación de la celda, características.tsv es la identificación del gen y matriz.mtx es la matriz de conteo.

Lectura de matriz csv única

Lectura de matriz csv múltiple

Lectura de matriz de txt única

Lectura de matrices de texto múltiple

De hecho, es usar R para leer el archivo de Excel, convertir el xslx a csv y luego leerlo.

Busca una web que explique todas las funciones de Seurat, es mucho más clara que el propio rdrr de R.

1.readMM():

Entrada: "xx.mtx"

Observaciones: Readmm es una función del paquete de matrices, que convierte una matriz estándar en una matriz dispersa. Características destacables. tsv y código de barras. tsv debe ser la biblioteca primero y luego combinarse con matrices y características dispersas. tsv y código de barras. tsv forma una matriz de condado con identificadores de células e identificadores de genes. (Consulte el paso 1 para obtener más detalles).

2.read10X():

Entrada: "raw_feature_bc_matrix" (del archivo generado por CellRanger)

Nota: Lea la función de 10x ID Xiura, cuya entrada proviene de la salida de Cell Ranger (la salida del software dedicado a datos del genoma 10x Cell Ranger tendrá un directorio de salida donde se encuentra "raw_feature_bc_matrix").

2.1 Después de crear el objeto Seurat, verifique rápidamente los metadatos para comprender su esquema;

Luego, necesitamos fusionar varios objetos Seurat en uno para que podamos controlar cada uno de ellos al mismo tiempo. Al mismo tiempo, la calidad de la muestra también nos facilita comparar la calidad de los datos de todas las muestras. Utilice la función merge() para realizar esta operación;

Generalmente se basa en los siguientes cuatro indicadores:<. /p>

1. Calcular la proporción de mitosis

Utilice principalmente la función PercentageFeatureSet() de Seurat, que utilizará un patrón para buscar identificadores de genes. Para cada columna (celda), seleccionará la suma de los recuentos del gen característico y la dividirá por la suma de los recuentos de todos los genes.

2. Calcular log10GenesPerUMI (opción)

GenesPerUMI = n característica _ RNA/nCount _ RNA

Este indicador significa "genes por unidad de lectura" "Número ratio" refleja la complejidad de los datos; a menudo se utiliza para evaluar la complejidad general de los genes ctrl y stim.

El filtrado a nivel de unidad utiliza principalmente la función subset().

En nuestros datos, habrá muchos genes con recuentos cero. Estos genes reducen significativamente la expresión promedio de una célula, por lo que los eliminamos de los datos.

Principalmente eliminar dos tipos de genes,

(1) eliminar genes con expresión nula en todas las células

(2) si un gen solo está presente en; unas pocas expresadas en células, su importancia no es particularmente significativa porque aún reducirá la expresión promedio de todas las demás células que no la expresan. Para nuestros datos, optamos por conservar sólo los genes expresados ​​en 10 o más células.

Después de la selección, se recomienda revisar los indicadores para asegurarse de que sus datos cumplan con sus expectativas, lo cual es beneficioso para el análisis posterior.

Guardaremos el objeto de celda filtrado para agruparlo e identificarlo como marcador y crearemos los datos de Seurat filtrados como. Objeto RData.