¿Qué es el SNP?

El nombre completo es Polimorfismos de un solo nucleótido, que hace referencia a los marcadores genéticos formados por la variación de un único nucleótido en el genoma. Hay muchos y son ricos en polimorfismos. Se refiere a variaciones de un solo nucleótido en el genoma, incluidas sustituciones, transversiones, eliminaciones e inserciones. En teoría, cada sitio SNP puede tener 4 formas de mutación diferentes, pero en realidad sólo ocurren dos tipos, a saber, conversión y transversión, y la proporción entre las dos es 2:1. Los SNP aparecen con mayor frecuencia en secuencias de CG, y la mayoría de ellos son C convertidos en T. La razón es que el C en CG a menudo está metilado y se convierte en timina después de una desaminación espontánea. En términos generales, SNP se refiere a una variación de un solo nucleótido con una frecuencia de mutación mayor que 1. Hay aproximadamente un SNP por cada 1000 bases en el genoma humano y el número total de SNP en el genoma humano es aproximadamente 3 × 10E6. Por tanto, el SNP se ha convertido en el marcador genético de tercera generación, y muchas diferencias fenotípicas en el cuerpo humano, la susceptibilidad a fármacos o enfermedades, etc., pueden estar relacionadas con el SNP. Actualmente se cree en general que la investigación de SNP es un paso importante hacia la aplicación del Proyecto Genoma Humano. Esto se debe principalmente a que los SNP proporcionarán una poderosa herramienta para el descubrimiento de grupos de alto riesgo, la identificación de genes relacionados con enfermedades, el diseño y prueba de fármacos y la investigación básica en biología. Los SNP están ampliamente distribuidos en el genoma y estudios recientes han demostrado que ocurren una vez cada 300 pares de bases en el genoma humano. La gran cantidad de sitios de SNP brinda a las personas la oportunidad de descubrir mutaciones genómicas relacionadas con diversas enfermedades, incluidos los tumores. Desde un punto de vista experimental, es más fácil encontrar mutaciones genéticas relacionadas con enfermedades a través de SNP que a través de líneas familiares. Causa directamente la expresión de genes de enfermedades, pero debido a su proximidad a ciertos genes de enfermedades, se convierte en un marcador importante. Los SNP también desempeñan un papel muy importante en la investigación básica. En los últimos años, el análisis de los SNP del cromosoma Y ha dado lugar a una serie de resultados importantes en los campos de la evolución humana, la evolución de la población humana y la migración. El polimorfismo de un solo nucleótido (SNP) se refiere principalmente al polimorfismo de la secuencia de ADN causado por la variación de un solo nucleótido a nivel del genoma. Es una de las variaciones hereditarias más comunes en los humanos. Representa más del 90% de todos los polimorfismos conocidos. Los SNP están ampliamente presentes en el genoma humano, con un promedio de 1 en cada 500 a 1000 pares de bases, y se estima que el número total es de 3 millones o más. El polimorfismo representado por SNP sólo implica la variación de una sola base. Esta variación puede ser causada por la transición o transversión de una sola base, o por la inserción o eliminación de una base. Pero lo que habitualmente se denomina SNP no incluye estas dos últimas situaciones. En teoría, los SNP pueden ser polimorfismos de dos alelos o polimorfismos de tres o cuatro alelos, pero en la práctica, los dos últimos son muy raros y casi pueden ignorarse. Por lo tanto, los comúnmente denominados SNP son polimorfismos alélicos. Esta mutación puede ser una transición (C T, en su cadena complementaria es G A) o una transversión (C A, G T, CG, A T). La tasa de incidencia de conversión es siempre significativamente mayor que la de otras variantes. Los SNP representan alrededor de 2/3 de las variantes de conversión y las tasas de aparición de otras variantes son similares. Esto también fue demostrado por la investigación de Wang et al. La alta probabilidad de conversión puede deberse a que los residuos de citosina en los dinucleótidos CpG son los sitios más propensos a mutaciones en el genoma humano, y la mayoría de ellos están metilados y pueden desaminarse espontáneamente para formar timina. En el ADN genómico, cualquier base puede variar, por lo que los SNP pueden estar dentro de la secuencia del gen o en secuencias no codificantes fuera del gen. En general, hay relativamente pocos SNP (SNP codificantes, cSNP) ubicados en la región codificante, porque dentro del exón, su tasa de mutación es solo 1/5 de la secuencia circundante. Sin embargo, es de gran importancia en el estudio de enfermedades genéticas, por lo que el estudio de cSNP ha atraído más atención.

Desde la perspectiva de su impacto en los rasgos genéticos biológicos, el cSNP se puede dividir en dos tipos: uno es cSNP sinónimo (cSNP sinónimo), es decir, el cambio en la secuencia codificante causado por el SNP no afecta la secuencia de aminoácidos del proteína que traduce, la base mutada tiene el mismo significado que la base no mutada; la otra es cSNP no sinónimo (cSNP no sinónimo), lo que significa que los cambios en la secuencia de bases pueden cambiar la secuencia de la proteína traducida en función de ella. , afectando así la función proteica. Este cambio es a menudo la causa directa de cambios en los rasgos biológicos. Aproximadamente la mitad de los cSNP son cSNP no sinónimos. Los SNP formados primero tienden a tener frecuencias más altas en la población, mientras que los SNP formados más tarde tienen una proporción menor. Los SNP específicos no necesariamente existen en personas de todos los grupos étnicos en distintos lugares, y sus proporciones también son diferentes, pero alrededor del 85% deberían ser comunes. Las características del propio SNP determinan que es más adecuado para la investigación sobre la anatomía genética de rasgos y enfermedades complejos y la identificación de genes basada en la población: 1. Los SNP son grandes en número y están ampliamente distribuidos. Se estima que hay un SNP por cada 1.000 nucleótidos en el genoma humano, y hay más de 3 millones de SNP en los 3 mil millones de bases humanas. Los SNP se distribuyen por todo el genoma humano. Según su posición en los genes, se pueden dividir en SNP de región codificante de genes (SNP de región codificante, cSNP), SNP periféricos de genes (SNP perigénicos, pSNP) y SNP intergénicos (SNP intergénicos). , iSNP) y otras tres categorías. 2. SNP es adecuado para la detección rápida y a gran escala. Aunque existen cuatro tipos de bases que componen el ADN, el SNP generalmente sólo consta de dos tipos de bases, por lo que es un marcador dimórfico, es decir, bialélico. Debido al dimorfismo de los SNP, es una opción. En el cribado del genoma, a menudo sólo es necesario analizar los SNP, sin analizar la longitud del fragmento. Esto favorece el desarrollo de tecnología automatizada para cribar o detectar los SNP. 3. Estimación sencilla de la frecuencia de alelos de SNP. La estimación de frecuencias alélicas utilizando muestras agrupadas es una estrategia rápida y eficaz. El principio de esta estrategia es: primero seleccionar una muestra de referencia para hacer una curva estándar, luego comparar la muestra mixta que se va a analizar con la curva estándar y determinar la frecuencia de varios alelos en la muestra mixta en función de la proporción de las señales obtenidas. . 4. Fácil de genotipar. El dimorfismo de los SNP también facilita su genotipado. La genotipificación de SNP incluye tres aspectos: (1) La reacción química utilizada para identificar genotipos. Los métodos técnicos comúnmente utilizados incluyen: hibridación molecular de ADN, extensión de cebadores, reacción de ligación de oligonucleótidos específicos de alelo, reacciones de escisión de sondas flanqueantes y variaciones basadas en estos métodos (2). ) los modos utilizados para completar estas reacciones químicas, incluidas reacciones en fase líquida, reacciones sobre soportes sólidos y reacciones que son ambas. (3) Una vez completada la reacción química, es necesario utilizar un sistema biotecnológico para detectar los resultados de la reacción.