Red de conocimientos turísticos - Conocimientos sobre calendario chino - Método de extracción de características de dimensión espectral

Método de extracción de características de dimensión espectral

Las características se refieren a los diversos atributos y características que exhiben los objetos. La extracción de características en el análisis de imágenes de teledetección se puede lograr en dos sentidos: uno es seleccionar directamente un subconjunto (es decir, un subespacio) del espacio original de acuerdo con ciertos estándares, que en aplicaciones prácticas es la selección de bandas y el otro es encontrar un mapeo determinado; relación P entre el espacio de características original y el nuevo espacio de características, P: x→y, y asigne el espacio de características original x={x1, x2} al espacio de características dimensionalmente reducido y. ..., xn}, asigna el espacio de características original x={x1, x2, xn} al espacio de características de dimensión reducida y, y={y1, y2..., ym}, m < n. Para la extracción de características con fines de clasificación, un buen método de extracción de características puede hacer que muestras de sustancias similares estén densamente distribuidas y las muestras de diferentes tipos de sustancias se pueden separar en el espacio de características, sentando una buena base para una clasificación posterior. Dado que los datos hiperespectrales tienen las características de múltiples bandas, una alta correlación entre bandas y una alta redundancia de datos, la extracción de características de los datos de teledetección hiperespectrales es de especial importancia. La extracción de características de imágenes de teledetección incluye una amplia gama de contenidos y muchos métodos de extracción. La extracción de características de dimensión espectral y la extracción de características de dimensión espacial son los dos métodos principales de extracción de características de imágenes. Aquí presentamos principalmente algunos métodos de extracción de características de dimensión espectral para datos hiperespectrales, que involucran principalmente análisis de componentes principales, análisis de variables canónicas y un método CA mejorado.

El análisis de componentes principales (PCA) es una técnica de análisis que simplifica los múltiples indicadores originales en varios indicadores integrales independientes. Es muy eficaz para datos con alta correlación entre bandas (Cloutis, 1996). Las técnicas de PCA se han utilizado en diferentes proyectos de teledetección geológica, incluidos datos de banda ancha e hiperespectrales (Lee et al., 1990; Resmini et al., 1997; Fujimura & Kiyasu, 1994). Debido a la correlación y la alta redundancia entre las bandas de datos hiperespectrales, parece antieconómico utilizar directamente todas las bandas sin procesar para la clasificación o extracción de características. Por lo tanto, realizar primero la transformación PCA en los datos originales y luego analizar varios indicadores (componentes) integrales logrará el doble de resultado con la mitad de esfuerzo. En el análisis de datos hiperespectrales, la técnica PCA concentra la mayor parte de la varianza general dentro de los primeros componentes principales. Por lo tanto, la gente usa estos componentes principales para hacer algunos análisis geológicos, como usar el mapa compuesto de color falso de los primeros tres componentes principales para interpretar información geológica y mineral, y luego formar un mapa. Sin embargo, los colores en el mapa compuesto de componentes principales cambiarán en diferentes imágenes y no pueden representar una determinada composición mineral geológica, a menos que existan afloramientos y sobrecargas geológicas similares. Lo que es aún más difícil es que no podemos basarnos en rocas, suelos, minerales, etc. El espectro de reflectancia se utiliza como indicación para interpretar los colores en el gráfico compuesto del componente principal. También es bastante difícil determinar el significado físico de cada componente principal. Además, grandes diferencias en los minerales pueden dar como resultado sólo diferencias sutiles en los espectros, que a menudo se pasan por alto porque están sumergidos en componentes principales de alta variación. Por lo tanto, el PCA puede ser más adecuado que la identificación cuantitativa de minerales y el mapeo para la identificación aproximada de clases minerales y litológicas con diferencias espectrales significativas (Coutis, 1996).

El análisis de componentes principales de bloques desarrollado por Jia y Richards (1999) para la extracción de características ha logrado ciertos efectos de clasificación y visualización. De manera similar a la idea de la función discriminante SMLDF establecida en 3.3 y 4, dividen la matriz de correlación de todas las bandas en varios bloques de acuerdo con la correlación de las bandas adyacentes. En términos generales, los bloques de alta correlación se distribuyen a lo largo de la diagonal, mientras que los bloques de baja correlación están más alejados de la diagonal. La propia matriz de bloques agrupa bandas con correlaciones más altas entre bandas adyacentes. Por lo tanto, podemos dividirlo en varios bloques (grupos de bandas) a lo largo de la diagonal de la matriz de correlación, luego realizar la transformación del componente principal en cada grupo de bandas y finalmente reagrupar las características importantes (componentes principales) de cada grupo de bandas para realizar más funciones principales. Análisis de componentes y selección de características.

El análisis canónico también es un método matemático que simplifica una gran cantidad de variables en unas pocas variables típicas y describe de manera integral la relación entre dos variables aleatorias multivariadas a través de la correlación entre estas pocas variables típicas (Tang Shouzheng. , 1986).

Si tenemos dos variables aleatorias multivariadas (sea x una variable aleatoria p-dimensional y y una variable aleatoria q-dimensional), ¿cómo describir la cercanía de la relación entre estas dos variables aleatorias multivariadas? El método directo consiste en calcular el coeficiente de correlación u otro coeficiente de similitud entre los componentes de estas dos variables aleatorias multivariadas uno por uno, que se puede calcular como coeficiente de correlación p × q. Sin embargo, este método es engorroso y no puede describir esencialmente el nivel de correlación general entre dos variables aleatorias. De manera similar al análisis de componentes principales, se crean varias "variables compuestas" (variables canónicas) a partir de cada variable aleatoria multivariada. La raíz característica obtenida en el proceso de cálculo de las variables canónicas de cada una de las dos variables aleatorias es el coeficiente de correlación canónica del par de variables canónicas correspondiente. Si las raíces propias distintas de cero se ordenan de mayor a menor, la raíz propia más grande es el coeficiente de correlación del primer par de variables normativas (correspondiente a xey). Cuanto mayor sea el coeficiente de correlación normativa, mayor será la relación entre ellas. par de variables normativas. Generalmente en aplicaciones prácticas, solo se analizan los primeros k (k

PCA intenta principalmente separar diferentes categorías en la mayor medida posible, mientras que el análisis típico busca correlaciones entre variables de baja dimensión que pueden representar variables de alta dimensión para lograr el propósito de clasificar e identificar objetos objetivo. La utilidad potencial de los métodos analíticos típicos en aplicaciones geológicas hiperespectrales es principalmente consistente con las técnicas de PCA.

Sobre la base del análisis de las propiedades de la transformada K-L, Liu Jiangui (1999) propuso un método CA mejorado para la extracción de características orientada a la clasificación, utilizando datos hiperespectrales para identificar y extraer objetivos urbanos. El método CA selecciona una matriz de transformación apropiada, teniendo en cuenta tanto la distancia intraclase como la distancia entre clases, y busca maximizar la relación entre la distancia entre clases y la distancia intraclase proyectando los puntos de muestra de cada clase en el modelo original. espacio de características en la dimensión espectral. Esta relación se llama cociente de Rayleigh generalizado. La selección de la matriz de transformación se determina en base a este principio. Liu Jiangui (1999) utilizó este método mejorado para extraer características urbanas de Shahe Town, Beijing. Procesamiento específico: preprocesar la imagen hiperespectral original para obtener la imagen de reflectancia relativa; ② Seleccione el espectro del componente final, es decir, clasifique el espectro del componente final según la imagen y las condiciones del estudio del terreno, y finalmente obtenga 11 categorías. Encuentre la media; vector y matriz de covarianza de cada categoría; ④ Encuentre la distancia entre clases y la distancia dentro de clases entre cada par de categorías, y utilice el método de transformación CA para obtener las características transformadas, la distancia anisotrópica y el coeficiente de carga correspondientes; de las dos categorías (Liu, 1999), así como la distancia anisotrópica de cada característica en el dominio de transformación, la relación entre la distancia entre clases y la distancia intraclase de cada característica en la dimensión métrica, el coeficiente de carga puede calcularse a través de la correlación entre el componente transformado CA y la banda ⑥ Encuentre las características óptimas. Los resultados experimentales muestran que este método de extracción de características es muy eficaz. A través de este método, las características extraídas pueden aumentar la cohesión de las muestras dentro de la clase, ampliar la distancia de las muestras entre clases y eliminar simultáneamente la correlación entre bandas, mejorando así el rendimiento de la clasificación.