¿Cuáles son los pasos de la transformada de Fourier de una imagen?
La explicación en el libro "Image Processing" (González edición lt; Image Processinggt;) es muy vívida: comparar la transformada de Fourier con un prisma de vidrio es una metáfora apropiada. Un prisma es una herramienta física que divide la luz en diferentes colores, y el color de cada componente está determinado por su longitud de onda (o frecuencia). La transformada de Fourier puede considerarse como un prisma matemático que descompone una función en sus componentes según la frecuencia. Cuando pensamos en la luz, hablamos de su espectro o espectro de frecuencias. Asimismo, la transformada de Fourier también puede analizar funciones en términos de sus componentes de frecuencia.
La teoría de Fourier señala que cualquier señal (como una señal de imagen) se puede expresar como una superposición de una serie de señales sinusoidales. En el campo de la imagen, el cambio en el brillo de la imagen es una variable sinusoidal. Por ejemplo, el patrón sinusoidal en la imagen a continuación puede tener una codificación de Fourier única con tres componentes: frecuencia f, amplitud A y fase γ. Estos tres valores pueden describir toda la información en la imagen sinusoidal.
1. Frecuencia
La frecuencia se puede ajustar en el dominio espacial a través del brillo, por ejemplo, la frecuencia de la imagen izquierda es menor que la frecuencia de la imagen derecha...
2. Amplitud Amplitud (Amplitud)
La amplitud de la función seno se utiliza para describir el contraste, o la diferencia entre los picos más brillantes y más oscuros de una imagen. (Los valores negativos indican una inversión de contraste, es decir, un intercambio de luz y oscuridad).
3. La fase representa el desplazamiento (izquierda o derecha) de la forma de onda con respecto a la forma de onda original.
============================================ === ======================
El código de transformada de Fourier es una serie de sinusoides cuya frecuencia de codificación oscila entre 0 (es decir, cero con brillo promedio). El ajuste comienza en la fase 0) hasta la frecuencia de Nyquist (es decir, la frecuencia más alta que se puede codificar en una imagen digital, en relación con el tamaño de píxel y la resolución). La transformada de Fourier puede codificar todas las frecuencias de la imagen simultáneamente: una señal que contiene solo una frecuencia f1 se trazará como un pico en el punto del espectro con la abscisa f1, y la altura del pico es igual a la amplitud correspondiente o la altura de la señal sinusoidal. Como se muestra a continuación.
La señal DC del término DC corresponde a un punto con una frecuencia de 0, que representa el brillo promedio de toda la imagen. Si la señal DC DC=0 representa el número de píxeles del brillo promedio. de toda la imagen = 0, se puede introducir en la imagen en escala de grises. La curva sinusoidal alterna entre valores positivos y negativos, pero como no hay valores negativos en la imagen en escala de grises, el término DC en todas las imágenes reales es positivo. , como se muestra en la figura anterior.
Debido a algunas razones de análisis matemático, la transformada de Fourier generalmente se expresa como una imagen especular, es decir, la frecuencia aumenta en ambas direcciones en el origen y la amplitud es la misma.
Lo anterior es una señal unidimensional, y la transformada de Fourier bidimensional es la superposición de la transformada de Fourier unidimensional en cada fila y columna de líneas de escaneo.
Cada píxel del espectrograma de Fourier representa un valor de frecuencia, y su amplitud proviene del cambio de brillo del píxel. El punto más brillante en el centro es el componente DC, y los puntos brillantes en el espectrograma de Fourier corresponden a puntos con mayor contraste (mayor contraste) en la imagen en escala de grises.
Dado que no hay cambios en cada línea de exploración, el vector ascendente correspondiente del espectro de Fourier es 0 y hay contraste en cada línea de exploración, por lo que hay una amplitud de frecuencia.
La frecuencia aquí es menor que la anterior y los puntos brillantes correspondientes están más concentrados que en la imagen anterior.
El significado físico de la transformada de Fourier de la imagen
Fourier propuso que cualquier función periódica puede expresarse en forma de la suma de senos y/o cosenos de diferentes frecuencias, cada una Los senos y/o cosenos se multiplican por diferentes coeficientes (series de Fourier). La frecuencia de una imagen es un indicador que describe la intensidad de los cambios en la escala de grises de una imagen y es el gradiente de la escala de grises en el espacio plano. Las frecuencias de los puntos de ruido y los bordes de la imagen son frecuencias altas.
La transformada de Fourier tiene un significado físico muy obvio en la práctica. Suponiendo que f es una señal analógica con energía finita, entonces su transformada de Fourier representa el espectro de f.
Desde un punto de vista puramente matemático, la transformada de Fourier consiste en convertir una función en una serie de funciones periódicas. Desde la perspectiva de los efectos físicos, la transformada de Fourier convierte la imagen del dominio espacial al dominio de frecuencia, mientras que su transformada inversa convierte la imagen del dominio de frecuencia al dominio espacial. En otras palabras, el significado físico de la transformada de Fourier es transformar la función de distribución de escala de grises de la imagen en la función de distribución de frecuencia de la imagen, mientras que la transformada de Fourier inversa es transformar la función de distribución de frecuencia de la imagen en una función de distribución de escala de grises.
Antes de realizar la transformada de Fourier, la imagen (mapa de bits sin comprimir) se obtiene mediante un conjunto de muestreo de una serie de puntos en un espacio continuo (espacio real), que habitualmente se representa mediante una matriz bidimensional de un punto. en el espacio, entonces la imagen se puede representar por z = f (x, y). Dado que el espacio es tridimensional y las imágenes son bidimensionales, la relación entre los objetos en el espacio en otra dimensión está representada por gradientes. De esta manera, al observar la imagen, se puede conocer la relación correspondiente entre los objetos en el espacio tridimensional. ¿Por qué mencionar el gradiente? Porque, de hecho, el espectrograma obtenido al realizar la transformada de Fourier bidimensional en la imagen es una imagen con distribución de gradiente. Por supuesto, los puntos del espectrograma y los puntos de la imagen no se corresponden uno a uno, incluso sin frecuencia. turno no. Los puntos brillantes y oscuros que vemos en el diagrama del espectro de Fourier son en realidad la diferencia entre la intensidad de un determinado punto en la imagen y los puntos adyacentes, es decir, el tamaño del gradiente, que también es el tamaño de la frecuencia de el punto (se puede entender así, en la imagen La parte de baja frecuencia se refiere al gradiente de ese punto, y la parte de baja frecuencia es opuesta a la parte de alta frecuencia). En términos generales, los puntos con grandes gradientes tienen un brillo fuerte y viceversa. De esta manera, al observar el espectrograma de transformada de Fourier (también llamado diagrama de potencia), primero se puede ver la distribución de energía de la imagen. Si el número de puntos oscuros en el espectrograma es mayor, la imagen real es más suave (porque los puntos. no son muy diferentes de sus vecinos (el gradiente es relativamente pequeño), por el contrario, si el número de puntos brillantes en el espectrograma es grande, la imagen real debe ser nítida, el límite es claro y la diferencia de píxeles en ambos lados del el límite es grande. .Después de mover el espectro al origen, puede ver que la distribución de frecuencia de la imagen está distribuida simétricamente alrededor del origen. Además de ver claramente la distribución de frecuencia de la imagen, mover el espectro al centro del círculo también tiene la ventaja de separar las señales de interferencia con patrones periódicos, como interferencia de onda sinusoidal, un par de interferencia de onda sinusoidal, etc., desplazando la frecuencia Cuando vas al origen del espectrograma, puedes ver que además del centro, hay un conjunto de puntos brillantes distribuidos simétricamente alrededor de un punto determinado. Este conjunto es el ruido de interferencia. En este momento, puedes intuitivamente. Coloque un filtro de eliminación de banda en esta posición para eliminar la interferencia.
La imagen es función de dos parámetros y puede descomponerse mediante una combinación lineal de un conjunto de funciones ortogonales, mientras que Fourier utiliza funciones armónicas para descomponerla. Para la transformada de Fourier discreta, existen condiciones para la transformada de Fourier.
La transformada de Fourier utilizada para el procesamiento de imágenes tiene varias características
1. El componente DC F(0, 0) es igual al valor promedio de la imagen;
2. El espectro de energía |F(u, v)|^2 es completamente simétrico con respecto al origen donde F=PfQ, f representa la imagen original, P y Q son matrices ortogonales reales simétricas, esta fórmula indica que es de Fourier. transform es la ortogonal de la matriz de transformación ortogonal
3 Después de traducir la imagen f (a, b), F solo tiene un cambio de fase exp[-2pij(au/M bv/M)], y el espectro de energía no cambia.
4. El promedio multiplicado de la imagen f es igual a la suma de los espectros de energía, y la dispersión de f es igual a la suma de los espectros de energía después de eliminar el componente de CC.
5. Convolución de imágenes f(x, y) y g(x, y) h(x, y) = f(x, y) * g(x, y) Transformada de Fourier H( u , v) es igual al producto de las respectivas transformadas de Fourier de f(x, y) y g(x, y).
Mediante la transformada de Fourier, cada punto de la imagen se convierte en una combinación de funciones armónicas, obteniendo así una frecuencia, y esta frecuencia es la suma de todas las frecuencias que producen escala de grises en ese punto, lo que significa que es la transformada de Fourier. La transformada separa estas frecuencias. Si desea eliminar el fondo de una imagen, simplemente elimine la frecuencia del fondo.
Al realizar una transformada de Fourier, en realidad se calcula el producto de cada posición de la imagen en una frecuencia específica.
es decir, f(x,y)exp[-j2pi(ux vy)] y luego calcular la siguiente frecuencia. Esto nos da la función de frecuencia.
Es decir, cada término de la transformada de Fourier (el valor de F(u, v) para cada par de frecuencias u, v) consiste en la suma de todos los valores de f(x) función. Por lo tanto, las frecuencias u, v determinan el contenido frecuencial de la transformación (x, y también actúan sobre la frecuencia, pero su contribución aditiva a la frecuencia es la misma).
Antes de realizar la transformada de Fourier, la función de la imagen de entrada generalmente se multiplica por (-1)^(x y), de modo que el origen de la transformada de Fourier F(0,0) se pueda mover a (M/2 , N/2) lugar.
Cada término F(u,v) contiene todos los valores de f(x,y) modificados exponencialmente, por lo que normalmente no es posible establecer una conexión entre un componente específico de una imagen y su transformación. Sin embargo, la literatura general suele explicar la conexión entre los componentes de frecuencia de la transformada de Fourier y las características espaciales de la imagen. El componente de frecuencia más lento en la transformación (u=v=0) corresponde al nivel de gris promedio de la imagen. A medida que se aleja del origen de la transformación, las frecuencias más bajas corresponden a los componentes de la imagen que se transforman lentamente, mientras que las frecuencias más altas comienzan a corresponder a niveles de gris que cambian cada vez más rápidamente en la imagen. Esto involucra los bordes de los objetos y partes de la imagen con cambios repentinos en el nivel de gris (como el ruido).
Principios básicos del filtrado en el dominio de la frecuencia
1. Multiplica la imagen de entrada por (-1)^(x y) para realizar la transformación central
2. (1) Calcule el DFT de la imagen, es decir, F(u, v)
3 Multiplique F(u, v) por la función de filtro H(u, v)
<. p>4. Calcule la DFT inversa del resultado en (3).5. Obtén la parte real del resultado en (4)
6. Multiplica el resultado en (5) por (-1)^(x y)
Además, también se deben explicar los siguientes puntos:
1. Después de que la imagen se somete a una transformación de Fourier bidimensional, se muestra su matriz de coeficientes de transformación:
Si el El origen de la matriz de transformación Fn está en el centro, entonces su energía espectral se concentra cerca del centro de la matriz corta de coeficientes de transformación (el área sombreada en la figura). Si el origen de la matriz de transformada de Fourier bidimensional Fn utilizada está ubicado en la esquina superior izquierda, entonces la energía de la señal de la imagen se concentrará en las cuatro esquinas de la matriz de coeficientes. Esto está determinado por las propiedades de la propia transformada de Fourier bidimensional. Al mismo tiempo, esto también muestra que la energía de la imagen se concentra en el área de baja frecuencia.
2. La parte de baja frecuencia de la imagen transformada antes de que se traduzcan las cuatro esquinas del origen es la más brillante, y la parte de baja frecuencia de la parte media después de la traducción es la más brillante. indica que la energía de baja frecuencia es mayor (mayor ángulo de amplitud)