Cancele la diferencia entre agrupación, muestreo ascendente y deconvolución.
La agrupación también se denomina reducción de resolución. Su método de operación es el mismo que la convolución ordinaria, pero se puede dividir en agrupación máxima y agrupación promedio según el valor máximo o el valor promedio, y no existe un proceso de retropropagación (. No es necesario aprender parámetros).
La Figura (a) muestra el proceso de UnPooling, que se caracteriza por retener la información de posición del valor máximo durante la agrupación del valor máximo y luego usar esta información para expandir el mapa de características en la etapa de UnPooling. A excepción de la posición del valor máximo, el resto se rellena con 0.
Por el contrario, la Figura (b) muestra el proceso de muestreo superior UnSampling UnPooling. La diferencia entre los dos es que el valor máximo de agrupación UnSampling es el mismo que el valor máximo y el valor promedio es el mismo. como valor máximo. La diferencia entre los dos es que la etapa UnSampling no utiliza la información de ubicación de MaxPooling, sino que copia directamente el contenido para expandir el mapa de características.
La figura (c) muestra el proceso de convolución inversa, que es el proceso inverso de convolución, también llamado convolución transformada. La mayor diferencia es que el proceso de convolución inversa es un parámetro que debe aprenderse (similar al proceso de convolución), mientras que la agrupación y el muestreo ascendente no tienen un proceso de retropropagación. En teoría, la desagrupación y el desamuestreo se pueden lograr mediante la deconvolución siempre que los parámetros del núcleo de convolución estén configurados adecuadamente.
Artículo de referencia
/fate_fjh/article/details/52882134
Deconvolución = Convolución transpuesta
Cálculo de convolución y correspondientes Para operaciones de deconvolución, la relación entre entrada y salida es exactamente la opuesta. Si calculamos la deconvolución usando la deconvolución de la convolución sin considerar los canales, podemos incluso discretizar la convolución y así encontrar la deconvolución (solo a modo de ilustración, esto no se hace en la práctica).
La imagen original se muestra en azul, el relleno agregado por la convolución correspondiente (generalmente todos 0) se muestra en blanco y la imagen convolucionada se muestra en verde. El deslizamiento de la convolución en la figura comienza desde la superposición de la esquina inferior derecha del núcleo de convolución y la esquina superior izquierda de la imagen. El tamaño del paso deslizante es 1. El elemento central del núcleo de convolución corresponde al punto de píxel de. la imagen convolucionada. Puede ver que la imagen convolucionada es 4X4, que es más grande que la 2X2 original. Aún recordamos que el tamaño de la convolución unidimensional es n1 + n2-1. La imagen original aquí es 2X2 y el núcleo de convolución es 3X3. y el resultado de la convolución es 4X4, que corresponde exactamente a una dimensión (a través de la convolución ordinaria, el tamaño de la nueva imagen es el mismo que el de la imagen original, o más pequeño, pero se vuelve más grande después de la convolución unidimensional). De hecho, esta es una convolución completa y cualquier otra convolución menor que este valor es el resultado de seleccionar algunos píxeles en la convolución.
Aquí podemos resumir tres fórmulas de cálculo para el tamaño de la imagen después de la convolución: convolución completa, convolución idéntica y convolución efectiva:
1. Completo: paso deslizante La longitud es 1, el el tamaño de la imagen es entrada x entrada, el tamaño del núcleo de convolución es KxK y el tamaño de la imagen después de la convolución es: (Entrada+K-1) x (Entrada+K-1)
Igual que: El paso deslizante el tamaño es 1, el tamaño de la imagen es 2x2, el tamaño del núcleo de convolución es 3x3 y el tamaño de la imagen convolucionada es 4x4
: 4x4
2. Lo mismo: el tamaño del paso deslizante es 1. El tamaño de la imagen es entrada x entrada, el tamaño del núcleo de convolución es KxK y el tamaño de la imagen después de la convolución es: entrada x entrada, el tamaño del núcleo de convolución es KxK y el tamaño de la imagen después de la convolución es: 4x4