Red de conocimientos turísticos - Información de alquiler - Marco de codificación de vídeo para codificación de vídeo Full HD

Marco de codificación de vídeo para codificación de vídeo Full HD

H.261

El estándar H.261 está diseñado para ISDN. Está diseñado principalmente para codificación y decodificación en tiempo real. El retardo de compresión y descompresión de la señal no supera los 150 ms. y la velocidad del código es px64kbps (p = 1 ~ 30).

El estándar H.261 utiliza principalmente tecnologías de compresión como predicción entre cuadros con compensación de movimiento, transformación DCT, cuantificación adaptativa y codificación de entropía. Solo hay cuadros I y cuadros P, pero no cuadros B, y la precisión de la estimación del movimiento solo es precisa al nivel de píxeles. Se admiten dos formatos de escaneo de imágenes: QCIF y CIF.

H.263

El estándar H.263 es un estándar internacional para la codificación de imágenes con tasas de bits muy bajas. Por un lado, se basa en H.261 y es híbrido. la codificación como núcleo es muy similar al diagrama de bloques esquemático y la organización del flujo de código y datos originales también es similar. Por otro lado, H.263 también absorbe partes efectivas y razonables de otros estándares internacionales como MPEG; , como: estimación de movimiento con precisión de medio píxel, predicción de cuadros PB, etc., lo que hace que su rendimiento sea mejor que H.261.

La velocidad de bits utilizada por H.263 puede ser inferior a 64 Kb/s y no es necesario que la velocidad de bits de transmisión sea fija (velocidad de bits variable). H.263 admite múltiples resoluciones: SQCIF (128x96), QCIF, CIF, 4CIF, 16CIF.

Estándares internacionales relacionados con H.261 y H.263

Estándares internacionales relacionados con H.261

H.320: Sistema de Videofonía de Banda Estrecha y equipos terminales;

H.221: Estructura de trama de canal de 64~1 920 Kb/s en servicios de telecomunicaciones audiovisuales;

H.230: Control de sincronización de trama y señales de indicación para sistemas audiovisuales ;

H.242: Sistema que utiliza terminales audiovisuales con canales digitales de hasta 2Mb/s.

Estándares internacionales relacionados con H.263

H.324: Equipo terminal de comunicaciones multimedia con muy baja velocidad binaria;

H.223: Multimedia con muy baja velocidad binaria protocolo compuesto de comunicación;

H.245: Protocolo de control de comunicación multimedia;

G.723.1.1: Codificador de voz con velocidades de transmisión de 5,3 Kb/s y 6,3 Kb/s.

JPEG

La Organización Internacional de Normalización estableció el JPEG (Joint Photographic Expert Group) en 1986, que se dedica principalmente a formular estándares para tono continuo, escala de grises multinivel y estática. Estándar de codificación de compresión de imágenes digitales. El método de codificación comúnmente utilizado basado en la transformada de coseno discreta (DCT) es el contenido principal del algoritmo JPEG.

MPEG-1/2

El estándar MPEG-1 se utiliza para codificar imágenes en movimiento y los sonidos que las acompañan en medios de almacenamiento digital, con una velocidad de bits de 1,5 Mb/s. El diagrama de bloques esquemático de vídeo de MPEG-1 es similar al de H.261.

Características de la tecnología de compresión de vídeo MPEG-1: 1. Acceso aleatorio; 2. Búsqueda rápida hacia adelante/hacia atrás; 3. Reproducción inversa; 5. Tolerancia a fallos; Retraso en la decodificación. Estrategia de compresión de vídeo MPEG-1: para mejorar la relación de compresión, se debe utilizar simultáneamente la tecnología de compresión de datos de imagen intra-cuadro/entre-cuadro. El algoritmo de compresión intracuadro es aproximadamente el mismo que el algoritmo de compresión JPEG y utiliza tecnología de codificación de transformación basada en DCT para reducir la información espacial redundante. El algoritmo de compresión entre cuadros utiliza el método de predicción y el método de interpolación. El error de predicción se puede comprimir aún más mediante la codificación de transformación DCT. La tecnología de codificación entre cuadros puede reducir la información redundante en la dirección del eje del tiempo.

MPEG-2 se denomina "estándar de televisión del siglo XXI". Se han realizado muchas ampliaciones y mejoras importantes sobre la base de MPEG-1, pero el algoritmo básico es el mismo que el de MPEG-1.

MPEG-4

El estándar MPEG-4 no reemplaza a MPEG-2. Se centra en diferentes áreas de aplicación.

La intención original de MPEG-4 era principalmente satisfacer las necesidades de compresión de velocidad de bits ultrabaja (menos de 64 Kb/s) para videoconferencias y videoteléfonos. Durante el proceso de formulación, la organización MPEG sintió profundamente que la demanda de la gente por información multimedia, especialmente información en vídeo, ha pasado de la reproducción al acceso, recuperación y operación basados ​​en contenido.

MPEG-4 es muy diferente de JPEG y MPEG-1/2 mencionados anteriormente. Proporciona una plataforma más amplia para la compresión y codificación de datos multimedia. Define un formato, un marco en lugar de un algoritmo específico. espera establecer un entorno de comunicación y desarrollo más libre. Por lo tanto, el nuevo objetivo de MPEG-4 se define como: admitir una variedad de aplicaciones multimedia, especialmente la recuperación basada en contenido y el acceso a información multimedia, y los decodificadores se pueden configurar en el sitio de acuerdo con los diferentes requisitos de la aplicación. El sistema de codificación también es abierto y en cualquier momento se pueden añadir módulos de algoritmos nuevos y eficaces. Las aplicaciones incluyen comunicación audiovisual en tiempo real, comunicación multimedia, monitoreo/vigilancia remota, VOD, compras/entretenimiento desde el hogar, etc. MPEG-4 tiene muchas ventajas. Su tasa de compresión puede superar las 100 veces y al mismo tiempo mantener una excelente calidad de sonido e imagen; puede utilizar la menor cantidad de datos para obtener la mejor calidad de imagen para satisfacer las necesidades de aplicaciones de baja velocidad de bits. Es más adecuado para servicios AV interactivos y monitoreo remoto. Para satisfacer las necesidades de diversas aplicaciones, el estándar MPEG-4 tiene un amplio alcance de uso y una amplia adaptabilidad y escalabilidad.

1. Codificación de formas

Para obtener información de formas, primero debemos analizar y segmentar los gráficos, segmentar cada objetivo que represente contenido diferente y luego usar formas para representarlos. La información de forma suele estar representada por un

plano alfa binario. El plano Alfa binario se puede codificar aritméticamente con información de proximidad (CAE); el plano Alfa en escala de grises se puede codificar con compensación de movimiento más transformación DCT similar a la codificación de texturas.

Las transformaciones utilizadas para la compresión de imágenes incluyen la transformada de Forier discreta (DFT), la transformada de wavelet discreta (DWT), la descomposición de valores singulares (SVD), la transformada K-L, la transformada de Walsh, la transformada de Hadamard, la transformada de Harr, la transformada Slant, transformada de coseno discreta (DCT). Entre ellas, la transformada K-L tiene la mejor descorrelación y DCT es la transformación más conveniente que se acerca al efecto de la transformada K-L. Al igual que MPEG-1/2, MPEG-4 también eligió DCT. Generalmente, los métodos de codificación entrópica utilizados para la compresión de datos incluyen codificación Huffman, cuantificación vectorial, codificación aritmética, codificación de longitud de ejecución, codificación LZW, etc. Para la codificación de texturas, MPEG-4 optó por realizar codificación de programación híbrida (VLC) en codificación de longitud de ejecución, cuantificación de vectores y codificación de Huffman. La codificación de texturas requiere transformación DCT, cuantificación, predicción DC/AC, escaneo y codificación VLC basada en Hufman.

2. Estimación y compensación de movimiento

MPEG-4 proporciona tecnología de compensación y estimación de movimiento basada en bloques para utilizar de manera efectiva la redundancia temporal del contenido de video en cada VOP. En general, la estimación y compensación del movimiento puede verse como una extensión de las técnicas de coincidencia de bloques para secuencias de imágenes con formas arbitrarias. El proceso de coincidencia de bloques se utiliza para macrobloques estándar; el error de predicción se codifica junto con el vector de movimiento de macrobloque utilizado para la predicción; el modo de compensación de movimiento avanzado admite compensación de movimiento de bloques superpuestos y puede codificar vectores de movimiento de bloques de 8 × 8. Para lograr una alta eficiencia de codificación para la estimación del movimiento, cuanto más similares sean la imagen predicha y la imagen predicha, mejor, por lo que se debe realizar una compensación antes de la estimación del movimiento. Los MB en el límite objetivo se llenan primero horizontalmente y luego verticalmente, y los MB restantes completamente fuera del VOP se llenan con expansión.

3. Codificación de textura

La textura se refiere a la información de la imagen que queda después de la compensación de movimiento de imágenes I-VOP y P/B-VOP. Las texturas generalmente se comprimen y se codifican con entropía en el dominio de transformación. Se han publicado ediciones cuasi formales: Estándar de codificación de compresión de imágenes fijas (JPEG); Estándar de codificación de compresión de almacenamiento audiovisual digital (MPEG-1); Estándar universal de codificación de compresión de imágenes de video (MPEG-2).

Posteriormente, el grupo de expertos en MPEG anunció oficialmente la versión MPEG-4 (ISO/IEC14496) V1.0 en febrero de 1999. A finales del mismo año, también se completó la versión MPEG-4V2.0 y se convirtió oficialmente en un estándar internacional a principios de 2000. El estándar MPEG-4 integra muchas aplicaciones multimedia en un marco completo, con el objetivo de proporcionar algoritmos y herramientas estándar para entornos de aplicaciones y comunicaciones multimedia, estableciendo así un algoritmo que pueda usarse ampliamente en la transmisión, el almacenamiento y la recuperación de datos multimedia. El formato está unificado y los decodificadores se pueden configurar en el sitio de acuerdo con los diferentes requisitos de la aplicación. También se pueden agregar módulos de algoritmos nuevos y efectivos al sistema de codificación abierta en cualquier momento. Para permitir el acceso al contenido de vídeo, MPEG-4 propuso el concepto de "objetos de vídeo".

4. Flexibilidad

En la actualidad, el grupo de expertos MPEG ha lanzado el esquema de codificación MPEG-7 y el estándar de marco multimedia MPEG-21 que admiten específicamente información multimedia y se basan en contenido. recuperación. Además, el nuevo estándar H.264 desarrollado conjuntamente por ITU-T y MPEG es el último algoritmo de codificación de vídeo. Para reducir la tasa de bits y obtener la mejor calidad de imagen posible, el estándar H.264 aprovecha los puntos fuertes del MPEG-4, tiene una mayor relación de compresión y una mejor adaptabilidad de canales, y seguramente ganará terreno en el campo del vídeo digital. comunicación y almacenamiento. Tiene una amplia gama de aplicaciones y su potencial de desarrollo es ilimitado.

La flexibilidad del vídeo incluye flexibilidad de espacio y flexibilidad de tiempo. Se pueden obtener diferentes resoluciones espaciales mediante extensión y flexibilidad espacial, y se pueden obtener diferentes resoluciones temporales mediante extensión y flexibilidad de tiempo. Cada tipo de estiramiento y flexión tiene múltiples capas. Cuando solo hay dos capas, alta y baja, la capa inferior se refiere a la capa básica y la capa alta se refiere a la capa de refuerzo.

5. Evitar errores

Un error de bit en el código VLC provocará una pérdida de sincronización y la compensación de movimiento provocará una transmisión de error. La prevención de errores MPEG-4 tiene tres aspectos: resincronización, recuperación de datos y ocultación de errores. La resincronización se refiere a la tecnología de resincronizar el decodificador y el flujo de código después de que se detecta el error. En términos generales, este método descarta datos entre el punto de sincronización antes del error y el punto de sincronización reconstruido. Sin embargo, estos datos descartados se pueden recuperar y ocultar el error utilizando otras técnicas. Las herramientas de recuperación de datos se utilizan para recuperar datos descartados después de que se restablece la sincronización entre el decodificador y el tren codificado. Estas herramientas no utilizan simplemente la recuperación de código tolerante a errores, sino que utilizan un método para evitar errores, es decir,

utilizar palabras de código VLC reversibles para la codificación VLC. Los errores están ocultos y se pueden manejar fácilmente después de que la resincronización los localice de manera efectiva. Para mejorar aún más la capacidad de ocultación de errores, es necesario aumentar la capacidad de localización de errores. En particular, se puede utilizar la segmentación de datos para mejorar la capacidad de localización de errores.

JVT: Una nueva generación de estándares de compresión de vídeo

JVT es un equipo conjunto de vídeo establecido por ISO/IEC MPEG y ITU-T VCEG, dedicado a una nueva generación de estándares de compresión de vídeo. Desarrollo de estándares de compresión de vídeo digital.

El nombre oficial del estándar JVT en ISO/IEC es: estándar MPEG-4 AVC (parte 10); su nombre en ITU-T: H.264 (anteriormente llamado H.26L)

p>

H264/AVC

H264 combina las ventajas de estándares anteriores y absorbe la experiencia acumulada en la formulación de estándares anteriores. Adopta un diseño simple, lo que lo hace más fácil de promover que MPEG4. H.264 crea nuevas tecnologías de compresión, como múltiples cuadros de referencia, múltiples tipos de bloques, transformación de enteros y predicción intracuadro, y utiliza vectores de movimiento de subpíxeles más refinados (1/4, 1/8) y una nueva generación de bucles. .filtro, mejorando enormemente el rendimiento de la compresión y haciendo el sistema más completo.

H.264 tiene principalmente las siguientes ventajas:

-Compresión eficiente: en comparación con H.263 y MPEG4 SP, la tasa de bits se reduce en un 50%

- Buena flexibilidad en restricciones de retardo

-Tolerancia a fallos

-Escalabilidad de la complejidad de codificación/decodificación

-Decodificación de detalles completos: sin discrepancias

-Aplicación de alta calidad

-Amigable con la red

Tecnología de codificación de vídeo en vigilancia

Actualmente, MJPEG se utiliza principalmente en vigilancia, MPEG1/2, MPEG4 (SP /ASP), H.264/AVC y otras tecnologías de codificación de vídeo. Para el usuario final, las principales cosas que más le preocupan son: claridad, capacidad de almacenamiento (ancho de banda), estabilidad y precio. El uso de diferentes tecnologías de compresión afectará en gran medida a los factores anteriores.

MJPEG

La tecnología de compresión MJPEG (Motion JPEG) se desarrolla principalmente en base a la compresión de video estática. Su característica principal es que básicamente no considera las diferencias entre diferentes cuadros en la transmisión de video. Cambiar, solo comprimir un determinado cuadro individualmente.

La tecnología de compresión MJPEG puede obtener imágenes de vídeo de alta definición y puede ajustar dinámicamente la velocidad de fotogramas y la resolución. Sin embargo, dado que los cambios entre fotogramas no se tienen en cuenta, se almacena repetidamente una gran cantidad de información redundante. Por lo tanto, un solo fotograma de vídeo ocupa un gran espacio. Lo mejor de la tecnología MJPEG actualmente popular sólo puede alcanzar 3K bytes/. fotograma, que normalmente tarda entre 8 y 20K.

MPEG-1/2

El estándar MPEG-1 comprime principalmente imágenes con resolución estándar SIF (352X240 para NTSC; 352X288 para PAL). El objetivo principal es una tasa de bits de compresión de 1,5 Mb. /s En comparación con la tecnología MJPEG, MPEG1 tiene mejoras significativas en la compresión en tiempo real, el volumen de datos por cuadro y la velocidad de procesamiento. Sin embargo, MPEG1 también tiene muchas desventajas: la capacidad de almacenamiento sigue siendo demasiado grande, la definición no es lo suficientemente alta y la transmisión por red es difícil.

MPEG-2 se ha ampliado y mejorado sobre la base de MPEG-1 y es compatible con versiones anteriores de MPEG-1. Está dirigido principalmente a medios de almacenamiento, televisión digital, alta definición y otros campos de aplicaciones. La resolución es: baja (352x288), media (720x480), siguiente más alta (1440x1080), alta (1920x1080). En comparación con MPEG-1, el vídeo MPEG-2 tiene una resolución mejorada y cumple con los requisitos de alta definición de los usuarios. Sin embargo, debido a la falta de mejora en el rendimiento de la compresión, la capacidad de almacenamiento sigue siendo demasiado grande y no es adecuada para la transmisión por red. .

MPEG-4

El algoritmo de compresión de vídeo MPEG-4 ha mejorado significativamente la compresión de baja velocidad de bits en comparación con MPEG-1/2, con compresión de vídeo CIF (352*288) o superior. en alta definición (768*576) tiene mayores ventajas que MPEG1 en términos de definición y capacidad de almacenamiento, y es más adecuado para transmisión en red. Además, MPEG-4 puede ajustar fácilmente y de forma dinámica la velocidad de fotogramas y la velocidad de bits para reducir la capacidad de almacenamiento.

El diseño del sistema MPEG-4 es demasiado complejo, lo que dificulta su implementación completa y compatibilidad con MPEG-4. Es difícil implementar MPEG-4 en videoconferencias, videotelefonía y otros campos, lo que se desvía. de la intención original.

Además, las empresas chinas también se enfrentan a altas tasas de patentes. Las regulaciones actuales son:

-Cada equipo de decodificación debe pagarse a MPEG-LA 0,25 dólares

-Equipo de codificación/decodificación. También es necesario pagar en función del tiempo (4 centavos/día = 1,2 dólares estadounidenses/mes = 14,4 dólares estadounidenses/año)

H.264/AVC

H.264 integra el anterior estándares Ventajas, se han logrado avances en muchas áreas, lo que le permite lograr un rendimiento general mucho mejor que los estándares anteriores:

- En comparación con H.263 y MPEG-4 SP, puede ahorrar hasta 50 velocidades de bits, Reduce en gran medida la capacidad de almacenamiento;

-H.264 puede proporcionar una mayor calidad de vídeo en diferentes resoluciones y diferentes velocidades de bits;

-Adopta una estructura y sintaxis "compatibles con la red" para hacerlo más propicio para la transmisión de red.

H.264 adopta un diseño simple, lo que lo hace más fácil de promocionar que MPEG4, más fácil de implementar en videoconferencias y videollamadas, más fácil de lograr interconexión e interoperabilidad y puede integrarse fácilmente con estándares de bits bajos. como G.729 tasa de compresión de voz para formar un sistema completo.

MPEG LA absorbió la lección de los altos costos de patente de MPEG-4, lo que dificultó su promoción. MPEG LA ha formulado los siguientes estándares de carga H.264 de bajo costo: H.264 es básicamente gratuito. cuando se transmiten integrados en productos. Para el codificador/decodificador H.264, no se cobra ninguna tarifa por la producción anual de menos de 100.000 unidades, 0,2 USD por cada unidad que supere las 100.000 unidades y 0,1 USD por cada unidad que supere los 5 millones de unidades. Las bajas tarifas de patentes facilitan la globalización de los productos de vigilancia H.264 de China.