Realización de una revisión del direccionamiento unificado de la APU Kaveri de nueva generación de AMD
Revisión de IT168 En el CES a principios de este año, AMD anunció oficialmente la APU-Kaveri de tercera generación. Esta es la actualización más importante desde el nacimiento de la APU en 2011. No solo utiliza el GCN. núcleo GPU de arquitectura por primera vez. También es la primera APU que admite computación heterogénea HSA, logrando un direccionamiento unificado de la CPU y GPU, llevando la computación heterogénea a un nuevo nivel.
Sin embargo, el primer lote de Kaveri no se conectó a la plataforma móvil, pero tomó la delantera al ingresar al mercado del bricolaje. AMD actualizó sus procesadores de escritorio en enero. Después de medio año de espera, la APU Kaveri, especialmente diseñada para computadoras portátiles, finalmente fue lanzada oficialmente en el Taipei Compute Show 2014.
▲Nuevas características de la versión móvil de Kaveri APU
Kaveri, diseñado para computadoras portátiles, proporciona hasta 4 núcleos X86 "aplanadoras" y 8 núcleos GPU de arquitectura GCN, admite tecnología Mantle y es compatible con DirectX11.2, el acelerador multimedia se actualiza a UVD4.2\VCE2.0 y se agrega la tecnología AMD TrueAudio. El modelo más alto admite la interfaz PCI-E de tercera generación y la memoria DDR3-2133.
▲Agregue la tecnología AMD TrueAudio
Numerosas actualizaciones de hardware y la tecnología de software avanzada de AMD le brindan una mejor experiencia de usuario. Como APU de nueva generación, Kaveri es igual que el producto de la generación anterior. admite la tecnología de transmisión rápida de AMD, la tecnología antivibración de video, el control de gestos y el inicio de sesión facial. Además, Kaveri también agrega una nueva experiencia de audio: la tecnología AMD TrueAudio, que está controlada por un núcleo dedicado integrado dentro de Kaveri, cuando se realiza una optimización especial del sonido. , es más eficiente y no ocupa recursos de CPU.
▲Ingrese al mercado comercial móvil
En términos de diseño de producto, Kaveri ofrece APU serie A de voltaje estándar y APU serie A de bajo consumo de energía para el mercado de entretenimiento en el hogar, y por primera vez. tiempo en la APU de plataforma móvil Uniéndose a la serie FX superior, es la APU de mayor especificación para la versión móvil de Kaveri.
Al mismo tiempo, AMD también ingresó por primera vez al campo de las PC comerciales móviles, lanzando la serie APU AMD PRO especialmente diseñada para portátiles comerciales. Se puede decir que la APU AMD Kaveri es una de las. Los productos más importantes en la historia de AMD, no solo tecnología avanzada, conceptos avanzados y cobertura integral de productos.
Rediseñar el núcleo para tener 12 núcleos de computación no es un sueño
▲4 núcleos de CPU y 8 núcleos de GPU
Kaveri, como APU de nueva generación, proporciona todos con 4 núcleos de CPU con arquitectura "Steamroller" y 8 núcleos de GPU con arquitectura GCN, un total de 12 núcleos de procesamiento disponibles, cada núcleo se puede usar de forma independiente. Aunque las arquitecturas de CPU y GPU son diferentes, las poderosas diferencias de AMD en el sistema de arquitectura. Estos 12 núcleos se utilizan de manera efectiva para lograr una mayor potencia informática, por lo que AMD llama a estos 12 núcleos informáticos "COMPUTE CORE".
▲Mejoras en los núcleos de la CPU
Por supuesto, bajo la arquitectura informática heterogénea avanzada, el rendimiento informático de cada núcleo también es muy importante. En lo que respecta al núcleo de la CPU, Kaveri integra dos CPU de arquitectura "Steamroller" diseñadas con módulos de doble núcleo. En comparación con el núcleo "Pile Driver" anterior, el "Steamroller" puede reducir la tasa de pérdida de i-Cache en un 30%. recuperación de instrucciones La tasa de error de predicción de bifurcación se reduce en un 20%, la eficiencia del trabajo del programador mejora al menos entre un 5% y un 10% y el ancho de banda de envío máximo de cada subproceso aumenta en más de un 25%, logrando en última instancia un rendimiento único más sólido. capacidades de ejecución central y mayor rendimiento por vatio.
▲KAVERI presta más atención al rendimiento de los gráficos
Además de mejorar la CPU, Kaveri también ha actualizado el núcleo de procesamiento de gráficos. Integra el núcleo de visualización de arquitectura GCN en la APU. por primera vez, y el 47% de los transistores se asignan específicamente a la tarjeta gráfica, lo que demuestra que Kaveri concede gran importancia a las capacidades de procesamiento de gráficos.
▲Núcleo de gráficos de arquitectura GCN
▲Proporciona 8 motores informáticos asíncronos
Kaveri integra 8 núcleos de gráficos de arquitectura GCN, cada núcleo tiene una rama independiente y una unidad de información. registro vectorial, programador, unidad vectorial, unidad escalar, unidad de filtro de textura y otras estructuras. Al mismo tiempo, la parte de GPU de Kaveri también tiene ocho motores informáticos asíncronos. Cada motor puede gestionar hasta ocho colas y puede controlarse con la tarjeta gráfica. Los procesadores se ejecutan en paralelo y se programan y asignan tareas de forma independiente, lo que permite realizar múltiples tareas de manera eficiente.
El direccionamiento de memoria unificada CPUGPU libera todo el potencial informático
No hay duda de que las mejoras en CPU y GPU le han dado a KAVERI un mejor rendimiento, pero es solo cuando la CPU y la GPU se dan cuenta. dirección unificada que esto es lo más llamativo de KAVERI.
La arquitectura HSA (Arquitectura de sistemas heterogéneos) admitida por Kaveri permite que la CPU y la GPU en la APU logren un direccionamiento de memoria unificado a través de la tecnología hUMA. La GPU y la CPU son mutuamente visibles para el espacio de memoria general y pueden acceder. simultáneamente, mejorando así la potencia informática general de la APU. La ventaja de esto es que permite que la CPU y la GPU funcionen mejor juntas, programen recursos de manera más flexible y mejoren el rendimiento informático general de la APU, lo que reduce significativamente el efecto de retraso causado por el direccionamiento de memoria independiente.
▲Direccionamiento de memoria unificada
Entonces, ¿qué es el direccionamiento unificado? En pocas palabras, la CPU y la GPU pueden compartir recursos de memoria. En el pasado, cuando no había un direccionamiento unificado, se asignaba un área de tamaño fijo en la memoria para que la tarjeta gráfica la usara como memoria de video, y la parte restante era. Se dejan en la CPU, aunque todos se usaron al mismo tiempo en un espacio de memoria, pero la CPU no puede acceder directamente a la parte utilizada como memoria de video. Cuando la CPU necesita la GPU para calcular algo, necesita copiar los datos. Primero la memoria de video, luego la GPU realiza el procesamiento y los resultados completos se envían de regreso a la CPU. Esto da como resultado múltiples transmisiones de datos, lo que consume recursos del sistema y aumenta la probabilidad de errores de datos. En segundo lugar, la asignación del espacio de almacenamiento no es lo suficientemente inteligente. Si la memoria de video dividida es demasiado grande, causará desperdicio y si es demasiado pequeña. , no será suficiente. No es bueno para una mayor distribución.
▲hUMA realiza un direccionamiento unificado
El último Kaveri de AMD realiza un direccionamiento unificado de CPU y GPU a través de la tecnología hUMA. La CPU y la GPU pueden compartir el mismo espacio de almacenamiento de memoria y la CPU puede acceder directamente. la dirección de almacenamiento de la GPU, como dos mensajeros en un edificio que realizan entregas urgentes a los clientes en el Edificio A y el Edificio B. El número de la casa en el Edificio A está escrito en números y el número de la casa en el Edificio B está escrito en números. El número está escrito en código Morse. El hermano que entrega el mensajero en la Torre A solo sabe números. El chico guapo que entrega cosas en la Torre B solo entiende el código Morse. Cuando la persona en la Torre A quiere enviar un mensajero a la Torre B, el persona en la Torre A Debido a que el mensajero no puede leer el código Morse, no puede encontrar la dirección específica. Solo puede recibir los productos primero y luego pasarlos al mensajero en el Edificio B para su entrega. sin direccionamiento unificado.
Ahora hUMA ha cambiado el número de casa del Bloque B a números y le ha enseñado al mensajero del Bloque B a leer números. En este momento, los números de casa del Bloque A y del Bloque B son los mismos, y ambos mensajeros. Si puede entenderlo, este es un direccionamiento unificado. La CPU y la GPU son como estos dos mensajeros. Este edificio es la memoria. Los edificios A y B son los espacios de almacenamiento divididos para la CPU y la GPU. Dos diferentes, es problemático comunicarse entre sí. HUMA los reemplaza con direcciones de memoria unificadas, lo que no solo hace que la interacción de datos entre la parte de la CPU y la parte de la GPU sea más directa, sino que también asigna dinámicamente espacio de memoria para mejorar la utilización de la memoria.
▲La APU es más eficiente
Se puede decir que la tecnología hUMA resuelve los obstáculos entre la lectura y el acceso a la memoria para diferentes tipos de núcleos informáticos en el sistema, uniendo completamente la CPU y la GPU. Juntos, juegan un papel positivo en la informática heterogénea y avanzan aún más en la integración de CPU y GPU.
Actualice el acelerador multimedia y agregue un núcleo de sonido independiente
Hoy en día, el procesador está muy integrado. No solo integra la unidad informática CPU y la unidad informática GPU, sino que también integra. Muchos módulos especializados se utilizan para procesar datos específicos, como aceleradores multimedia.
▲KAVERI actualizó el acelerador multimedia
Como todos sabemos, la codificación y decodificación de video consume recursos del sistema. Muchos usuarios recordarán que al comienzo de la popularidad de 1080P, muchas computadoras jugaban. Los videos Full HD serán muy poco fluidos. Esto se debe a que en ese momento no había soporte central específico para la decodificación de video. Se dependía completamente de la decodificación suave de la CPU, lo que consumía muchos recursos del sistema. no solo mejoró la potencia informática, sino que también agregó funciones especiales para la decodificación de video. El núcleo de codificación y decodificación es el acelerador multimedia.
▲La codificación de vídeo se actualiza a VCE 2
En la parte del motor de codificación de vídeo, Kaveri se actualiza a VCE2, compatible con H.264 YUV420 (cuadros I, P y B), H. Codificación temporal .264 SVC y VCE DEM (modo de codificación de pantalla), H.264 YUV444 (cuadro I) recientemente agregado para pantalla inalámbrica de 60 GHz.
▲Decodificación de video unificada actualizada a UVD4
En la parte de decodificación, Kaveri admite H.264 / AVCHD con corrección de errores mejorada, VC-1 / WMV perfil D, MPEG-2 , Multi-View Codec (MVC), MPEG-4/DivX, en comparación con el UVD3 anterior, la mejora no es muy grande, solo mejora la capacidad de corrección de errores de la decodificación de video H.264/AVCHD.
▲Nueva tecnología AMD TRUEAUDIO
Al tratarse de un acelerador multimedia, además de gráficos e imágenes, Kaveri añade por primera vez un núcleo de procesamiento de audio dedicado a la APU, proporcionando a AMD La tecnología TRUEAUDIO, que puede combinar la simulación de señal de doble canal, genera audio multicanal con un sentido más direccional, que puede identificar los sonidos principales en ambientes ruidosos, reducir los decibeles del ruido ambiental, mejorar la claridad de los sonidos y brindar a los usuarios una mejor calidad. en los ámbitos de los servicios de entretenimiento y videollamadas.
Reduciendo el consumo de energía e ingresando a las PC comerciales, la primera versión móvil de la serie FX
Después de comprender las numerosas actualizaciones y características de la APU AMD Kaveri, echemos un vistazo a la nueva generación. de APU móviles Se incluyen esos modelos específicos.
▲ Resumen del modelo de la APU móvil de nueva generación de AMD
En la tabla resumen anterior de la APU móvil de nueva generación de AMD, podemos ver tres aspectos destacados:
◆AMD FX-7600P y AMD FX-7500
◆APU ULV comercial de la serie A
◆El TDP de la APU ULV es tan bajo como 19W y 17W
▲Primero promocionando el versión móvil de la serie FX
Primero hablemos del FX-7600P. La serie FX no es ajena a los usuarios que se centran en el bricolaje. Es el modelo mejor posicionado entre los procesadores de escritorio de AMD y la herramienta de overclocking favorita para los jugadores de overclocking. Sin embargo, antes de Kaveri, el nombre FX nunca había aparecido en los procesadores de plataformas móviles de AMD. FX-7600P es la primera APU de plataforma móvil de AMD y el procesador para portátiles más potente de AMD hasta la fecha, mientras que AMD FX-7500 es la APU insignia de bajo consumo, dirigida principalmente al mercado de portátiles ultradelgados.
En términos de parámetros, el FX-7600P integra una sola pantalla Radeon R7, tiene 12 núcleos de computación (4 núcleos de CPU + 8 núcleos de GPU), una frecuencia base de 2,7 GHz, un overclocking inteligente máximo de 3,6 GHz y admite Hasta memoria DDR3-2133, TDP 35W, admite la tercera generación de PCI Express y su rendimiento es muy emocionante.
Además, la APU de voltaje estándar de la serie A está diseñada principalmente para computadoras portátiles de alto rendimiento, con un consumo de energía de diseño térmico máximo de 35 W, mientras que la serie de bajo voltaje está diseñada principalmente para computadoras portátiles ultradelgadas. , con un consumo de energía de diseño térmico de solo 19 W, en comparación con los 25 W del producto de la generación anterior, se reduce en 6 W. Al mismo tiempo que garantiza una potencia de procesamiento suficiente, también reduce el calor generado por toda la máquina y mejora la duración de la batería. producto.
▲Lanzamiento de la APU de la serie AMD PRO para el mercado comercial
Al mismo tiempo, también vimos una nueva serie, la APU comercial de bajo voltaje de la serie AMD A. Esta es la primera. tiempo que AMD ha apuntado En comparación con la APU normal, la APU de plataforma móvil lanzada en el mercado comercial tiene "Pro" después de su nombre. Estas tres letras significan que la APU de la serie comercial de AMD puede proporcionar un mejor rendimiento en términos de rendimiento, durabilidad y estabilidad. Cumplir con los requisitos de los usuarios empresariales en términos de confiabilidad y eficiencia en el trabajo.
AMD FX-7600P apareció en la primera prueba de rendimiento de APU de 12 núcleos
A través de la introducción anterior, tenemos una comprensión relativamente completa de Kaveri. A continuación, nos centraremos en el. Serie Kaveri de gama alta. APU AMD FX-7600P para pruebas más detalladas.
▲AMD FX-7600P
La imagen de arriba muestra de manera integral los detalles de los parámetros de AMD FX-7600P. Su consumo de energía térmica de diseño es de 35 W y tiene 12 núcleos informáticos (COMPUTE CORE). , que incluye 4 núcleos X86 "apisonadores" y 8 núcleos GPU de arquitectura GCN, integrando una sola pantalla Radeon R7.
Además del AMD FX-7600P, el prototipo probado en esta ocasión está equipado con una unidad de estado sólido Samsung de 256 GB y dos memorias Micron DDR3-1866 de 4 GB. Su sistema de almacenamiento ha alcanzado el nivel más alto. ordenadores portátiles actuales y puede maximizar el rendimiento de AMD FX-7600P.
◆CINEBENCH R11.5
▲¡El rendimiento de la CPU casi se duplica!
CINEBENCH R11.5 es actualmente el sistema de prueba de CPU y GPU más popular. Para esta prueba, nos centramos principalmente en los resultados de la prueba de CPU multinúcleo de CINEBENCH R11.5. Como resultado, la capacidad de procesamiento multinúcleo de la CPU de AMD FX-7600P casi se ha duplicado en comparación con la generación anterior A10-5750M.
◆Musemage
Musemage es el primer software de procesamiento de imágenes del mundo que admite la aceleración de GPU. Contiene una serie de funciones avanzadas y una interfaz de usuario fácil de usar cuando los usuarios procesan fotografías. Musemage puede aprovechar la CPU y la GPU para trabajar juntas y lograr velocidades de procesador más rápidas.
▲La APU de nueva generación puede ahorrar un 30 % de tiempo de procesamiento en comparación con productos anteriores.
En esta prueba, Musemage realizó reducción de ruido, enfoque, desenfoque y contraste automático, balance de blancos. y otros procesamientos múltiples, el prototipo equipado con la APU AMD FX-7600P integrada con pantalla única Radeon R7 obtuvo una puntuación total de 5302 puntos y el tiempo de procesamiento fue de 18859 ms, mientras que la generación anterior APU A10-5750M + HD8570M sola Esta puntuación de la prueba es 3750 puntos y tarda 26661 ms, lo que significa que la APU de nueva generación puede ahorrar un 30% del tiempo de procesamiento en comparación con el producto anterior.
◆PCmark 8
PCmark 8 es una nueva generación de software completo de pruebas comparativas de rendimiento de máquinas que proporciona cinco tipos diferentes de aplicaciones domésticas, creativas, de trabajo, de almacenamiento y para diferentes aplicaciones. modos. Entre ellos, Almacenamiento prueba principalmente el rendimiento del almacenamiento y la estabilidad de la computadora, mientras que Aplicaciones prueba principalmente software de terceros como Microsoft Office. Para los usuarios domésticos normales, la prueba Home tiene más valor de referencia, por lo que probamos el prototipo en este modo.
▲Resultados de PCmark 8
A juzgar por los resultados de la prueba, el portátil equipado con AMD FX-7600P logró una puntuación total de 3023 puntos, lo que demuestra que su rendimiento informático es sólido y el Toda la máquina La calidad general es excelente y puede proporcionar un buen soporte para la navegación web diaria, reproducción de video, transcodificación de video, juegos, etc.
El rendimiento integrado de una sola pantalla y un sólido rendimiento en juegos se acercan a los de una pantalla única
Como nueva generación de APU insignia, AMD FX-7600P no solo duplica el procesamiento La potencia de la CPU, pero también tiene un rendimiento de pantalla única Radeon R7 incorporado también es muy llamativo.
La pantalla única Radeon R7 tiene 8 núcleos GPU de arquitectura GCN, admite Direct. El modelo más alto admite la interfaz PCI-E de tercera generación y memoria DDR3-2133.
◆3Dmark 11
▲Resultados de la prueba 3Dmark 11
Para juzgar el rendimiento de las tarjetas gráficas para juegos, 3Dmark es definitivamente la prueba comparativa más profesional y autorizada actualmente. .Programa, y los resultados de sus pruebas tienen un valor de referencia muy importante. Para la pantalla única Radeon R7, en la prueba 3Dmark 11, ¡la puntuación del proyecto de gráficos alcanzó 2095 puntos! Ha alcanzado el nivel de gráficos independientes de gama media, que es aproximadamente un 50% más alto que la generación anterior Radeon HD8610G.
◆3Dmark?
Similar a 3Dmark 11, 3Dmark es el software de referencia de última generación de Futuremark. Proporciona tres entornos de prueba para diferentes niveles de tarjetas gráficas. FireStrike está diseñado para gráficos basados en DirectX11. Diseñado como un producto de alta gama, CloudGate admite hardware convencional basado en DirectX10, mientras que IceStorm está diseñado para dispositivos DirectX9 de nivel básico.
▲Resultados de la prueba 3Dmark
Para Radeon R7, su prueba FireStrike tiene una puntuación total de 1260 y una puntuación de proyecto gráfico de 1406, en comparación con la A10-5750M con una puntuación total de 865 y una puntuación de proyecto de gráficos de 930 En comparación con los puntos, AMD FX-7600P Radeon R7 ha mejorado en un 45% y un 51%, lo que puede satisfacer los juegos 3D convencionales como "Resident Evil 6" y "Blade and Soul" en resolución Full HD. Si se combina con la tarjeta gráfica independiente de nueva generación de AMD, el rendimiento del juego híbrido después del tiroteo es bastante emocionante.
Resumen: el direccionamiento de memoria unificada es de gran importancia
Después de la introducción detallada anterior, creo que todos tienen una comprensión más completa de la nueva generación de Kaveri de AMD. Lo afirma Kaveri PU. De hecho, el rendimiento ha mejorado significativamente en comparación con los productos de la generación anterior. Tome el FX-7600P probado esta vez como ejemplo. El núcleo de GPU con arquitectura GCN de 4 núcleos X86 + 8 núcleos ha alcanzado el nivel. La configuración más alta de la APU de nueva generación de AMD, que muestra la más alta tecnología de AMD en el campo de CPU y GPU, y la tecnología hUMA introducida con la arquitectura HSA, realiza un direccionamiento unificado de CPU y GPU, acelera la integración de CPU y GPU, señala la dirección y ampliar el camino para el desarrollo futuro de APU.
A juzgar por los resultados de las pruebas, FX-7600P, como producto estrella de la familia Kaveri en plataformas móviles, tiene el doble de potencia de procesamiento de su CPU en comparación con el modelo insignia de la generación anterior en nuevas aplicaciones que admiten GPU. Computación colaborativa, FX -7600P tiene enormes ventajas de rendimiento.
Al mismo tiempo, la GPU con arquitectura GCN de 8 núcleos que utiliza un 47 % de transistores brinda un rendimiento de juego al FX-7600P comparable a los gráficos independientes de rango medio. El AMD TrueAudio recientemente agregado mejora la experiencia del usuario. Disfrute de la experiencia auditiva y la tecnología Mantle mejora la eficiencia de ejecución de los juegos, lo que permite a los usuarios que la eligen obtener una mejor experiencia de audio y visual al jugar.
No hay duda de que la nueva generación de Kaveri tiene muchos aspectos destacados y mejoras significativas de rendimiento, pero para liberar todas sus capacidades, inevitablemente necesitará soporte de software, y la computación heterogénea que defiende AMD es la El mayor beneficio del futuro del desarrollo de PC es administrar de forma centralizada la potencia informática de cada parte de la máquina y asignar racionalmente los recursos que aporta, simplemente mejorando la potencia informática de la CPU, es incomparable en esta etapa.
Por lo tanto, el software que admite computación heterogénea definitivamente será cada vez más abundante en el futuro, y el modelo de computación heterogénea no se limita a la CPU y GPU x86 que se utilizan actualmente en las PC. También se incluirán los chips de procesamiento de arquitectura ARM más populares.