El rendimiento de la unidad es la última palabra en el desarrollo de SoC para teléfonos móviles durante los últimos 16 años
La revisión de IT168 tiene que decir que la industria de la telefonía móvil se ha transformado por completo de bienes electrónicos de lujo hace unos años a bienes de consumo electrónicos. Lo que alguna vez fue una transacción de caja negra se ha vuelto cada vez más transparente. La transparencia no se limita a la caída de los beneficios del hardware de telefonía móvil, sino que también refleja la racionalidad del mercado actual. Todavía recuerdo que hace unos años, las pantallas grandes y las altas frecuencias de CPU eran sinónimo de teléfonos móviles de alto precio. Sin embargo, a medida que los consumidores se vuelven cada vez más racionales, la industria del hardware en la cadena de la industria de la telefonía móvil ha ido por el camino correcto. Por ejemplo, las pantallas se están desarrollando hacia biseles estrechos, las baterías se están desarrollando hacia una alta densidad de energía/carga rápida, la fotografía se está desarrollando hacia sensibilidades de luz altas y bajas, etc. Como parte más importante del hardware de los teléfonos inteligentes, ¿cuál es la dirección de desarrollo futuro de la CPU? Hay diferentes opiniones sobre este tema. Pero hay que decir que el viejo camino de luchar por la mayor frecuencia y el mayor rendimiento ya no funciona en 2016. A partir de los últimos productos de Qualcomm, Samsung, HiSilicon, etc., también podemos ver que los principales fabricantes de CPU han avanzado hacia un rendimiento unitario competitivo en el próximo período. Para dar un ejemplo simple: cómo mejorar el rendimiento informático a una frecuencia unitaria y cómo mejorar el rendimiento con un consumo de energía ultrabajo son la clave para reflejar la fortaleza de I + D de los principales fabricantes. Hoy resumiremos los aspectos en los que los principales fabricantes están trabajando intensamente para mejorar el rendimiento de las unidades.
Actualizar completamente la arquitectura
La forma más importante de mejorar el rendimiento de la CPU es actualizar la arquitectura. En los últimos años, la arquitectura de alto rendimiento de ARM ha evolucionado de Cortex-A8/A9 a Cortex-A15/A17, y luego al gran éxito del año pasado Cortex-A57. Este año, Qualcomm, HiSilicon, etc. se han actualizado a Cortex. -Arquitectura A72. En cuanto al rendimiento, ARM afirma oficialmente que el rendimiento central de la arquitectura A72 es 3,5 veces mayor que el de la arquitectura A15 (los datos se basan en el rendimiento del A72 del proceso FinFET de 16 nm frente al A15 del proceso tradicional de 28 nm). el A57 anterior es 1,9 veces más alto que la arquitectura A15 (los datos se basan en el proceso tradicional de 20 nm (A57 versus A15 con proceso tradicional de 28 nm), por lo que podemos ver aproximadamente la mejora del rendimiento del núcleo A72 con la misma frecuencia y). proceso. En comparación con la arquitectura A57, el rendimiento del núcleo A72 debería ser entre un 25 y un 35 % mejor en el mismo proceso.
Además de mejorar el rendimiento de la CPU y reducir el consumo de energía, la arquitectura A72 también tiene otras dos características. Una es la incorporación de CoreLink CCI-500, que añade un filtro de vigilancia para que el control de vigilancia ya no se limite a la CPU dentro de un único clúster, sino que pueda extenderse a todos los núcleos de todo el procesador. Todos los núcleos del procesador. Anteriormente, esta característica solo estaba disponible en el Snapdragon 805 de Qualcomm y en los SoC insignia posteriores (Qualcomm usó su propio CCI en lugar del CCI público de ARM). En general, la incorporación de CCI-500 puede aumentar el rendimiento de la memoria en un 30, lo que permite una mejor experiencia en muchos escenarios que requieren un gran rendimiento de memoria, como video 4K, y libera aún más el rendimiento multinúcleo. De esto también podemos ver que A72 es la arquitectura con el mayor rendimiento por velocidad de reloj entre las arquitecturas de alto rendimiento existentes. Este es un hecho indiscutible. Al mismo tiempo, en comparación con el A57, el consumo de energía por unidad de velocidad de reloj también se ha reducido significativamente. Esto no solo se debe a la mejora de la potencia informática de predicción de ramas de la arquitectura A72, sino, lo que es más importante, a la incorporación de FinFET. tecnología.
Adoptar nuevos procesos
Si la serie Samsung Exynos 7420 es el proceso FinFET de 15 años, entonces 2016 es el año en el que el proceso FinFET brilla y toma la delantera. El proceso FinFET nació en la década de 1990, cuando el gobierno de EE. UU. vio la necesidad de fabricar por debajo de 25 nm. El gobierno de Estados Unidos cree que es necesario realizar investigaciones sobre procesos por debajo de 25 nm. Al entrar por debajo de 25 nm, la barrera de proceso tradicional no podrá controlar eficazmente el problema de la tasa de fuga. En este momento, el chino-estadounidense Hu Zhengming propuso la tecnología FinFET y la tecnología FD-SOI para resolver el problema de la tasa de fuga. Entre ellos, el proceso FinFET controla las fugas modificando el formulario de eliminación de la puerta.
De hecho, el consumo total de energía del chip P = Pswitch (consumo de energía cuando el circuito está conectado) Pshort (consumo de energía al eliminar el interruptor) Pleak (consumo de energía de fuga).
La razón por la cual Qualcomm Snapdragon 810 tendrá problemas con la reducción de frecuencia o incluso apagará el núcleo durante el funcionamiento es en gran medida porque el consumo de energía de fuga es demasiado alto, lo que resulta en un consumo de energía general excesivo. Incluso el consumo de energía de toda la máquina supera los 4W. Ocurre de vez en cuando. Mucha gente piensa que el Snapdragon 810 está reducido para enfriarse. De hecho, el problema fundamental es que el proceso tradicional de 20 nm ya no puede controlar el consumo de energía ultraalto causado por la fuga de la arquitectura A57. Por ello, Qualcomm también utiliza la tecnología FinFET en la nueva generación de chips SOC. Para obtener más información sobre la historia de FinFET, puede hacer clic en el vídeo promocional grabado por el equipo de Kirin para el profesor Hu Zhengming arriba. (Nota: el profesor Hu también se desempeñó como director de tecnología de TSMC durante mucho tiempo). En general, ARM afirma oficialmente que el núcleo A72 basado en el proceso FinFET de 16 nm es un 75% más bajo que el A15 de 28 nm y un 50% más bajo que el A57 de 20 nm. La arquitectura central que utiliza el tamaño big.LITTLE será más eficiente energéticamente. Todo esto se debe en gran parte a la maduración del proceso FinFET.
Mejora rápida del rendimiento del procesador
La mejora del rendimiento con un consumo de energía ultrabajo también es un objetivo de los principales fabricantes de CPU actuales. De hecho, las CPU de los teléfonos móviles y los procesadores de PC son exactamente iguales y se han ajustado específicamente para diferentes escenarios de uso desde su nacimiento. Por ejemplo, tomemos el Qualcomm MSM8250, la primera CPU comercial para teléfonos inteligentes del mundo con frecuencia de 1 GHz. Aunque su frecuencia principal más alta es 1GHz, también tiene una configuración más baja de 192MHz para diferentes escenarios de uso. Sin embargo, debido a las limitaciones de su principio de funcionamiento, los procesadores de teléfonos móviles no pueden ajustar dinámicamente la unidad más pequeña de 1MHz de manera similar a la "regulación de velocidad continua", por lo que aún se producirá un rendimiento excesivo cuando funcionen a la frecuencia más baja. Para resolver este problema surgió la tecnología de coprocesamiento. ARM lanzó la última arquitectura integrada Cortex-M7 el año pasado. La arquitectura de coprocesador para Internet de las cosas y hogares inteligentes es actualmente la más popular.
El último Cortex-M7 ofrece una mejora de rendimiento 4 veces mayor en comparación con la arquitectura Cortex-M3. Con el proceso LP de 40 nm y la frecuencia principal de 400 MHz, el rendimiento del procesador Cortex-M7 puede alcanzar 2000 Coremarks, que es básicamente el mismo que el rendimiento de la arquitectura Cortex-A. Con FPU y caché, lo más importante es la capacidad de reducir el consumo de energía en espera de los 90 mA anteriores a 6,5 mA. Para dar un ejemplo simple, el consumo de energía en espera de la pantalla 1080P de brillo más bajo es básicamente de alrededor de 90 mA. El consumo de energía en espera de 6,5 mA permite que la batería de 3500 mAh dure 500 horas. Al mismo tiempo, el Cortex-M7 de alto rendimiento también puede actuar como un centro de sensores, procesando información de varios sensores en tiempo real. Por otro ejemplo, el consumo de energía de 6,5 mA puede registrar sin saberlo el mapa de ruta de su día, monitorear su velocidad al caminar, etc., proporcionando datos cada vez más precisos para una salud inteligente.
La investigación y el desarrollo de arquitectura propietaria
En comparación con la arquitectura pública autorizada por ARM (como Cortex-A53/A57, etc.), la investigación y el desarrollo de arquitectura propietaria tienen un ordinaria pero popular Metáfora fácil de entender: "... de pie sobre los hombros de gigantes. De pie sobre los hombros de gigantes". En términos generales, después de que Qualcomm obtuvo la autorización de la versión pública de ARM, realizó modificaciones en el diseño de la versión pública que ya estaba relativamente maduro. Por ejemplo, en el diseño de la versión pública, había tres líneas de código para resolver un problema y Qualcomm lo simplificó a una. Por supuesto, lo que es más importante, se han agregado algunas características nuevas, como la actualización del mecanismo de control de memoria, etc., y finalmente se ha obtenido una arquitectura de desarrollo propio más eficiente.
Esta siempre ha sido una de las ventajas que distinguen a Qualcomm de otros fabricantes. La razón por la que Qualcomm ha podido dominar el mercado insignia de teléfonos móviles durante muchos años es que su estrategia de arquitectura de investigación y desarrollo independiente jugó un papel importante.
Tomemos como ejemplo el Snapdragon 820 que utiliza su propia arquitectura. Sin embargo, hay una cosa que vale la pena destacar en comparación. con APQ8064, Snapdragon 800 y Snapdragon 820. En comparación con el Snapdragon 801, el Snapdragon 820 utiliza un diseño de cuatro núcleos con diferentes frecuencias principales, 2*2,2 GHz y 2*1,5 GHz. Al mismo tiempo, el Snapdragon 800 anterior usaba 4aSMP, que son cuatro núcleos simétricos asíncronos. Cada núcleo se puede controlar de forma independiente y no hay diferencia en la frecuencia de cada núcleo. Este Snapdragon 820 utiliza dos conjuntos de control de núcleo 2aSMP, que son 2 2 núcleos simétricos asíncronos. En otras palabras, los dos núcleos de 1,5 GHz son sincrónicos y tienen la misma frecuencia, y los dos núcleos de 2,2 GHz también son sincrónicos y tienen la misma frecuencia. pero se adopta un diseño simétrico asincrónico entre estos dos conjuntos de grupos centrales. En este punto, puede pensar que el Snapdragon 820 también adopta un diseño big.LITTLE similar, pero según la explicación oficial de Qualcomm, este no es el caso. Los dos grupos de grupos centrales solo tienen diferentes frecuencias de reloj, pero aún usan la misma. Arquitectura krio. Con respecto a la arquitectura de desarrollo propio, hemos explicado brevemente la arquitectura Kryo anteriormente. Por cierto, podemos conocerla a través de múltiples canales. Muchos fabricantes, incluidos Samsung y LG, también han comenzado a desarrollar chips de desarrollo propio.