¿Qué es el Internet de las Cosas en Automoción?
La potencia informática es valiosa: los datos y los algoritmos requieren más soporte informático.
Como todos sabemos, entre los tres elementos principales en el desarrollo de la inteligencia artificial, tanto los datos como los algoritmos son inseparables del apoyo de la potencia informática. La potencia informática se ha convertido en un elemento clave en el desarrollo de la inteligencia artificial. .
Según el informe "Data Age 2025" publicado por IDC, el volumen de datos global (201zb = 100bb) crecerá a 175ZB para 2025. Entre ellos, China utilizará un volumen de datos de 48,6ZB y 27,6zB de datos. volumen en 2025.
Según datos de CCID Consulting, para 2030, la escala de la industria de producción de datos originales representará el 15% de la economía total, y la cantidad total de datos en China superará los 4YB, representando 30 % del total de datos globales. Los recursos de datos se han convertido en un factor clave de producción. Cada vez más industrias utilizan recursos de datos estructurados o no estructurados, como Internet de las cosas, Internet industrial y el comercio electrónico para extraer información valiosa. El procesamiento y análisis de datos masivos creará una enorme demanda de potencia informática.
Algorítmicamente, los parámetros y la complejidad de los modelos avanzados aumentan exponencialmente. Un estudio publicado anteriormente por Open AI mostró que los recursos informáticos necesarios para entrenar estos grandes modelos se duplican cada tres o cuatro meses (en comparación con el período de duplicación de 18 meses de la Ley de Moore). De 2012 a 2018, los recursos informáticos necesarios para la investigación de vanguardia en aprendizaje profundo aumentaron 300.000 veces.
Para 2020, los requisitos de potencia informática de los modelos de aprendizaje profundo alcanzarán miles de millones de operaciones por día. En febrero de 2020, Microsoft lanzó el último modelo de computación de percepción inteligente Turing-NLG, con parámetros altos de 654,38+0,75 mil millones. Se necesita más de un día para completar un solo entrenamiento con una potencia informática POPAI de 654,38+025. Posteriormente, OpenAI propuso el modelo GPT-3, con parámetros que alcanzan 65.438+07.5 mil millones y un consumo de energía informática de 3640 PetaFLOPS/s-día. Menos de un año después del lanzamiento de GPT-3, apareció un modelo de lenguaje más grande y complejo, SwitchTransformer, un modelo de lenguaje con más de un billón de parámetros.
Se puede ver que el rápido crecimiento de datos masivos y modelos más complejos están planteando mayores desafíos a la potencia informática. Si la potencia informática no se puede mejorar rápidamente, tendremos que enfrentar una mala situación: cuando se utilicen datos a gran escala para el entrenamiento y el aprendizaje de inteligencia artificial, la cantidad de datos excederá el límite superior de memoria y procesador, y todo el aprendizaje profundo y el proceso de entrenamiento será extremadamente largo, que incluso la inteligencia artificial más básica es simplemente imposible de lograr.
Precios de eficiencia más altos: los costos ambientales y reales son altos, y existe una necesidad urgente de mejorar la eficiencia.
En la industria informática, existe la suposición de que "los cálculos numéricos serán cada vez más baratos". ¿Pero Christopher, subdirector del Instituto Stanford de Inteligencia Artificial? Ese no es el caso de las aplicaciones de IA existentes, dijo Manning, especialmente debido a la creciente complejidad y competitividad de la investigación, lo que hace que el entrenamiento de modelos de vanguardia sea cada vez más costoso.
Según un artículo de investigación publicado por investigadores de la Universidad de Massachusetts Amherst, tomando como ejemplo los ciclos de entrenamiento de varios modelos comunes de IA a gran escala, se descubrió que el proceso puede emitir más de 626.000 libras. de dióxido de carbono, casi 5 veces las emisiones del ciclo de vida de los automóviles comunes (incluido el proceso de fabricación del propio automóvil).
Por ejemplo, en el procesamiento del lenguaje natural, los investigadores han estudiado los cuatro modelos con mayores mejoras de rendimiento en este campo: Transformer, ELMo, BERT y GPT-2. Los investigadores entrenaron una sola GPU durante al menos un día para medir su consumo de energía. Luego, la energía total consumida por todo el proceso se calcula utilizando varios indicadores enumerados en el documento original del modelo.
Los resultados muestran que el costo de entrenar el entorno informático aumenta directamente con el tamaño del modelo y luego se dispara cuando se utilizan pasos de ajuste adicionales para mejorar la precisión final del modelo.
En particular, el proceso de ajustar la arquitectura de la red neuronal para completar experimentos detallados y optimizar el modelo tiene costos muy altos y casi ninguna ganancia de rendimiento. La huella de carbono del modelo Burt es de aproximadamente 1.400 libras de dióxido de carbono, equivalente a las emisiones de una persona que vuela de ida y vuelta a Estados Unidos.
Además, los investigadores señalan que estas cifras son sólo fundamentales, ya que el trabajo necesario para entrenar un único modelo es todavía relativamente pequeño y la mayoría de los investigadores desarrollarán nuevos modelos desde cero o, en la práctica, construirán nuevos modelos. modelos para los existentes. El modelo cambia el conjunto de datos, lo que requerirá más tiempo para entrenar y ajustar, en otras palabras, esto generará un mayor consumo de energía. Según los cálculos, es necesario entrenar al menos 4.789 modelos en un plazo de 6 meses para construir y probar el valioso modelo final, lo que se traduce en emisiones de carbono de más de 78.000 libras. A medida que mejore la potencia informática de la IA, este problema se volverá más grave.
Según un informe reciente de Synced, Grover de la Universidad de Washington se dedica a generar y detectar noticias falsas. El costo total de entrenar un modelo Grover Mega más grande es de 25.000 dólares. OpenAI gastó 120.000 dólares para entrenarlo. Modelo de lenguaje GPT-3; Google gastó aproximadamente $6,965,438+02 para capacitar a BERT, mientras que Facebook probablemente gastó millones solo en electricidad para una ronda de capacitación del modelo más grande disponible actualmente.
En este sentido, ¿Jerome, vicepresidente de Inteligencia Artificial de Facebook? En una entrevista con la revista Wired, Pesenti consideró que el coste de la investigación en IA sigue aumentando o que nuestra investigación en este campo se ha topado con un muro. Ahora debemos considerar aspectos como la rentabilidad y saber cómo aprovechar al máximo la potencia informática existente.
En nuestra opinión, los sistemas informáticos de IA enfrentan desafíos como el diseño óptimo de las plataformas informáticas, la eficiencia informática en entornos heterogéneos complejos, el alto paralelismo y la escalabilidad de los marcos informáticos y el rendimiento informático de las aplicaciones de IA. El desarrollo de la potencia informática planteará mayores desafíos para toda la demanda informática y existe una necesidad urgente de mejorar la eficiencia de todo el sistema informático de IA.
Solución óptima: La tendencia general de los centros de computación inteligentes debería basarse en los atributos de las instalaciones públicas nacionales.
Es precisamente debido a la creciente demanda de potencia informática y la necesidad de mejorar la eficiencia que se ha convertido en una máxima prioridad construir centros de potencia informática (centros de datos) que acarreen enormes necesidades informáticas de IA.
Según la firma de investigación de mercado Synergy Research Group, a finales del segundo trimestre de 2020, el número de centros de datos globales de hiperescala había aumentado a 541, más del doble en comparación con el mismo período de 2015. Además, hay 176 centros de datos en etapa de planificación o construcción, pero al igual que los centros de datos tradicionales, el consumo de energía y los costos aumentarán significativamente.
Aquí sólo tomamos como ejemplo la construcción de centros de datos domésticos. El consumo de energía actual de los centros de datos es asombroso. El "Libro blanco sobre el estado del consumo de energía de los centros de datos de China" muestra que hay 400.000 centros de datos en China, y cada centro de datos consume un promedio de 250.000 kilovatios hora, por un total de más de 654,38 mil millones de kilovatios hora, lo que equivale a los 654,38 mil millones de kilovatios. Horas de electricidad generadas por las centrales hidroeléctricas de las Tres Gargantas y Gezhouba. La suma de las cantidades. Si se convierte en emisiones de carbono, son alrededor de 96 millones de toneladas, casi tres veces las actuales emisiones anuales de carbono de la aviación civil de China.
Sin embargo, según los estándares nacionales, para 2022, el consumo medio de energía de los centros de datos alcanzará básicamente el nivel avanzado internacional, y el PUE (cuanto menor sea el valor de eficiencia energética, mayor será el ahorro de energía) de Los centros de datos grandes y ultragrandes recién construidos alcanzarán menos de 1,4. Además, regiones desarrolladas como Beijing, Shanghai, Guangzhou y Shenzhen todavía tienen un control muy estricto sobre los indicadores de consumo de energía, lo que contradice la demanda de centros de datos centralizados en ciudades de primer y segundo nivel. Además de reducir el PUE, con la misma potencia informática, mejorar la eficiencia informática de los servidores, especialmente los centros de datos, debería ser una solución correcta.
Sin embargo, es un hecho bien conocido que ante las enormes demandas informáticas de IA antes mencionadas y el desafío de mejorar la eficiencia, se ha vuelto cada vez más difícil para los centros de datos tradicionales soportar tales demandas. Para ello han surgido servidores de IA y centros de computación inteligentes.
A diferencia de los servidores tradicionales que utilizan una única CPU, los servidores de IA suelen estar equipados con chips de aceleración como GPU, FPGA y ASIC. La combinación de CPU y chip de aceleración puede satisfacer las necesidades de interconexión de alto rendimiento, proporcionar un potente soporte informático para escenarios de aplicaciones de inteligencia artificial, como el procesamiento del lenguaje natural, la visión por computadora y la interacción de voz, y convertirse en una importante fuerza de apoyo para el desarrollo de la inteligencia artificial. inteligencia.
Cabe mencionar que ya estamos en una posición de liderazgo en el campo de los servidores de IA.
Recientemente, IDC publicó el "Informe de seguimiento semestral del mercado global de inteligencia artificial 2020HI", que proporcionó información sobre el mercado mundial de servidores de inteligencia artificial en la primera mitad de 2020. En la actualidad, el tamaño del mercado mundial semestral de servidores de inteligencia artificial ha alcanzado los 5.590 millones de dólares estadounidenses (aproximadamente 32.660 millones de yuanes). Entre ellos, Inspur ocupa el primer lugar en el mundo con una participación de mercado del 16,4%, convirtiéndose en el mayor jugador de servidores de IA del mundo. Huawei y Lenovo también han entrado en el top 5 (.
Aquí, la industria puede preguntarse por qué China lidera el mundo en servidores de IA.
Tomemos a Inspur como ejemplo. Desde 1993, Inspur desarrolló con éxito el primer servidor de minicomputadora nacional. Desde entonces, después de 30 años de acumulación, Inspur ha conquistado una serie de tecnologías centrales, como chips de interconexión de alta velocidad, hosts de aplicaciones clave, bases de datos centrales y sistemas operativos de centros de datos en la nube, y ha ocupado Una posición importante en el club global de servidores de alta gama, desde el AGX-2 con la mayor densidad del mundo hasta el AGX-5 con el mayor rendimiento, Inspur continúa estableciendo récords para los súper servidores de inteligencia artificial más poderosos del mundo. La industria está diseñada para satisfacer los requisitos de alto rendimiento de los usuarios de la industria para la informática de inteligencia artificial. Inspur siempre ha creído que los clientes de la industria quieren adquirir capacidades de inteligencia artificial, pero necesitan empresas que dominen las capacidades y tecnologías de inteligencia artificial para potenciarlas. Inspur puede desempeñar bien este papel acelerando la implementación de la inteligencia artificial y ayudando a los usuarios empresariales a abrir la puerta a las aplicaciones de inteligencia artificial.
Desde esta perspectiva, la acumulación a largo plazo de innovación tecnológica, el dominio de las tecnologías centrales y El juicio preciso y la investigación y el desarrollo de industrias y tecnologías son la base para liderar el camino.
Acerca del Centro de Computación Inteligente, la "Guía de Construcción y Planificación del Centro de Computación Inteligente" publicada el año pasado anunció la arquitectura técnica del mismo. Centro de computación inteligente, que se basa en la última teoría de inteligencia artificial y adopta una arquitectura informática de inteligencia artificial líder a través de los cuatro enlaces operativos principales de producción, agregación, programación y liberación de energía informática, apoya y lidera el desarrollo de la economía digital y la industria inteligente. , aplicaciones de ciudad inteligente y sociedad inteligente y salud ecológica.
En general, los centros de computación inteligentes en la era inteligente son como plantas de energía en la era industrial. es el proceso de generar, agregar, programar y liberar potencia informática de IA, permitiendo que entren datos y salga sabiduría. Este es el objetivo ideal del centro de computación inteligente. A diferencia de los centros de datos tradicionales, los "centros informáticos inteligentes" no solo concentran potencia informática de alta densidad, sino que también resuelven el problema de la programación y la utilización eficaz de los recursos informáticos, los datos y los algoritmos, que se parecen más a la evolución de las calculadoras al cerebro. , sus características de estándares abiertos, eficiencia intensiva e inclusión universal no solo pueden cubrir la integración de más tecnologías y productos de software y hardware, sino que también reducen en gran medida el umbral de acceso y aplicación de la IA industrial hasta que todas las personas puedan beneficiarse.
De hecho, si observa detenidamente, encontrará que la generación, agregación, programación y liberación de potencia informática incluida en el centro de computación inteligente puede describirse como un conjunto de capacidades de IA, con capacidades de IA de pila completa.
Aquí, también podríamos tomar Inspur como ejemplo nuevamente para ver qué son las capacidades de IA de pila completa.
Por ejemplo, a nivel de producción de potencia informática, Inspur tiene. creó la gama más sólida y completa de productos informáticos de IA de la industria. Entre ellos, el servidor de inteligencia artificial de nueva generación NF5488A5 desarrollado por Inspur rompió el razonamiento MLPerf AI de una sola vez en 2020. Prueba comparativa de capacitación 19 récords mundiales (para garantizar suficiente potencia informática y resolver la necesidad de mejorar la potencia informática a nivel de programación de potencia informática, la plataforma de desarrollo de inteligencia artificial Inspur AIStation puede proporcionar una plataforma completa y una gestión de procesos completos para la capacitación en desarrollo de modelos de IA); y soporte de implementación de inferencia, que ayuda a las empresas a mejorar la utilización de recursos y la eficiencia del desarrollo en más del 90%, y acelerar el desarrollo de IA y la innovación de aplicaciones (resuelva el problema de la eficiencia de la potencia informática en términos de potencia informática agregada, Inspur continúa creando una mayor eficiencia y); equipos de aceleración de hardware de menor latencia, que optimizan la pila de software en términos de liberación de potencia informática, Inspur AutoML Suite proporciona a los clientes y desarrolladores de inteligencia artificial la capacidad de desarrollar modelos de IA de forma rápida y eficiente, abre una nueva forma de modelado de IA totalmente automático y acelera las aplicaciones industriales.
El siguiente paso es: ¿qué camino de desarrollo debe tomar el centro de computación inteligente para desempeñar plenamente su papel y aprovechar al máximo todo?
Según una investigación de IDC, más del 90% de las empresas están utilizando o planean utilizar inteligencia artificial dentro de tres años, y el 74,5% de ellas espera adoptar una plataforma significativa de infraestructura específica de inteligencia artificial en el futuro para Reducir costes. Costos de innovación y mejora de la disponibilidad de recursos informáticos.
Desde esta perspectiva, el principio público de la construcción de un centro de computación inteligente es particularmente importante en el presente y en el futuro, es decir, el centro de computación inteligente no es una infraestructura rentable, pero debería ser un sistema similar de conservación de agua. y asuntos del agua La naturaleza pública y la infraestructura pública del sistema y el sistema de energía llevarán servicios de vida residentes inteligentes y servicios gubernamentales inteligentes. Por lo tanto, durante el proceso de planificación y construcción del centro de computación inteligente, es necesario hacer un buen diseño. Esto no debe lograrse mediante la competencia del mercado, sino que debe reflejar la planificación, el ritmo y el diseño del gobierno para promover la inteligenteización de toda la sociedad. .
Resumen: En la actualidad, la potencia informática se ha convertido en la base para promover la economía digital y la base de la "nueva infraestructura" de China. ¿Cómo ver racionalmente los desafíos encontrados en su desarrollo mientras se mejora continuamente la potencia informática? La eficiencia, la adopción de las mejores estrategias y formas de desarrollo y la búsqueda de las mejores soluciones se convertirán en la máxima prioridad de los departamentos gubernamentales pertinentes y las empresas relacionadas.