¿Por qué desarrollar big data gubernamentales?
En primer lugar, explique por qué necesitamos construir una biblioteca de recursos de datos. Su propósito principal es agregar datos que originalmente estaban dispersos en varios sistemas gubernamentales. No significa agregar todos los datos, sino datos que deben compartirse entre múltiples sistemas gubernamentales y deben usarse para analizar varios tipos de datos relacionados con el big data en sí. La biblioteca de recursos de datos aquí es consistente con el centro de recursos de datos mencionado en la construcción tradicional del gobierno electrónico en términos de objetivos comerciales. Después de incorporarse a la plataforma de big data, las tecnologías relacionadas con big data, como el almacenamiento distribuido, la computación en streaming, etc. Debe incluirse en el proceso de construcción. Debe utilizarse para resolver los requisitos de datos masivos y en tiempo real.
La construcción de la biblioteca de recursos de datos en sí incluye dos aspectos. Desde una perspectiva empresarial, se centra en la construcción de estándares de datos, especificaciones e interfaces de datos y modelos de datos. El único contenido agregado es En la construcción de modelos de datos, se debe prestar más atención a la correlación entre los datos en sí. El segundo es la construcción de la plataforma de datos. Técnicamente es bastante diferente a la tradicional. Primero, en el proceso de construcción de la plataforma de datos, es necesario aplicar plataformas tecnológicas relacionadas con big data, como la plataforma Hadoop. etc. La plataforma de datos aquí no es simple. En lugar de una plataforma de almacenamiento de datos, debe proporcionar una plataforma completa con capacidades de almacenamiento, procesamiento y análisis de datos. En segundo lugar, el objetivo final de la construcción de una plataforma de big data sigue siendo realizar el procesamiento. y las capacidades de datos analizados disponibles para que el intercambio y el desarrollo reflejen el valor comercial, se requieren capacidades de servicio de intercambio de big data, es decir, la plataforma de big data en sí debe ser una plataforma de servicios con capacidades abiertas y de intercambio de datos.
La dificultad para construir una plataforma de big data no está en la tecnología sino en los negocios, lo que implica dos niveles de apertura e intercambio de datos: uno entre varios departamentos dentro del gobierno, como industria y comercio, impuestos, supervisión de calidad, etc. Si los datos de transporte y otros departamentos se pueden compartir **** implica barreras entre departamentos e intereses, y es muy difícil resolverlo en el corto plazo, en segundo lugar, las capacidades de procesamiento y análisis final de los grandes; La plataforma de datos debe extenderse aún más a las empresas y al público. ** El disfrute y la apertura fuera del sector de servicios es el segundo nivel de dificultad. En este punto, países extranjeros como Estados Unidos son mucho mejores que mi país en términos de apertura de las grandes empresas. recursos de datos y directorios de datos en departamentos gubernamentales. Para más detalles, puede leer el libro "Big Data Era" de Tu Zipei.
El segundo es acelerar la construcción de capacidades de servicios informáticos y capacidades de aplicaciones. Introducir empresas líderes de servicios de nube pública para proporcionar infraestructura como servicio (IaaS), plataforma como servicio (PaaS), software como servicio (SaaS) y otros servicios de nube pública de alta calidad. guiar información de apoyo financiero El proyecto prioriza la implementación de; información en una infraestructura unificada de computación en la nube para promover el intercambio de sistemas de información gubernamentales y recursos de información; y apunta a servicios de gobierno electrónico, transporte inteligente, logística inteligente, gestión empresarial, ciudades inteligentes, etc. en la provincia de Guizhou. Necesidades de construcción y desarrollo de la nube industrial. plataformas con sólidas funciones de servicio, nuevos modelos comerciales y grandes efectos impulsores que brindan servicios profesionales de computación en la nube para las necesidades de investigación y desarrollo corporativo, diseño de productos, control de producción, gestión de operaciones, etc., aceleran la investigación y el desarrollo de la gestión de recursos de plataformas de computación en la nube; software, productos de protección de seguridad en la nube, productos de aplicaciones de modelos de nube y el desarrollo de soluciones de sistemas de computación en la nube para áreas clave de la industria.
Interpretación: construcción de capacidades de aplicaciones y servicios informáticos
Esta parte del contenido puede considerarse básicamente como el contenido de construcción de plataformas de computación en la nube convencionales y ciudades inteligentes. La planificación gubernamental a menudo no comprende la esencia de una cosa y persigue un modelo de construcción idealizado amplio e integral. Desde los primeros días, cuando varias regiones establecieron centros especializados de computación en la nube y bases industriales, cuando se promocionó el concepto de ciudades inteligentes, todo el contenido, incluida la computación en la nube, SOA, big data e Internet de las cosas, se incluyó en la ciudad inteligente; planificación.
En la era de Big Data, el efecto de planificación que vemos es que todo el contenido parece estar incluido en la planificación de la industria de Big Data y, idealmente, se lleva a cabo una construcción integral y a gran escala. Como resultado, el proyecto de la plataforma se canceló durante la construcción. Este es un tema que todos los departamentos gubernamentales deben considerar antes de planificar big data. Es decir, ¿debe quedar claro cuál es la naturaleza de big data? Es difícil determinar qué problemas comerciales esperamos resolver mediante la construcción de una plataforma de big data, por lo que no es adecuado comenzar la planificación y construcción de la industria de big data.
Entonces, ¿las plataformas de big data y las plataformas en la nube no tienen nada que ver entre sí? Esto no es absoluto. La relación entre ambos se explica y corresponde aquí de la forma más popular. En primer lugar, los big data en sí deben almacenarse. En el proceso de procesamiento y agregación de big data, es necesario calcular la plataforma de recursos de datos. En este momento, se necesitan recursos para proporcionar capacidades informáticas y de almacenamiento. la capacidad se puede expandir elásticamente. Esto La provisión de capacidades de bloque es lo que debe lograr la capa IaaS de la plataforma de computación en la nube. En segundo lugar, el proceso de procesamiento de big data implica la integración de datos, la recopilación y agregación de datos, el procesamiento paralelo de datos, el procesamiento de flujo de datos, el análisis de datos, los servicios de datos y otras capacidades, el intercambio y la apertura. Las capacidades son capacidades de la capa de plataforma, y estas capacidades de la capa de plataforma se pueden incluir en la capa de plataforma PaaS de computación en la nube amplia.
En tercer lugar, acelerar la construcción de capacidades de análisis y utilización de big data. Fortalecer la investigación y el desarrollo de algoritmos clave y tecnologías básicas avanzadas para el análisis de big data, desarrollar herramientas profesionales de procesamiento y análisis de datos y formar una biblioteca de recursos de productos y tecnología básica de big data para aprovechar al máximo el papel de liderazgo de las grandes plataformas empresariales; ventajas innovadoras de las empresas profesionales de servicios de big data, acelerar la aplicación de big data en el mercado, desarrollar servicios de big data de terceros y proporcionar servicios de datos característicos que respalden la apertura, el intercambio y los servicios de aplicación de datos, explorar la innovación de modelos comerciales y promover el público de big data; seleccionar áreas clave de la industria, llevar a cabo aplicaciones de demostración de big data basadas en computación en la nube, promover el desarrollo de minería, análisis, aplicaciones y servicios profesionales de big data y mejorar las capacidades de aplicación de la industria de big data;
Interpretación: análisis de datos y desarrollo de capacidades de utilización
Una vez más, el núcleo de big data es la realización del valor comercial y el servicio público, y la mejora de las capacidades de servicio si construimos. Big Data Aunque las plataformas de datos y los centros de recursos de datos han logrado la agregación de datos y la estandarización de los modelos de datos, si estos datos masivos no se pueden extraer y correlacionar bien, y si el valor y las capacidades de los datos no se pueden conectar a través de servicios orientados a servicios, entonces el Las plataformas enteras de Big Data no tienen valor.
La estrategia de la industria de big data de Guizhou menciona que es relevante abrir y compartir datos, desarrollar servicios de big data de terceros, recomendar aplicaciones públicas y privadas de big data y explorar nuevos modelos de negocio. Esto sigue siendo un modelo de negocio y una cuestión de negocios, no una cuestión técnica. Los servicios de datos tienen mayor valor sólo si los datos procesados y analizados pueden usarse para la toma de decisiones y pueden proporcionar servicios públicos más eficientes al público.
Con base en las características masivas, heterogéneas, en tiempo real y de otro tipo del propio big data, se puede ver que la extracción de datos y el análisis de datos masivos y heterogéneos también deben cumplir con las características en tiempo real o cuasi-real. Los requisitos de tiempo del análisis de big data son bastante difíciles. Por un lado, esto implica el uso de CEP, procesamiento de flujo, MPP, computación paralela y otras tecnologías, y por otro lado, implica el establecimiento de modelos de análisis de correlación de datos, lo cual es indispensable;
Hay dos modelos para la construcción de plataformas de big data: uno es construir primero una plataforma de almacenamiento de datos, luego una plataforma de procesamiento y finalmente una plataforma de análisis y minería de datos; el otro es analizar si se aplica big data; Los escenarios involucrados se basan en los objetivos comerciales, y luego analizan los datos interrelacionados involucrados de acuerdo con el escenario de la aplicación, luego realizan el modelado de datos y luego consideran cómo expandir de manera eficiente y efectiva el almacenamiento, procesamiento y análisis de estos datos. Luego considere cómo almacenar, procesar y analizar estos datos de manera eficiente y escalable. Para big data gubernamentales, recomendamos el segundo enfoque, es decir, no buscar la exhaustividad desde el principio, sino lograr avances específicos para reflejar rápidamente el valor comercial que debería tener la plataforma de big data.