¿Qué pasaría si mil millones de personas navegaran por un sitio web al mismo tiempo y todas presionaran F5 y no lo soltaran?
El sitio web colapsará y ningún sitio web podrá resistirlo.
Podemos estimar aproximadamente que la velocidad de actualización de un teclado normal puede alcanzar 1000 veces por segundo como máximo. Teniendo en cuenta que hay muchos software que no requieren una velocidad de respuesta tan rápida, este software reducirá esta velocidad. Frecuencia para ahorrar recursos informáticos. Lo probé yo mismo usando el navegador de Google. Presione f12 para abrir la consola y seleccione la opción de red. Mantenga presionado f5 sin soltarlo (presionar f5 directamente en la interfaz del navegador solo se actualizará una vez. Creo que esto puede no estar en línea con). la intención original del interrogador) En este momento, la consola se actualiza rápidamente, docenas de veces por segundo mediante inspección visual. Contando 10 veces, la cantidad de vistas generadas por mil millones de personas que mantienen presionado F5 sin soltarlo puede alcanzar los 10 mil millones por segundo. .
Echemos otro vistazo al que puede ser el sitio web con mayor concurrencia en un corto período de tiempo en el mundo: Taobao durante Double Eleven. No tenemos datos concretos, pero podemos hacer una estimación en base a algunos datos proporcionados online. El mayor número de visitas a Taobao debería ser los pocos minutos después de la medianoche del día 11. De hecho, el volumen de transacciones de Taobao crece más rápidamente durante esos minutos. Supongo que el pico de pedidos por segundo también se produce en este momento, que es de 544.000 por segundo. . Suponiendo que una persona entre mil hiciera un pedido, el número de visitas en ese momento era de unos 500 millones por segundo. De hecho, aunque Taobao no ha fallado en este momento, muchas páginas han experimentado retrasos y muchos datos no se pueden actualizar. Las condiciones en la pregunta exceden con creces este número, y Taobao no puede soportar esta cantidad de visitas en absoluto (de hecho, he tratado de subestimar el número de visitas causadas por mil millones de personas con F5, y sobreestimé el número de visitas que Taobao soportará). durante las visitas de Double Eleven). No creo que ningún sitio web pueda manejar una cantidad tan grande de tráfico.
De hecho, mil millones de personas representan cerca de una séptima parte de la población mundial. No hay manera de que una página pueda atraer a tanta gente a visitarla al mismo tiempo, y el sitio web no lo tendrá en cuenta. alta concurrencia al diseñar.
El acceso a sitios web en la vida real es mucho más complicado que esto. Aquí hay solo una estimación aproximada para discutir. Todos pueden expresar diferentes opiniones.
Después de ver a un amigo planteando preguntas en los comentarios, lo probé yo mismo y luego leí el registro de Apache 21 veces. Esto solo representa mis propias pruebas y no se garantiza que sea exacto. todos.
El efecto del legendario ataque de inundación es el siguiente: bloqueará instantáneamente la red, lo que provocará que el acceso al sitio web sea lento o inaccesible. En la actualidad, solo Alibaba puede resistirlo.
Mil millones. las personas navegan por un sitio web al mismo tiempo y presionan F5 para actualizarlo continuamente. En realidad, no existe tal sitio web. Si lo hay, ¡definitivamente fallará!
Pero en realidad, ¿quién es el sitio web que más se acerca a la hipótesis del tema? Ese es 12306, que a menudo es rociado por personas de todo el país durante el Festival de Primavera. También podríamos echar un vistazo a los datos de tráfico actuales de 12306.
En 2018, el funcionario ferroviario proporcionó un número de tráfico de páginas de 12,306 durante el período de viaje del Festival de Primavera, durante el período pico, el PV de un solo día fue de 150 mil millones de veces y la tarifa promedio por hora fue de 1500. /17=8,8 mil millones de veces (Nota: los boletos no se venden durante 6 días desde las 23:00 del 12306 hasta el día siguiente, por lo que eliminé estas 7 horas aquí). Es decir, 12306 tiene 8.800 millones de visitas por hora, lo que equivale a 147 millones de visitas por minuto.
Esta cantidad de datos ya es bastante sorprendente. Incluso Taobao Double 11 no se puede comparar con 12306. Al mismo tiempo, tenga en cuenta aquí que el funcionario ferroviario solo habla del número de visitas a la página. Si se agregan funciones como consulta de bases de datos, emisión de boletos, etc., la presión sobre 12306 será mayor y la carga será mayor. Por lo tanto, a escala global, es el único sitio web realmente asombroso que puede soportar el impacto de cientos de millones de personas en todo el país al mismo tiempo. El resto es el alto impacto del tráfico simultáneo de Taobao Double 11.
Se puede decir que el sistema 12306 actual supera a cualquier sistema de venta flash actual.
En la actualidad, el número de visitas recibidas por 12306 sigue aumentando gradualmente, porque el número de personas que toman el tren durante la Fiesta de la Primavera también aumenta año tras año. Mucha gente se pregunta por qué es cada vez más. Es más difícil comprar boletos después de que 12306 comenzó a comprar boletos en línea. ¿Por qué no hice cola para comprar boletos fuera de línea? De hecho, muchas personas han ignorado el fenómeno del aumento del número de personas que viajan durante el transporte ferroviario del Festival de Primavera.
De los 100 millones de visitantes iniciales durante la fiebre de viajes del Festival de Primavera, el número ha aumentado año tras año a más de 400 millones en la actualidad. Obviamente, las entradas son cada vez más difíciles de comprar. El crecimiento de esta cifra en realidad refleja el crecimiento de la capacidad de transporte ferroviario a lo largo de los años, pero este crecimiento de la capacidad no puede satisfacer las necesidades de viaje de cada vez más personas.
Este año 12306 volvió a estrellarse, obviamente más gente compró boletos.
Punto de vista del oficial de tecnología de Lscssh:
En términos de dificultad técnica integral, la tecnología implementada por 12306 es mucho más compleja que la plataforma de comercio electrónico Taobao si realmente comprende. Tecnología, se sorprenderá de lo que hace 12306 actualmente. De lo contrario, en su opinión, definitivamente no será tan bueno como Taobao y Tmall.
En primer lugar, felicitar a nuestra gente por tener el tiempo y la gracia de navegar por el mismo sitio web.
Hace ocho años, la respuesta a esta pregunta era parálisis. Fácilmente verías un mensaje de que el sitio web es inaccesible en su apogeo. Hoy, la respuesta es felicitaciones por un sitio web de este nivel. resolvió este problema con el mismo humor pausado y elegante; incluso si no pueden resolverlo ellos mismos, encontrarán maestros de artes marciales para resolverlo. El ejemplo más intuitivo es el sitio web 12306 de mi país.
En los primeros años, poco después de que se anunciara el sistema de compra de entradas en línea 12306, llegó el Festival de Primavera. Hermanos de todo el mundo, con el entusiasmo de volver a casa para reunirse, presionaron F5 para pasar los boletos juntos, lo que provocó que el sitio web colapsara. Así es, paralizado. En ese momento, además de la velocidad de la mano, lo más importante para conseguir billetes era la suerte.
Así que desde entonces, han ido surgiendo una tras otra todo tipo de noticias negativas sobre 12306. Abarca desde la arquitectura del sistema y los servidores hasta los aspectos más pequeños, incluida la experiencia del usuario. Incluso en el salón de comunicación de los gerentes de productos de Internet, la revisión del sitio web 12306 resultó ser un material didáctico negativo y se utilizó sin sentido.
12306 ha experimentado las dificultades iniciales, pero aún tiene que enfrentar dificultades inevitables, como el Transporte del Festival de Primavera y la Semana Dorada del Día Nacional. 12306 convocó a expertos y arquitectos de empresas de Internet con experiencia en concurrencia de big data para brindar sugerencias para el sitio web y optimizar completamente la arquitectura del sistema. Se desconoce cuánto se ha cambiado la arquitectura y cuánta refactorización se ha realizado. Con el tiempo, todo el mundo estará de acuerdo en que las relaciones de datos de 12306 suelen ser mucho más complicadas que las de las empresas habituales de Internet. Después de experimentar una gran concurrencia muchas veces, todos sienten que el sistema es mucho más estable.
Un año durante el Festival de Primavera, el sistema de compra de entradas fue tan sencillo como antes. 12306 ni siquiera dejó una impresión de parálisis. Posteriormente, 12306 y Alibaba Cloud anunciaron una cooperación estratégica. 12306 planteó un grave desafío para Alibaba Cloud, y Alibaba Cloud estuvo a la altura de las expectativas y protegió 12306.
De hecho, la gran concurrencia siempre ha sido un problema que hay que afrontar en la era de la información. 12306 es solo un ejemplo. Hoy en día, la gran concurrencia ha generado escenarios más complejos. Mientras estábamos comprando felices en Double 11, ocasionalmente sentimos por un momento la presión que ejerce la gran concurrencia en el sitio web. Sin embargo, los usuarios se han vuelto más tranquilos porque creen que el sitio web restablecerá el servicio paralizado de inmediato con esta tecnología. Sólo espera~
Con mil millones de usuarios accediendo simultáneamente, ningún sitio web grande puede manejar este tipo de tráfico actualmente. Hace unos días, 12306 falló y algunas personas especularon que fue causado por tráfico excesivo. El "Servicio 12306" tiene un QPS que ningún sistema de venta flash del mundo puede superar. ¡Millones de simultaneidad no son más que normales! Sin embargo, si los sitios web grandes no pueden manejar la gran cantidad de visitas, la alta concurrencia y los datos masivos, aún así colapsarán si no pueden resolver el problema del alto acceso simultáneo por parte de múltiples usuarios.
El alto nivel actual de transporte de tráfico simultáneo de Taobao.
El Carnaval anual de Double Eleven es un representante típico del alto acceso simultáneo periódico. ¡En 1 minuto y 36 segundos, el volumen de transacciones se disparó a 10 mil millones! La arquitectura del sistema de alta concurrencia generalmente adopta la implementación de clústeres distribuidos y la capa superior de servicios tiene equilibrio de carga capa por capa. El tráfico de acceso se distribuye uniformemente según las diferentes capacidades de carga del servidor y estrategias de configuración para garantizar una alta disponibilidad del sistema. Por supuesto, también existe la función auxiliar del sistema de recuperación ante desastres.
Para Double Eleven en 2019, Tmall Taobao creó un pico de 545.000 transacciones por segundo y procesó un pico de 2.551 millones de mensajes en tiempo real por segundo. Sin embargo, los usuarios no sintieron ninguna inquietud durante las compras y los pagos. y fue suave y suave. Una de las tecnologías desarrolladas independientemente por Alipay Technology, la base de datos distribuida OceanBase, actualizó una vez más el pico de procesamiento de la base de datos, alcanzando 61 millones de veces por segundo.
El rendimiento del servidor y las capacidades de procesamiento simultáneo del programa son limitados. Cuando el sitio web tiene una gran concurrencia y una gran carga, se paralizará y se producirá el fenómeno de bloqueo de denegación de servicio. Para "mil millones de personas que navegan por el mismo sitio web al mismo tiempo", mil millones de visitas simultáneas serían difíciles de manejar para cualquier sitio web grande.
El equilibrio de carga, el uso razonable de la concurrencia y la asincronía y el aprovechamiento de los servidores multinúcleo... siguen siendo temas importantes para la investigación y exploración actuales. Ha evolucionado debido a la demanda, desde la arquitectura independiente inicial hasta la tecnología de contenedorización para lograr el aislamiento del entorno operativo y la gestión dinámica de servicios. Ahora el sistema también se puede implementar en la nube pública, utilizando los enormes recursos de la máquina de la nube pública para resolverlo. El problema de los recursos de hardware dinámicos. La situación en la que la concurrencia alcanza decenas de millones y cientos de millones de niveles es también un proceso de evolución continua de la arquitectura del lado del servidor.
Si es una prueba, bueno, parece que este escenario solo será una prueba. Depende del tipo de sitio web. Si simplemente navega por la web y realiza almacenamiento en caché estático, no hay problema. agregue un CDN que no cueste dinero
Servidor raíz principal, en los Estados Unidos, los ingenieros chinos con presupuesto de operación y mantenimiento de red también tienen expertos destacados. Hasta ahora, nunca había oído hablar de que el servidor raíz principal estuviera atascado. La red que utiliza es de pago, cuánto dinero paga y cuántos servicios de red de alta calidad se le brindan. Los ingenieros de redes no pueden tener este sentido común, no reserven espacio de compatibilidad y presionen F5 en el teclado con frecuencia. y continúe actualizando, depende de si la CPU de su computadora es lo suficientemente potente, no lo hará. Si afecta el uso de Internet por parte de otras personas o el uso excesivo de Internet, los servidores de los principales operadores de red limitarán su velocidad. para darle un cable de red y permitirle abrir un cibercafé. La cantidad de dinero que pague determinará lo que disfrutará del servicio restringido de red. Definitivamente no es realista ganar mucho dinero con un costo en dólares. Los ingenieros de redes no son personas que solo comen arroz blanco sin verduras. No dejarán puertas traseras para que los piratas informáticos utilicen la red limitada sin control. entonces tu La idea de intentar romper el servidor raíz principal no se realizará.
Una pregunta muy interesante, que se extiende a la relación de acceso entre usuarios y servidores ¿Qué factores afectarán a nuestro acceso? Este problema ya se presagia en el título:
Entonces, analicemos brevemente estos dos aspectos para ver si existe un sitio web que admita mil millones de usuarios al mismo tiempo.
1. Discusión sobre problemas de tráfico del sitio web
Con el rápido desarrollo de Internet, el contenido del sitio web ya no es monótono. Hay múltiples elementos como imágenes, audios, videos, etc. en una página, lo que da El ancho de banda de transmisión genera cierta presión.
No calculamos en función de las circunstancias especiales de la reproducción de vídeo, sino que solo realizamos estimaciones en función del tráfico pico de las páginas web generales. Teniendo en cuenta factores como imágenes de alta definición, voz, flash, etc., se estima inicialmente que el ancho de banda máximo requiere 200K por segundo. Entonces, ¿cuánto ancho de banda se necesita si mil millones de personas acceden a él al mismo tiempo? No seas impaciente, déjame sacar la calculadora y calcularla con cuidado. Para facilitar el cálculo, no usaré el acarreo de 1024 por el momento y usaré el acarreo de aproximadamente 1000 (1M = 1024K). El tráfico máximo generado instantáneamente es 200000G, que es 200T. La transmisión de red actual admite hasta 100G, pero existen pocos escenarios de aplicación reales. Calculamos en función de los 100G ideales.
Entonces, el ancho de banda de un solo servidor definitivamente no podrá satisfacer el uso simultáneo de mil millones de personas. Se requieren 200.000G divididos por 100G de servidores para lograr este objetivo. Obviamente, la construcción de 2.000 servidores es. No es realista (no es imposible, solo pero el costo es demasiado elevado).
2. Preguntas sobre si el programa y el rendimiento del servidor son compatibles
Tomemos como ejemplos 12306 y Taobao Mall, dos sitios web de alto tráfico, y sabrá que mil millones de personas visitarlos al mismo tiempo que la presión provocaba.
Se acerca el Festival de Primavera anual y también es el momento en que es más probable que 12306 colapse. Se sospechaba que éste, el 12306, se había vuelto a estrellar no hace mucho. Primero echemos un vistazo a las estadísticas del período pico de 12306 en 2018:
¡Recuerde este número de 1,648 millones de veces por segundo!
Hablemos de Taobao La referencia más valiosa de Taobao es el número de visitas de usuarios durante Double Eleven. Según estadísticas relevantes, los datos de acceso máximo de usuarios de Taobao durante Double Eleven fueron 42 millones de veces por segundo. Aun así, Taobao todavía se enfrentaba a un enemigo formidable esa noche, y hacía todo lo posible para evitar problemas de red y de servidor.
Comparando 1.648 millones de veces por segundo, 42 millones de veces por segundo y mil millones de veces por segundo, uno puede imaginarse el horror de estos datos. Esto incluso me recuerda a un ataque DoS (denegación de servicio, que eventualmente hace que la red o el servidor colapse al ocupar recursos con frecuencia y que mil millones de personas accedan a él al mismo tiempo, ¡es mucho más aterrador que un ataque de virus!).
¡La conclusión es que actualmente no existe ningún sitio web que admita mil millones de visitas al mismo tiempo!
¿Qué opinas sobre la cuestión de que se utilicen mil millones para acceder a un sitio web al mismo tiempo?
Todos pueden dejar un mensaje para discutirlo. Si les gusta, presten atención.
Una pregunta muy imaginativa. Mil millones de personas actualizan un sitio web al mismo tiempo. Al menos hasta ahora, ningún sitio web puede soportarlo. Según las capacidades actuales de Alibaba Cloud Computing, las capacidades de combinación del servidor. Optimizado en un estado muy racional, el espacio para mejorar la potencia informática por sí solo es muy limitado. Si se construye una gran cantidad de servidores solo para hacer frente al impacto de estas personas, sin duda habrá un gran desperdicio. Se comprará una cantidad de servidores para hacer frente a este ataque.
La aparición de la computación en la nube fue en realidad un factor accidental. Para hacer frente al enorme impacto de los servidores en los primeros días, Amazon compró una gran cantidad de servidores. servidores en reserva, y estaban pensando en cómo lidiar con ellos, si estos servidores son redundantes o aprovechan los usos adicionales, pensé si estos servidores podrían construirse para brindar servicios y recursos a algunas pequeñas y medianas empresas. También se podría compartir entre estos servidores. Esta fue una demanda simple generada por la computación en la nube temprana, pero con la extensión de funciones, la computación en la nube ha jugado un papel cada vez más importante y Amazon ha invertido cada vez más energía en esta área. Los resultados se han vuelto cada vez más obvios y se han convertido en un factor de referencia importante para el creciente valor de mercado de Amazon. Creo que el nacimiento de la computación en la nube ha tenido un gran impacto en la base de datos de Oracle. Alibaba también completará esta misión en un futuro próximo.
Visitar un sitio web al mismo tiempo prueba la capacidad de equilibrio de carga del sitio web. Ahora el sitio web ya no es una estructura de servidor único. Las visitas de diferentes regiones se agregarán en diferentes regiones y, finalmente, los datos. transferirse a través de la interacción de datos, resumirlo al servidor de control principal y luego dar respuestas específicas. En teoría, si desea una respuesta rápida, debe transferir con precisión los datos al servidor correcto tan pronto como se reciba. es el primer paso, si el número de visitas es demasiado grande, el servidor recibido en el primer paso puede fallar directamente o los datos pueden ponerse en cola. Es posible que durante Double 11, Alibaba lance más servidores de lo habitual. Ya ha migrado los servidores a Alibaba Cloud en Internet, las capacidades de administración del servidor se han mejorado aún más y se han agregado muchos servidores de respaldo para respaldarlo. Después de todo, las capacidades comerciales de Alibaba Cloud también se han mejorado aún más, por lo que se agrega respaldo. Los servidores también son una necesidad empresarial.
La forma más sencilla, directa y efectiva de aumentar la capacidad de carga de un servidor es aumentar el número de servidores. Sin embargo, este método todavía tiene requisitos de costos muy altos. Nadie hará este tipo de cosas. Después de todo, si simplemente usa este método varias veces, el costo es demasiado alto. El sitio web de compra de boletos anterior 12306 a menudo experimentó un tiempo de inactividad. Al final, Alibaba y Alibaba Cloud ayudaron a resolver este tipo de problema de impacto. En comparación, el impacto de la reserva de boletos se duplica. El impacto del 11.11 es aún mucho peor. La empresa nacional con la mejor capacidad para resolver problemas de concurrencia es Alibaba 12306 que implementa la función de consulta en Alibaba Cloud, lo que reduce en gran medida la presión sobre 12306. servidores principales También es un gran golpe para Alibaba. Una gran prueba de capacidad de carga.
Aunque Alibaba ya tiene una experiencia muy rica en resolver la capacidad de carga, el método de que mil millones de usuarios actualicen el sitio web al mismo tiempo es un gran problema incluso para Alibaba, no solo en términos de capacidades técnicas. La pregunta es si es necesario comprar estos servidores. Espero que esto pueda ayudarte.
Mantener presionado F5 no es nada. Parte de lo que se carga es leer el caché local. Ctrl F5 y Shift Command R son devastadores.