Red de conocimientos turísticos - Información de alquiler - ¿Quién es el único jugador de ajedrez humano que ha derrotado a AlphaGo en una partida?

¿Quién es el único jugador de ajedrez humano que ha derrotado a AlphaGo en una partida?

El ajedrecista profesional surcoreano Lee Sedol (?).

En marzo de 2016, AlphaGo desafió al campeón mundial de ajedrez profesional coreano Lee Sedol (?) Jiuduan. AlphaGo utiliza los servidores de computación en la nube de Google en Estados Unidos y está conectado con Corea del Sur a través de una red de cable de fibra óptica.

La sede de la competencia es el Hotel Four Seasons en Seúl, Corea del Sur; el formato de la competencia es Wufanqi, que se llevará a cabo los días 9, 10, 12, 13 y 15 de marzo, respectivamente; Reglas del Go chino. Las negras tienen 3 y 3/4 piedras; el tiempo necesario es de 2 horas para cada lado, con 3 cuentas atrás de 1 minuto. El equipo de DeepMind transmitió en vivo a nivel mundial en YouTube, con el jugador de ajedrez profesional estadounidense Michael Redmond brindando comentarios en inglés. Muchos sitios web de videos en China también utilizan las señales de transmisión en vivo de YouTube para transmisiones en vivo y agregan sus propios comentarios. El Dr. Huang Shijie, jugador aficionado taiwanés de 6-dan Go, miembro del equipo DeepMind, representa a AlphaGo en el tablero de ajedrez.

El ganador del concurso recibirá un premio de 1 millón de dólares. Si AlphaGo gana, el dinero del premio se donará a organizaciones y organizaciones benéficas de Go, incluido UNICEF. Lee Sedol tiene una tarifa de aparición de 150.000 dólares estadounidenses y recibirá un bono de 20.000 dólares estadounidenses por cada partido que gane.

AlphaGo ganó los tres juegos el 9, 10 y 12 de marzo de 2016. Lee Sedol ganó el juego el día 13 y AlphaGo ganó el juego final el día 15. Por lo tanto, el resultado del juego fue que AlphaGo derrotó a Lee Sedol 4:1. El concurso provocó un amplio debate en Internet sobre el concurso y la inteligencia artificial.

Información ampliada:

Algoritmo

AlphaGo utiliza la búsqueda de árbol de Monte Carlo (búsqueda de árbol de Monte Carlo), con la ayuda de la red de valores y la red de políticas de movimientos de ajedrez, Dos tipos de redes neuronales profundas, evalúa una gran cantidad de puntos seleccionados a través de la red de valoración y selecciona el punto de ubicación a través de la red de movimiento de ajedrez.

AlphaGo inicialmente intentó igualar las partidas anteriores de jugadores de ajedrez profesionales imitando a jugadores humanos. Su base de datos contiene aproximadamente 30 millones de movimientos de ajedrez. Más tarde alcanza un cierto nivel de competencia y comienza a jugar muchas partidas de ajedrez contra sí mismo, utilizando el aprendizaje por refuerzo para mejorarlo aún más.

Go no se puede resolver simplemente encontrando el mejor movimiento; el juego promedio tiene alrededor de 150 movimientos, y cada movimiento tiene un promedio de alrededor de 200 movimientos posibles, lo que significa que hay demasiadas posibilidades para resolver.