Noticias

Una mirada más cercana a DeepMind, la IA de Google que impulsa StarCraft 2

31 mayo 2020 Esta función se lanzó originalmente en enero de 2019.

Se le perdonará que suponga que la tecnología de IA de DeepMind ya ha demostrado su eficacia.

En 2016, el famoso laboratorio de computación vio que uno de sus programas de inteligencia artificial hizo lo impensable y ganó un juego de Go contra el entonces campeón mundial, y ser humano, Lee Sedol. Dominar el antiguo juego de mesa chino fue solo un ejemplo del aprendizaje automático que DeepMind espera poder usar eventualmente para revolucionar industrias como la ciencia, la atención médica y la energía.

Para la próxima etapa de este viaje, DeepMind ha centrado su atención en StarCraft II. El RTS de siete años puede seguir siendo una sensación en los deportes electrónicos, pero no es un paso obvio de Go. Después de todo, y con disculpas a Blizzard, se considera que el juego de estrategia abstracto de 2500 años representa el pináculo del juego. diseño, profundidad estratégica y elegante complejidad. Pero lo que pasa con Go, y ese otro gran compañero de entrenamiento de IA, el ajedrez, es que está ordenado con precisión y estructurado de manera estricta. A pesar de las abrumadoras combinaciones de posibles movimientos que ofrecen estos juegos, su profundidad no se complementa necesariamente con la amplitud.

Un RTS multijugador, por otro lado, es un poco más caótico. Los mejores jugadores profesionales de StarCraft II pueden lograr más de 800 acciones significativas con el mouse y el teclado por minuto. Es un juego de estrategia dinámico y errático que se juega a la velocidad de un infierno de balas, donde innumerables sistemas de interacción se empujan en una maraña desconcertante. StarCraft II requiere que sus jugadores manejen la incertidumbre y den sentido a los entornos espaciales matizados. Todo esto es todo un desafío para una IA.

Vignette YouTube

Como tal, DeepMind ha creado un programa de inteligencia artificial llamado AlphaStar, con un objetivo en la vida: dominar el multijugador competitivo de StarCraft II. De hecho, ya se ha enfrentado cara a cara con algunos de los mejores jugadores del mundo.

Por eso me encuentro en un estudio de televisión ad hoc instalado en la sede de Google en el Reino Unido. Durante las últimas semanas, DeepMind, que es propiedad del alfabeto principal de Google, envió a AlphaStar a luchar contra los estimados profesionales de Team Liquid Dario 'TLO' Wünsch y Grzegorz 'MaNa' Komincz. Ahora la compañía está lista para compartir los juegos pregrabados, y se han reclutado comentaristas que nunca antes habían visto los juegos para proporcionar energía. Se establece una escena muy suave.

Lo que están a punto de revelar parece importante. No se trata solo de IA versus un par de compañeros de equipo de esports. AlphaStar desafía la noción de habilidad en los juegos. Las ramificaciones podrían cambiar la forma en que juegan los jugadores profesionales humanos, cómo se desarrollan los títulos futuros y, por supuesto, cómo la IA aumenta las capacidades humanas en todo el mundo.

DeepMind comenzó construyendo un jugador artificial de StarCraft II sin sentido del juego, reglas o estrategias. Pero siguió sintonizando, viendo medio millón de juegos de StarCraft humanos, aprendiendo todo el tiempo. AlphaStar imitó, experimentó, fracasó y aprendió. Este es el proceso combinado de aprendizaje profundo y aprendizaje reforzado en el corazón de la oferta de DeepMind.

Para la BlizzCon 2018 a principios de noviembre, AlphaStar había comprendido las reglas de RTS y dominado algunas estrategias básicas basadas en macros. El 10 de diciembre, después de jugar muchos partidos contra diferentes versiones de sí mismo, la IA derrotó al jugador humano de StarCraft más exitoso del Team DeepMind. Era hora de subir de nivel.

Nueve días después, el gerente de Team Liquid, TLO, voló al Reino Unido. Como jugador profesional de StarCraft II, ha formado parte de las diferentes razas del juego, pero es conocido como un jugador zerg extremadamente capaz. AlphaStar, sin embargo, se había centrado en Protoss vs. Protoss para mantener su aprendizaje constante. Por lo tanto, un partido solo de Protos contra TLO sería una primera prueba perfecta y suave: enfrentar al agente de DeepMind contra un experto fuera de su zona de confort.

Coches sin conductor: Así es como Codemasters enseña a la IA a conducir

Cuando comienza la transmisión, AlphaStar derrota a TLO en el primer juego utilizando un estilo de juego silencioso y poco convencional: se niega a bloquear una rampa de estrangulamiento, un enfoque bien establecido dado el mapa seleccionado. Fuera de la puerta, la IA ha tomado la delantera sobre los humanos y no parece demasiado preocupada por bailar al ritmo de las convenciones. A pesar de toda la teoría que obsesiona a los jugadores de StarCraft, AlphaStar ya está haciendo las cosas de manera diferente.

Vignette YouTube

Sin embargo, el agente de DeepMind debe ser lo más humano posible. Hay límites a la rapidez con la que puede interactuar, y concesiones para garantizar que su enfoque no lo sea si los juegos abstractos se vuelven imposibles de jugar. De hecho, TLO realizó más "acciones por minuto" que AlphaStar en su primer enfrentamiento, lo que demuestra que hay pocas razones para argumentar que prevalece una ventaja de velocidad injusta.

"Comencé este partido con mucha confianza", dijo TLO sobre su derrota, luciendo una sonrisa confundida. Luego, el jugador de Team Liquid dice que ha aprendido de la experiencia y se siente listo para vencer a AlphaStar en juegos futuros.

Pero las cosas resultan un poco diferentes. Con cada turno, AlphaStar cambia de estrategia. La IA siempre es implacable, siempre eficiente, pero nunca predecible. TLO es derrotado 5-0.

DeepMind claramente no se estaba conteniendo. AlphaStar en realidad combina cinco agentes diferentes, algo así como una extensión de diferentes versiones de sí mismo. Además, DeepMind dice que AlphaStar ha jugado alrededor de 200 años de juego, un hecho con el que TLO claramente se ha sentido cómodo. Pero, de hecho, es más comparable al aprendizaje humano de lo que piensas.

Estos 200 años incluyen todo cada versión de AlphaStar ha aprendido a tocar solo. Del mismo modo, un jugador de StarCraft II con 500 horas de juego a sus espaldas también hereda el aprendizaje colectivo de los jugadores que lo precedieron y con los que lucharon. Todos somos más que nuestra propia experiencia; cientos de años más.

De cualquier manera, era hora de aceptar el desafío. MaNa es un jugador talentoso y confiado centrado en Protoss. ¿Seguramente ahora AlphaStar encontraría su pareja?

Después de cinco derrotas consecutivas a manos de AlphaStar, MaNa parece estar exasperado, emocionado y fascinado a partes iguales. Al igual que TLO, claramente fue tomado por sorpresa. Si bien AlphaStar sigue las reglas del juego al pie de la letra, simplemente no se adherirá a las estrategias de juego establecidas que los jugadores de StarCraft II han desarrollado colectivamente.

Charla en tiempo real: le mejores juegos de estrategia en tiempo real para PC

MaNa obtiene, al menos, una gracia salvadora para sí mismo, así como para el público cuando se trata de deportes electrónicos y quizás para la humanidad en general. DeepMind presenta un juego en vivo en el estudio, transmite verrugas y todo. Y parece ser el primer juego contra un profesional en el que la IA de DeepMind no puede usar la cámara del jugador. AlphaStar no ve el juego como tal, pero ya ha podido descubrir un área de juego completa, en lugar de experimentarlo a través de la vista de una cámara.

Esta vez, MaNa gana y claramente está extremadamente aliviada.

Con las cámaras apagadas, hay una sensación colectiva de iluminación en el estudio temporal de DeepMind. Puede que AlphaStar haya perdido su última batalla, pero un marcador final de 11-1 a favor de la IA hizo temblar. Y los jugadores profesionales se sienten optimistas y reflexivos.

TLO nos dice que MaNa una vez tomó una táctica que vio desplegar AlphaStar y la usó en juegos del mundo real. Si AlphaStar puede seguir cambiando su estilo de juego de manera impredecible, quizás los humanos puedan aprender nuevos enfoques, al igual que la IA aprende al observar a los humanos. Podemos ver cómo surgen nuevas teorías de juego disruptivas en los deportes electrónicos competitivos que no fueron diseñados originalmente por organismos biológicos.

Mientras tanto, el equipo de DeepMind analiza con entusiasmo las implicaciones de los jugadores de IA altamente calificados en el desarrollo de juegos. Ils peuvent éventuellement espérer voir leur technologie améliorer les chaînes d'approvisionnement mondiales, les secours en cas de catastrophe et le travail des professionnels de la santé, mais pour l'instant, la notion d'intelligence artificielle à l'échelle humaine joue à tous los juegos. ¿Qué podría significar AlphaStar para las pruebas de juegos? ¿Podrían sus capacidades no solo evaluar la validez del diseño de un juego determinado, sino también impulsar el proceso creativo? ¿Podría la IA tener éxito en la creación de juegos perfectamente equilibrados, sin interferencia humana?

Moverse: Cannon apresura los mejores juegos de estrategia para PC

Tal vez, TLO está pensando. Pero señala que un juego perfectamente equilibrado podría no ser inherentemente un buen juego.Después de todo, fueron las pequeñas imperfecciones en el equilibrio las que permitieron a los jugadores de StarCraft II construir una biblioteca tan densa de teoría de juegos de su amado RTS. De aquí es de donde proviene la habilidad para el estilo individual y los giros dramáticos del destino.

Es posible que la IA ya nos haga mejores, pero eso no significa que la perfección sea perfecta para los juegos.

Califica este artículo