Noticias

Hablé con un NPC de Nvidia AI y lo que más quería era hacerme orinar.

Si el objetivo de una demostración técnica es provocar un destello de pensamiento de "Oye, esto es genial", entonces mentiría si dijera el protocolo secreto de Nvidia: una muestra jugable de su herramienta AI NPC, Avatar Cloud Engine (ACE). – no había sido utilizado. No funcionó conmigo. Si, por otro lado, se trata de desarrollar ese pensamiento en "Oye, quiero esto en los juegos ahora mismo", se necesitará más que una conversación un poco forzada con un aspirante a barman.

ACE, si no ha visto sus presentaciones anteriores en el circuito de programas de tecnología y juegos, es una "fundación" todo en uno de herramientas de creación de personajes basadas en inteligencia artificial: modelos de lenguaje, voz, síntesis de voz, robots automatizados. aleteo de la boca, etc. – que Nvidia presenta como el futuro de la interacción con los NPC. Conectado al motor Inworld de terceros, que parece manejar la mayor parte de la generación actual de IA, ACE tiene como objetivo reemplazar los diálogos de personajes preescritos y grabados con líneas más dinámicas capaces de responder con precisión a cualquier pregunta o declaración que puedas susurrar. en un mensaje. micrófono.

Míralo en YouTube

Covert Protocol resume todo en un breve juego de investigación social, que te asigna, como detective privado, la tarea de chismorrear/mentir en las suites privadas de un hotel elegante. El primero en participar en un interrogatorio asistido por IA fue el alegre cazador Tae Hyun, y resultó que el primero entre una reunión de periodistas en tomar el micrófono fui yo.

La conversación empezó, como la mayoría de las mías, de forma incómoda. Una vez que entré en el modo protagonista de Obsidian RPG y pregunté cuáles eran los chismes en el hotel, Tae se desvió con una broma sobre la llegada de extraterrestres. pourrait Recomiendo el bar del hotel, así que les pregunté cuál era su mejor cóctel. Era un error. Resulta que Tae planeaba hacerse cargo del bar él mismo y estaba tan orgulloso de su propio zoológico de Baltimore (con un toque coreano) que logró trabajar allí varias veces.

Fue extraño. Pero eso también… ¿funcionó? Como interacción divertida, nuestra sesión de preguntas y respuestas fluyó de manera perfectamente lógica. Las respuestas generadas por IA eran específicas para la pregunta, no estaban cubiertas y no había ningún "¿Podrías repetir eso?" » o hipo "No estoy seguro de lo que quieres decir". Si alguien hubiera llegado sin ningún conocimiento del aspecto del aprendizaje automático, bien podría haber pensado que ACE estaba alimentando filas predefinidas en respuesta a consultas planificadas previamente. Entonces sí, fue agradable. Muchas respuestas incluso parecían tener en cuenta respuestas anteriores, usándolas como contexto para evitar repeticiones.

Al menos, sobre todo. este hombre era consomé con orgullo desde el Zoológico de Baltimore, pasando de asentimientos a respuestas sobre sus opiniones políticas o su relación con su madre como si estuviera haciendo una parte de SNL. Sinceramente, las secuencias eran cursis, pero no del todo absurdas, dado que yo había sacado el tema de las bebidas para empezar. También es posible que esto sea más un tic de carácter intencional, causado por la IA, que un problema técnico en Matrix.

A este chico no parece gustarle nada excepto ser un idiota. | Credito de imagen: Escopeta de papel piedra

Siempre. Me reí en ese momento, pero mirando hacia atrás, había algo extraño en la facilidad con la que este tipo volvió exactamente al mismo tema de su bebida característica. Si se trataba de una broma subida de tono, su tono no estaba en sintonía con la pulida presentación de la historia de detectives, y si no lo era, seguramente traicionaba cuán literalmente artificiales son estas "actuaciones". Como si ACE se aferrara a este detalle del personaje como una manta de seguridad, temeroso de desviarse cuando sabe que domina el cóctel, incluso si eso hace que todo parezca más robótico, no menos.

No es que la farsa se mantuviera particularmente bien en otros lugares. Las voces de la IA de ACE eran más naturalistas que las de la demostración de la tienda de ramen del año pasado, pero aún eran rígidas, monótonas y salpicadas de pausas y pronunciaciones extrañas. Básicamente, todo lo que dice la síntesis de voz clásica. Tae habló de que su familia abandonó Corea "por una razón", implicando la agresión de Corea del Norte, con la misma seriedad que cuando hizo el estúpido chiste sobre los extraterrestres. Otro NPC hablador del Protocolo Encubierto, un orador principal del que necesitábamos obtener un número de sala, reaccionó con similar no sorpresa tanto ante un saludo amistoso como ante la noticia de que su discurso estaba siendo cancelado.

Algunas respuestas también llegaron solo después de una pausa prolongada, que un gerente de Nvidia atribuyó rápidamente a la lenta conexión Wi-Fi del sitio. Entonces, incluso si todo este sistema lo convirtiera en un juego minorista finito, probablemente sería un asunto siempre en línea, dependiendo de la posesión de una conexión de alta calidad para realizar todas estas solicitudes remotas a Inworld.

ACE debutó el año pasado con este modelo de madera de un vendedor de fideos. Ver en YouTube

Luego está la escritura. Nada de lo que escuché hizo que mis dedos de los pies se curvaran tanto como el diálogo apestoso en la demostración NEO NPC de Ubisoft (aunque, curiosamente, también se basa en una combinación de tecnología Inworld y Nvidia), pero de alguna manera también tenía razón. . Sin brillo, sin alegría, sin peso real en las palabras. Me reí del incesante revuelo de Tae, pero sólo de lo completamente ridículo que era, no del humor más intencional de la máquina. Y su intento de hacer una voz en off privada y canosa resultó en un trágicamente insípido “Un bar. Podría optar por un Old Fashioned en este momento. Pero concéntrate, Marcus, concéntrate. Nadie quiere morir, ese no es el caso.

Todavía estoy realmente impresionado por la capacidad de respuesta de las preguntas y respuestas, pero en general, ACE se siente al menos a unos años de distancia del punto en el que podría impulsar un juego que podría pasar por un autor humano. La cuestión es que a los desarrolladores de juegos aparentemente no les gusta esperar. Además de Ubisoft, me dijeron que varias empresas ya se han puesto en contacto con Nvidia para utilizar ACE para crear sus castings de NPC. Eso no quiere decir que todos estaremos charlando con robots antes de Navidad, pero me preocupa que la prisa por aprovechar los beneficios de la IA (idealmente de la variedad de "juego social propiamente no lineal" y no del tipo "ahora no lo hacemos") no” hay que pagar por la variedad de escritores – terminará con una selección de juegos igualmente mediocres.

No digo esto porque a algunas personas tampoco les guste la IA. Además de la IA generativa, la propia Nvidia ha creado muchas herramientas útiles y éticamente libres de problemas que utilizan el aprendizaje automático para ayudar a los jugadores y desarrolladores. Mejora del querido DLSS, por dar el ejemplo obvio, o las mejoras visuales instantáneas de Ray Reconstruction. A pesar de producir mods de diferente calidad, RTX Remix también ha obtenido buenos resultados hasta ahora. En realidad, esto utiliza un toque de IA generativa para ayudar a producir modelos y texturas de mayor resolución, pero nunca he tenido problemas con estas partes de, digamos, Portal con RTX. A una sala de la demostración de Covert Protocol, también pude ver Half-Life 2 RTX en acción, mostrando una combinación de modelos hechos a mano y mejoras de iluminación, así como reemplazos de texturas generadas por IA (pero de buen gusto). .

Para comparar, Half-Life 2 y Half-Life 2 RTX se ejecutan en dos monitores adyacentes.

Half-Life 2 RTX le da a un viejo clásico un tratamiento remasterizado completo (aunque no oficial), | Credito de imagen: Escopeta de papel piedra

Sin embargo, existe claramente una enorme brecha entre pedirle a la IA que realice suavizado o retoque algunas mamposterías y utilizar IA generativa para recrear el comportamiento de un ser humano completo en tiempo real. ACE ha progresado desde la cuestionable visita a la tienda de ramen, pero todavía no estoy convencido de que esté listo para cruzar ese abismo todavía.

E incluso cuando eso suceda, ¿querrán suficientes jugadores escuchar lo que las voces de la IA tienen que decir? A pesar de toda la novedad del diálogo dinámico, el deseo de historias conmovedoras, conmovedoras, divertidas, aterradoras, tristes y sorprendentes no va a ninguna parte, y si Covert Protocol es una indicación, las mejores siempre serán tejidas por manos humanas.

Incluso los engranajes de ACE no sugieren lo contrario. El estado de ánimo y el habla de Tae Hyun pueden ser generados por IA, pero es necesario generarlos desde cualquier cosa. En este caso, es un perfil de personaje que Inworld Engine guarda para sí mismo, y todos los demás NPC tienen el mismo: una historia personal resumida de sus vidas, amores, sueños y miedos. Es la fuente de todo lo que hace que Tae sea interesante, o al menos, capaz de dar respuestas más interesantes que un chatbot de soporte de British Gas, ya sea el escape de su familia de las tensiones políticas o la formación de una obsesión con el barman que ahora puede " No me callaré. Y todo esto fue diseñado desde cero, no por IA, sino por un escritor humano. Sólo digo.