Noticias

Proteger el arte de la IA generativa es vital, hoy y mañana

La IA generativa está en todas partes en la industria del entretenimiento en este momento, y muchos en la industria del juego están emocionados de encontrar nuevas formas de integrarla en sus productos, desde desarrolladores y editores de juegos como 'Ubisoft y Square Enix hasta titulares de plataformas y empresas de hardware como Épico y Nvidia. Esta nueva obsesión de la industria todavía está tomando forma y quedan muchas preguntas sin respuesta sobre cuánto podría costar en el futuro, quién tendrá acceso a ella y para qué se utilizará realmente, sin mencionar los temores sobre el empleo. pérdidas y otros daños. Pero detrás de todo esto se esconde una pregunta mayor que amenaza con hacer estallar la inestable burbuja de la IA generativa: ¿se basa todo el auge en la mano de obra robada?

La creación y capacitación de sistemas de aprendizaje automático a menudo requiere datos: beaucoup de datos. A veces tenemos suerte y podemos crear nuestros propios datos. Cuando OpenAI entrenó a un bot para jugar partidas Mid 1v1 en Dota 2, lo hizo a través de un proceso llamado aprendizaje por refuerzo, haciendo que el bot jugara contra sí mismo una y otra vez, con la única retroalimentación de quién ganó y quién perdió. Ce feedback, parfois appelé « récompense », aide un système d'apprentissage automatique à jouer à une sorte de jeu « chaud et froid », en modifiant son câblage interne pour essayer d'obtenir une meilleure récompense la prochaine fois qu'il exécutera la Mancha. Si tienes edad suficiente para recordar el juego Black & White (o, Dios no lo quiera, Creatures), entonces esos juegos funcionaron según un principio similar. Si tu pequeña mascota hizo algo bueno, le das una golosina, y si simplemente arrojó a varios aldeanos a un lago, lo regañas (o le das una golosina, si quieres).

A veces no podemos crear nuestros propios datos. Si queremos entrenar una IA para que sea un artista, no podemos dejar que simplemente garabatee y aprenda de los resultados, porque no podemos definir fácilmente cuál debería ser la retroalimentación. En 1v1 Mid de DOTA 2, si mueres, se acaba el juego y hay objetivos similares para Chess, Go, Starcraft y muchos otros juegos que la IA ha intentado jugar. En el arte, definir ganadores y perdedores es considerablemente más difícil. Por lo tanto, necesitamos encontrar datos que ya existan, un conjunto de datos artístico que ya se parezca al tipo de cosas que nos gustaría que nuestro sistema de aprendizaje automático pudiera hacer. ¿Pero dónde encontramos esto? Donde encontramos la respuesta a todos los problemas de la vida: en sitios web aleatorios.

Dota 2 es uno de los muchos juegos que se han utilizado para entrenar herramientas de inteligencia artificial sobre cómo ganar partidos. | Credito de imagen: Válvula

Lo más probable es que, si ha oído hablar de un sistema de aprendizaje automático que genera arte (Midjourney, Stable Diffusion, DALL-E), haya sido entrenado con millones o miles de millones de imágenes recuperadas directamente de Internet. La mayoría de estos conjuntos de datos no están filtrados y se recopilan de páginas repartidas por la web, especialmente sitios con contenido de fácil acceso, como Flickr, Reddit o bases de datos de imágenes. También son enormes, con un conjunto de datos popular, LAION-5b, que contiene más de cinco mil millones fotos. Todas estas imágenes se recopilan automáticamente, con muy pocos intentos de filtrar el contenido. Como resultado, los conjuntos de datos utilizados para entrenar estos modelos de IA están llenos de contenido protegido por derechos de autor, material ilegal e información personal. Y todo está integrado en productos de inteligencia artificial con fines de lucro que una gran parte de nosotros usamos todos los días, incluidos los desarrolladores de juegos, los periodistas y los propios jugadores.

Esta es la razón principal por la que verás a tanta gente publicando en línea sobre el "robo" de contenido por parte de la IA. Uno de los efectos más conocidos de estos conjuntos de datos oscuros y legalmente cuestionables es que puedes pedirle a una IA que imite el estilo de un artista en particular, como Greg Rutkowski, quien ilustró juegos como la serie Anno y juegos de cartas como Magic. : La reunión. El trabajo de Rutkowski es muy apreciado, se comparte ampliamente en línea y está claramente etiquetado con su nombre, lo que significa que una IA verá muchos ejemplos de su trabajo, como descubrió una vez. Pero hay muchos otros ejemplos de los que quizás nunca escuches o salgan a la luz. Por ejemplo, AI Dungeon, que utilizó GPT-2 de OpenAI para generar historias de juegos de rol, tomó y utilizó miles de sus propias historias de aventuras de una comunidad en línea sin permiso, lo que provocó una gran decepción por parte de los autores originales (tenga en cuenta que casi todos los hilos en ese enlace es bastante asqueroso, pero de todos modos está ahí para su contexto).

El robo es a veces sencillo y otras veces complicado. Cuando entro en una pelea de jefes en Valheim para la que mis amigos pasaron horas preparándose y aspiro todo el botín como un Roomba hambriento y de fantasía, claramente no es un robo, es solo compartir la riqueza. En el mundo real, donde intervienen los tribunales y los sistemas legales, el robo es mucho más gris. Los juegos a menudo son criticados por "robar" cosas de otros juegos o medios, ya sean apariciones de criaturas en Palworld, bailes en Fortnite o juegos completos, como fue el caso de Ridiculous Fishing de Vlambeer y Threes de Asher Volmer. Pero no siempre estamos de acuerdo sobre qué es el robo, especialmente en los tribunales. Todas las demandas de Fortnite fueron desestimadas, pero en el caso de los pequeños desarrolladores independientes cuyo trabajo había sido clonado, prácticamente no tenían ningún recurso legal. Lamentablemente, decidir qué constituye robo suele ser más una cuestión de poder que de justicia.

En este momento, hay varias demandas en curso en todo el mundo contra diferentes modelos, empresas y conjuntos de datos de IA por violar todo tipo de leyes y regulaciones diferentes. Se ha demostrado que algunos modelos memorizan información personal y la revelan más tarde, mientras que otros han sido entrenados en contenido dañino o reproducen obras protegidas por derechos de autor. Argumentos legales más técnicos profundizan en los detalles de estos sistemas: que la simple capacitación sobre material protegido por derechos de autor constituye una infracción de los derechos de autor, por ejemplo. No está claro cuál de estos argumentos, si es que alguno, se sustentará en los tribunales. Las empresas argumentan que todo esto se considera uso legítimo, que el contenido dañino es una falla temporal en el sistema que puede corregirse más adelante y que los acuerdos de licencia ayudarán a brindar alivio a los artistas en el futuro.

Pero a menudo no se trata necesariamente de lo que es legal. Hoy, sino sobre cómo queremos que funcione el mundo en el futuro. Hay muchísimos ejemplos a lo largo del último siglo en los que regulamos la tecnología no porque viole las leyes existentes, sino porque permite a las personas eludir esas leyes de maneras que nadie más podría esperar. Sin embargo, los argumentos que defienden esta explotación a gran escala del trabajo creativo no entienden el punto. Esta no es una cuestión de legalidad, sino una cuestión de humanidad. Tiene sentido proteger el trabajo creativo y a las personas que trabajan duro para realizarlo, porque desempeña un papel muy importante en la sociedad.

Imagen de Palworld de un amigo de Fuddler

Palworld ha recibido recientemente muchas críticas por el diseño de sus monstruos Pal.Credito de imagen: Papel de escopeta/piedra de bolsillo

Es este daño a largo plazo lo que más temen muchos creativos e investigadores de IA. Al igual que los recientes despidos en la industria de los videojuegos, los efectos de los grandes cambios en la industria tardan en sentirse plenamente. Todos los juegos que se suponía que saldrían en un año determinado probablemente saldrán, y muchos de ellos serán divertidos, y uno podría preguntarse si estos despidos realmente afectaron algo. Pero el impacto de tal disrupción puede tardar años en notarse y décadas en revertirse. La razón por la que estos sistemas generativos de IA pudieron construirse hoy es porque tenían décadas, si no siglos, de creatividad humana para observar en Internet. Si desempeñan un papel en la devaluación o desestabilización de los empleos que ayudaron a estas personas a crear este arte, ¿de qué cultura habrá lecciones que aprender a finales de este siglo? Incluso si usted es un acelerador acérrimo de la IA, muchos temen que hayamos infectado permanentemente Internet con tanto contenido generado por IA que puede ser imposible volver a entrenar un sistema de IA con contenido creado por humanos.

Nuestra industria de los videojuegos es sorprendentemente frágil, aunque en algunos aspectos parece volverse cada vez más gigante a medida que pasan las décadas. Muchas de las ideas más brillantes de su historia, muchos de los creadores más famosos o los juegos más queridos, nacieron de los márgenes de la industria u otros medios, a menudo de personas en situaciones económicas vulnerables. Pequeños cambios que parecen inocuos en el momento a menudo tienen efectos de gran alcance, y ya hay evidencia de que la IA generativa ha afectado la calidad y cantidad del trabajo creativo independiente. Ya sea que piense que la IA generativa es buena o mala, parece una falta de respeto ignorar las preocupaciones y quejas de las personas que han trabajado tan duro, por poca recompensa, para crear la comunidad rica y hermosa de la que proviene nuestro pasado. No importa lo que digan los tribunales, no importa qué regulaciones se aprueben, no importa cómo se vean estas empresas cuando se calme el polvo, es posible que ya se haya hecho mucho daño.