Noticias

Google anuncia Imagen, un generador de imágenes basado en IA con reclamos de "fotorrealismo sin precedentes"

Google anuncia Imagen, un generador de imágenes basado en IA con reclamos de "fotorrealismo sin precedentes"

Google Imagen es el nuevo generador de texto a imagen de IA que existe. No se ha liberado al dominio público. Pero, mientras anunciaba el nuevo modelo de IA, la compañía compartió el trabajo de investigación, una herramienta de evaluación comparativa llamada Drawbench para hacer comparaciones objetivas con los competidores de Imagen y algunas imágenes tontas para su disfrute subjetivo. También destaca el daño potencial de esta tecnología.

Google Imagen: Así funciona una plantilla de texto a imagen

La idea es que solo digas lo que quieres que el generador de imágenes AI evoque y hace exactamente eso.

Las imágenes presentadas por Google son probablemente las mejores del grupo y dado que la herramienta de IA no está disponible para el público en general, sugerimos tomar los resultados y afirmaciones con cautela.

De cualquier manera, Google está orgulloso del desempeño de Imagen y tal vez por qué lanzó un punto de referencia para los modelos de texto a imagen de IA llamado DrawBench. Por lo que vale, los gráficos de Google revelan la ventaja de Imagen sobre alternativas como Dall-E 2 de OpenAI.

Dibujar banco

Sin embargo, al igual que la solución de Open AI o cualquier otra, todas las aplicaciones similares tienen fallas intrínsecas, es decir, son susceptibles de resultados desconcertantes.

Al igual que el "sesgo de confirmación" en los humanos, que es nuestra tendencia a ver lo que creemos y creer lo que vemos, los modelos de IA que filtran grandes cantidades de datos también pueden caer en estos sesgos. Se ha demostrado una y otra vez que este es un problema con los generadores de texto a imagen. Entonces, ¿Imagen de Google será diferente?

En las propias palabras de Google, estos modelos de IA codifican "varios sesgos y estereotipos sociales, incluido un sesgo general hacia la generación de imágenes de personas de piel más clara y una tendencia a que las imágenes que representan diferentes profesiones se vean diferentes".

La compañía Alphabet aún podría filtrar ciertas palabras o frases y alimentar buenos conjuntos de datos. Pero con la escala de datos con la que operan estas máquinas, no todo puede filtrarse o no todos los problemas pueden resolverse. Google admite esto y dice que "[L]os requisitos de datos a gran escala de los modelos de texto e imagen [...] han llevado a los investigadores a depender en gran medida de grandes conjuntos de datos, en su mayoría no seleccionados y recuperados de la web [...] Las auditorías de los conjuntos de datos han revelado que estos conjuntos de datos tienden a reflejar estereotipos sociales, puntos de vista opresivos y asociaciones denigrantes o dañinas con grupos de identidad marginados.

Entonces, como dice Google, Imagen “no es adecuada para uso público en este momento”. Si está disponible y cuando esté disponible, intente decirle: "Hola Google Imagen, no hay cielo". Es fácil si lo intentas. Ningún infierno bajo nosotros. Sobre nosotros, nada más que el cielo”.

Para otras noticias, reseñas, funciones, guías de compra y todo lo relacionado con la tecnología, siga leyendo Digit.in.