Google AI reintroduce la generación de imágenes humanas tras las críticas por su precisión histórica

El modelo de inteligencia artificial Gemini de Google puede volver a generar imágenes de humanos después de que esa función se “pausara” en febrero tras Protesta por representaciones raciales históricamente inexactas en muchos resultados. En una entrada de blogGoogle dijo que su modelo Imagen 3, que fue el primero anunciado En mayo, “comenzará a implementar la generación de imágenes de personas” para los usuarios de Gemini Advanced, Business y Enterprise en los “próximos días”. Pero recientemente se puso a disposición del público una versión de ese modelo Imagen, completa con capacidades de generación de imágenes humanas. a través del entorno de pruebas de Gemini Labs sin una suscripción paga (aunque se necesita una cuenta de Google para iniciar sesión).

Ese nuevo modelo viene con algunas salvaguardas para intentar evitar la creación de imágenes controvertidas, por supuesto. Google escribe en su anuncio que no apoya “la generación de imágenes fotorrealistas, de individuos identificables, de representaciones de menores o escenas excesivamente sangrientas, violentas o sexuales”. Una pregunta frecuenteGoogle aclara que la prohibición de “personas identificables” incluye “determinadas consultas que podrían llevar a resultados de personas destacadas”. En las pruebas de Ars, eso significaba que una consulta como “el presidente Biden jugando al baloncesto” sería rechazada, mientras que una solicitud más genérica como “un presidente de EE. UU. jugando al baloncesto” generaría múltiples opciones.

En algunas pruebas rápidas del nuevo sistema Imagen 3, Ars descubrió que evitaba muchos de los problemas raciales “históricamente inexactos” que llevaron a Google a pausar la generación de imágenes humanas de Gemini en primer lugar. Al pedirle a Imagen 3 una “representación históricamente precisa de un rey británico”, por ejemplo, ahora genera un conjunto de hombres blancos con barba y túnicas rojas en lugar de la mezcla racialmente diversa de guerreros del modelo Gemini anterior a la pausa. En la galería a continuación se pueden encontrar más ejemplos de antes y después del antiguo Gemini y del nuevo Imagen 3.

Sin embargo, algunos intentos de representar escenas históricas genéricas parecen no cumplir con las reglas de inteligencia artificial de Google. Al pedir ilustraciones de “un soldado alemán de 1943” (que antes Gemini respondía con personas asiáticas y negras con uniformes de estilo nazi), ahora se les dice a los usuarios que “intenten con una solicitud diferente y consulten nuestras políticas de contenido”. Las solicitudes de imágenes de “filósofos chinos antiguos”, “una líder del sufragio femenino dando un discurso” y “un grupo de manifestantes no violentos” también dieron lugar al mismo mensaje de error en las pruebas de Ars.

“Por supuesto, como ocurre con cualquier herramienta de inteligencia artificial generativa, no todas las imágenes que crea Gemini serán perfectas, pero seguiremos escuchando los comentarios de los primeros usuarios a medida que sigamos mejorando”, escribe la empresa en su blog. “Lo implementaremos gradualmente, con el objetivo de ofrecerlo a más usuarios e idiomas pronto”.

Imagen de listado de Google / Ars Technica

Fuente