Google relanza la herramienta Gemini AI que permite a los usuarios crear imágenes de personas

Google está volviendo a activar su función de generador de imágenes para algunos usuarios de Gemini AI, después de… suspendiendo temporalmente La herramienta tenía la preocupación de que no podía representar de manera confiable a la gente blanca.

La empresa tecnológica propiedad de Alphabet dicho en una publicación de blog el miércoles que la última generación de su herramienta de texto a imagen, Imagen 3, pronto estará disponible para los usuarios que paguen las suscripciones Gemini Advanced, Gemini Business y Gemini Enterprise.

“En los próximos días, también comenzaremos a implementar la generación de imágenes de personas, con una versión de acceso anticipado para nuestros usuarios de Gemini Advanced, Business y Enterprise, comenzando en inglés. Hemos trabajado para realizar mejoras técnicas en el producto, así como conjuntos de evaluación mejorados, ejercicios de trabajo en equipo y principios claros del producto”, afirmó la compañía.

Los usuarios de la herramienta pueden escribir mensajes de texto que Imagen 3 convierte en imágenes visuales. En su blog publicado el miércoles, Google proporcionó un mensaje de muestra y la imagen correspondiente.

“Una imagen animada de un pequeño dragón saliendo de un huevo en un prado iluminado por el sol, rodeado de curiosas mariposas brillantes. Colores vibrantes, escamas detalladas”, decía el mensaje inspirado en la ciencia ficción.

En otro ejemplo, Google ordenó a la herramienta generar una imagen de un “vestido de fiesta hecho con servilletas de papel en una elegante sala de exposiciones”.

Google agregó que Imagen 3 tiene nuevas protecciones integradas para cumplir con los principios de diseño de la compañía, que incluyen limitar que Gemini genere “instrucciones para autolesionarse” o, en el caso de Imagen 3, crear “pornografía o imágenes excesivamente sangrientas”.

Google fue criticado cuando lanzó por primera vez su herramienta de conversión de texto a imagen y las indicaciones para el usuario para generar figuras históricas, como soldados alemanes durante la Segunda Guerra Mundial y papas, todos ellos históricamente blancos y varones, salieron mal parados. Algunas de las imágenes de Gemini retrataban a soldados nazis como Negro y asiático y papas como femenino.

En ese momento, el director ejecutivo Sundar Pichai llamó a sus problemas con la aplicación de IA “inaceptable.”

Google aseguró a los usuarios que en esta ocasión ha “logrado un progreso significativo al brindar una mejor experiencia de usuario al generar imágenes de personas”.

“No apoyamos la generación de imágenes fotorrealistas e identificables, representaciones de menores o escenas excesivamente sangrientas, violentas o sexuales”, afirmó la compañía en un comunicado. Pero incluyó una salvedad, dado que la herramienta basada en inteligencia artificial aún es novedosa y está en desarrollo.

“Por supuesto, como sucede con cualquier herramienta de inteligencia artificial generativa, no todas las imágenes que crea Gemini serán perfectas, pero seguiremos escuchando los comentarios de los primeros usuarios a medida que sigamos mejorando. Implementaremos esta función gradualmente, con el objetivo de ofrecerla a más usuarios e idiomas pronto”.

El jueves, la función de generación de imágenes no estaba disponible para todos los suscriptores de Gemini Advanced.

Cuando se le pidió que representara un ser humano, la herramienta respondió: “La generación de imágenes de personas llegará pronto a Gemini Advanced”.



Fuente