La generación de imágenes con IA acaba de dar un gran paso adelante

Hemos estado viviendo con imágenes generadas por IA durante un tiempo, pero esta semana, algunos de los principales actores dieron grandes pasos hacia adelante. En particular, me refiero a actualizaciones significativas de A mitad de caminoel nuevo modelo de Google, y Adivinanza.

Cada empresa muestra que la tecnología evoluciona a un ritmo diferente y en direcciones diferentes. Aún es un campo de juego muy abierto y cada empresa demuestra hasta dónde han llegado los avances.

Midjourney llega a la web

Una imagen de IA generada en Midjourney. Canal/Mid-trayecto

Comencemos con Midjourney, que silenciosamente lanzó el jueves por la noche un nuevo editor web que reúne una serie de herramientas útiles de manipulación de imágenes en una única interfaz de usuario.

Anteriormente, funciones como reencuadrar, repintar (agregar recursos generados por IA o modificar una imagen existente), desplazarse, extender el lienzo (expandir los límites de la imagen y generar contenido para rellenarla) y hacer zoom requerían su propia herramienta específica para su uso y se ubicaban en varios menús, lo que obligaba a los creadores a cambiar constantemente de uno a otro. Esta nueva interfaz de usuario ofrece un proceso de edición más coherente y optimizado, un cambio marcado con respecto al inicio del programa en Discord.

¡Midjourney acaba de lanzar su editor web!

En realidad, es una de las características más interesantes que han lanzado en mucho tiempo.

Básicamente, te permite pintar, desplazarte, hacer zoom y más, todo en un solo paso.

Realmente muy poderoso foto.twitter.com/Wgyi9ElE5N

— Nick St. Pierre (@nickfloats) 16 de agosto de 2024

El nuevo editor web está diseñado para que la edición de imágenes generadas por IA sea más sencilla y fluida. David Holz, director ejecutivo de Midjourney en Discord recientemente. “Creemos que esto hace que editar tus imágenes de MJ sea mucho más sencillo que antes y es un gran paso adelante”, escribió.

Aunque Midjourney continúa migrando de Discord hacia una aplicación basada en la web, la compañía también anunció que reflejará los mensajes de canales populares como “daily-theme”, “prompt-craft” y “general-1” entre sus salas web y canales de Discord para que las personas puedan seguir esos hilos desde la plataforma que prefieran. La compañía también presentó una nueva herramienta de selección que funciona como un pincel digital y que ha reemplazado tanto la selección cuadrada como las herramientas de lazo.

El nuevo editor está disponible para todos los usuarios de Midjourney que ya hayan generado más de 10 imágenes en la plataforma. Las reacciones iniciales de la comunidad de creadores han sido en gran medida positivas.

El editor llega dos semanas después El lanzamiento de Midjourney 6.1lo que mejoró la calidad y la coherencia de la imagen (como el número correcto de dedos), así como también mejoró significativamente los tiempos de procesamiento y la comprensión de la precisión del texto en sus indicaciones de imagen.

Grok-2 libera al monstruo

La actualización de Midjourney también llega solo dos días después. Después del lanzamiento de Grok-2 por la startup xAI de Elon Musk, que es el próximo gran acontecimiento que ocurrió esta semana.

Las capacidades de generación de imágenes de Grok están impulsadas por el modelo Flux.1 de Black Forrest Lab, que ha ido creciendo rápidamente en popularidad debido a su impresionante calidad de imagen y su uso gratuito.

¡24 horas desde el lanzamiento de Grok 2.0 y sus capacidades de creación de imágenes!

¡He preparado estos 9 ejemplos para que los aproveches al máximo + acceso a una biblioteca infinita de indicaciones!

(Marcar esta opción para más tarde) imagen.twitter.com/7EDYSogfV2

— TechHalla (@techhalla) 15 de agosto de 2024

La mayor controversia con Grok-2 no es solo su calidad, que es bastante buena, sino sus pautas aparentemente indefinidas. A diferencia de muchos de los otros generadores de imágenes de IA, Grok-2 parece tener muy pocas pautas en cuanto a propiedad intelectual, violencia y otro contenido explícito. No es la primera vez que un generador de imágenes de IA ha visto este tipo de errores, pero con Grok, parece intencional, y Musk lo llama “la IA más divertida del mundo”.

La gente ya ha puesto a prueba sus límites y ha creado todo tipo de imágenes horribles y extrañas que evocan los primeros días de la generación de imágenes con inteligencia artificial. Pero si creemos en la retórica de Musk, la falta de directrices de Grok-2 parece intencionada y podría acabar dando forma a la evolución de esta tecnología en el futuro.

Google se pone competitivo con Imagen 3

Una imagen de IA generada por el modelo Imagen-3 de Google. Google

Por último, Google anunció su nuevo Imagen 3 Modelo de IAque era Lanzado para todos los usuarios de EE. UU. el juevesGoogle lo llama su “modelo de conversión de texto a imagen de la más alta calidad”, que ahora puede producir “mejores detalles, una iluminación más rica y menos artefactos que distraigan que nuestros modelos anteriores”. Google también dice que Imagen-3 es mejor para reproducir texto y ahora viene en diferentes versiones, diseñadas para la tarea en cuestión, como algo ligero como un boceto rápido o algo mucho más detallado y de alta resolución.

Por ahora, Imagen 3 solo está disponible a través de la cocina de pruebas de inteligencia artificial de Google, como parte de ImageFX. Actualmente, se encuentra en versión beta cerrada, lo que significa que tendrás que unirte a la lista de espera si aún no participas.




Fuente