Los suscriptores Premium de X (anteriormente Twitter) ahora pueden pedirle al asistente de IA de Grok que describa imágenes, no solo que las cree. El La empresa xAI, propiedad de Elon Musk, presentó una nueva función para el análisis de contenido visual, que le brinda la capacidad de describir fotografías, diagramas y otras instantáneas utilizando el Grok-2 Modelo de IA que impulsa la IA chatbot y su Creación de imágenes Flux AI.
La característica pone a Grok a la par con ChatGPTGéminis y otros rivales. Si se suscribe a los planes de suscripción de X, puede probarlo ahora haciendo clic en un botón en una publicación de imagen dentro de X y haciéndole preguntas a Grok sobre la imagen o simplemente para un análisis descriptivo directo.
Junto con la nueva característica, Grok mostró un nuevo punto de referencia llamado RealWorldQA que se supone que muestra qué tan bien un modelo puede describir una imagen del mundo real, incluido el espacio entre objetos. La compañía afirma que RealWorldQA muestra que Grok es tan bueno o mejor que sus rivales a la hora de explicar imágenes, aunque todavía está en desarrollo. Puedes ver un ejemplo a continuación de cómo funciona, compartido en X de Elon Musk.
Grok ahora entiende las imágenes e incluso explica el significado de un chiste. Esta es una primera versión. Mejorará rápidamente. https://t.co/gQ5BBISVRc28 de octubre de 2024
Ver y asimilar
Como ilustra la captura de pantalla, Grok es capaz de descomponer una imagen compleja de varias etapas y explicar lo que sucede en ella. Luego puede extrapolar el humor del chiste, aunque, como casi siempre ocurre, explicar el chiste lo hace mucho menos divertido. Aún así, es una señal de que xAI no ha terminado de presentar nuevas funciones para Grok, especialmente herramientas multimodales. Este podría ser un paso para que Grok pueda explicar el contenido de audio y video de la misma manera que lo hace con las imágenes.
Un elemento que no se menciona es cómo el análisis visual de Grok podría representar la libre Creación de imágenes por parte del chatbot de IA que parece tener poco o ningún escrúpulo en cuestiones de derechos de autor. Es algo de lo que los usuarios hacen imágenes. mario se enfrentó cuando el cazador de infracciones de derechos de autor de Nintendo, Tracer fue tras ellos por infracción. Si una imagen de IA de mario o cualquier otra propiedad intelectual se describiría como tal o en términos más genéricos sería interesante descubrirla.
Siendo el propietario de xAI quien es, también existe un potencial muy obvio para la función en otras empresas de tecnología propiedad de Musk. La conducción semiautónoma de Tesla ciertamente se beneficiaría al poder identificar personas y objetos a su alrededor y cómo están separados. Lo mismo ocurre con los robots humanoides largamente prometidos que Tesla ha estado desarrollando durante los últimos años.