- Meta acaba de lanzar Movie Gen, un generador de vídeo con IA para competir con Sora de OpenAI.
- Movie Gen puede crear videos con audio adjunto mediante un mensaje de texto. También puede editar mediante mensaje.
- Meta se unió a la carrera de generación de videos más tarde que OpenAI y Google.
Meta lanzó el viernes una nueva herramienta de generación de videos de IA que también es la última andanada de la compañía en su batalla con OpenAI por la supremacía de la IA.
“Hoy estamos entusiasmados de presentar Meta Movie Gen, nuestra innovadora investigación de IA generativa para medios, que incluye modalidades como imagen, video y audio”, dijo la compañía en un presione soltar. “Movie Gen supera a modelos similares en la industria en estas tareas cuando lo evalúan humanos”.
En su comunicado de prensa, Meta calificó a Movie Gen como el “conjunto de modelos de narración más avanzado e inmersivo”, que incluye generación de video, generación de audio, generación de video personalizado y edición de video. Los modelos se entrenaron utilizando datos disponibles públicamente y datos autorizados, dijo la compañía.
Con un mensaje de texto, Movie Gen puede crear videos de hasta 16 segundos de duración a 16 fotogramas por segundo mientras razona “sobre el movimiento de objetos, las interacciones sujeto-objeto y el movimiento de la cámara”. Los usuarios pueden cargar una imagen de ellos mismos para incorporarla en videos personalizados, y Movie Gen puede editar videos con instrucciones de texto del usuario.
El vídeo de ejemplo de Meta muestra una perspectiva submarina de un hipopótamo bebé (Moo Deng referencia, ¿alguien?) nadando felizmente en un sereno escenario acuático.
Otra muestra un koala sobre una tabla de surf y el mensaje que lo acompaña: “Un oso koala mullido surfea. Tiene un pelaje gris y blanco y una nariz redonda. La tabla de surf es amarilla. El oso koala se agarra a la tabla de surf con sus patas. El koala La expresión facial del oso está enfocada. El sol brilla.”
Con la generación de audio, los usuarios pueden “crear y ampliar efectos de sonido, música de fondo o bandas sonoras completas” de hasta 45 segundos de duración, según el comunicado de prensa. Un clip de ejemplo de una serpiente. Deslizarse por una zona boscosa incluye el mensaje: “Hojas susurrantes y ramitas chasqueando, con una pista de música orquestal”.
Meta llega un poco tarde al juego de la generación de audio y video, ya que los principales competidores como OpenAI y Google ya se han afianzado en el espacio. AbiertoAi lanzó sorasu generador de vídeos, en febrero, y Google hizo lo mismo con Veo En Mayo.
Meta, sin embargo, ha dado OpenAI, una carrera por su dinero en la carrera armamentista de la IA. Aunque ChatGPT de OpenAI debutó primero y lanzó a la compañía a la fama mundial, las versiones recientes del modelo Llama de Meta han sido bien recibidas. Muchos visto Llama 3.1que salió en julio, como superior al GPT-4o de OpenAI, que salió poco antes.
Meta dice que sus nuevos “modelos de última generación” superan a sus competidores en comparaciones humanas A/B. Para la generación de videos, los Meta encuestados prefirieron Movie Gen a OpenAI Soradecía el comunicado de prensa de la compañía. Meta no compartió una comparación A/B con Veo de Google, que también ofrece efectos de sonido y música, pero Meta dijo en un extenso texto adjunto. trabajo de investigación que cree que los modelos de generación de vídeo a audio de Google pueden tener una duración más limitada que los de Meta.
Meta, OpenAI y Google no respondieron de inmediato a una solicitud de comentarios.