El próximo truco de magia de Google es hacer que la IA suene para tus vídeos generativos

Es posible que los creadores de contenido nunca vuelvan a tener escasez de material adicional gracias a la última herramienta de inteligencia artificial de Google DeepMind.

El laboratorio de inteligencia artificial de Google mostró su tecnología de conversión de video a audio, abreviada a V2AY, al igual que el vídeo generativo, V2A utiliza IA para crear audio que pueda coincidir con lo que se reproduce en un vídeo. En las primeras demostraciones, la nueva tecnología de inteligencia artificial es capaz de ofrecer un audio convincente, como pasos firmes o golpes de batería precisos que se alinean con la sincronización de los videos.

En teoría, la idea resolvería una brecha en el video generativo tal como lo conocemos. Sora de OpenAIla Dream Machine más reciente de Luma AI y la propia de Google veo Todavía le falta audio a pesar de poder generar imágenes impresionantes.

Desbloqueo del audio creado por IA

V2A aún está en desarrollo, pero las primeras muestras que presentó Google DeepMind son muy prometedoras. Como se ve en las demostraciones, V2A puede agregar cualquier cosa, desde música de fondo dramática hasta efectos de sonido realistas. Google DeepMind dijo que V2A puede incluso generar bandas sonoras para muestras de vídeo más antiguas, como imágenes de archivo o películas mudas.

Sorprendentemente, Google DeepMind dijo que V2A puede “generar una cantidad ilimitada de bandas sonoras para cualquier entrada de video”, lo que significa que obtienes un montón de muestras de audio para jugar hasta que encuentres una que se adapte perfectamente a tu video. Más allá de eso, puede modificar su mensaje inicial diciéndole a V2A si hace más frío o más calor según lo que estaba buscando.

Sin embargo, hay desventajas. Google DeepMind dijo que V2A funciona al comprender los píxeles sin procesar del video fuente. Eso significa que si su video tiene artefactos o distorsión, es posible que tenga algunos problemas de calidad con el audio generado. Además, V2A tiene dificultades para sincronizar cosas como una transcripción proporcionada para que coincida con alguien que habla en un video. Como puede ver a continuación, el video y el audio no coinciden, lo que rompe la ilusión de este clip generado por IA.

Aún no está listo para su lanzamiento

Por muy impresionantes que parezcan estas demostraciones, Google DeepMind dijo que aún no está listo para lanzar esta tecnología a las masas. Antes de cualquier publicación oficial, el laboratorio de IA dijo que llevaría a cabo “rigurosas evaluaciones y pruebas de seguridad”, pero no detalló el alcance exacto de esas pruebas.

Teniendo en cuenta el ritmo al que IA generativa está evolucionando, tiene sentido que Google DeepMind sea más cauteloso cuando se trata de lanzar nuevas herramientas poderosas como V2A. Ya hemos visto algunos malos actores aproveche las salvaguardias implementadas para las herramientas de IA generativa y V2A podría abrir otra lata de gusanos. Por otro lado, también podría ser otro cambio de juego de la IA para los creadores de contenido.

Fuente