He grabado miles de horas de vídeo a lo largo de los años de mi carrera y puedo decirles que requiere mucha preparación, trabajo y energía. También puedo decirte que si usas un generador de video de avatar con IA como HeyGen, no requiere casi nada de lo anterior, y eso me asusta muchísimo.
Con la llegada del vídeo generativo de alta calidad, estos avatares de vídeo con IA están apareciendo por todas partes. No he prestado mucha atención, principalmente porque me gusta estar frente a la cámara y estoy feliz de hacerlo para televisión y videos sociales. Aun así, sé que no a todo el mundo le encanta ser el centro de atención y felizmente le entregaría las tareas a un avatar, y cuando vislumbré la aparente calidad de los avatares de HeyGen, me intrigó lo suficiente como para intentarlo. Ahora, sinceramente, desearía no haberlo hecho.
HeyGen, que puede usar en dispositivos móviles o de escritorio, es una plataforma simple y poderosa para crear avatares de IA que, según los scripts que usted proporcione, pueden hablarle a la cámara por usted. Son útiles para presentaciones de video, redes sociales, avatares interactivos, videos de capacitación y esencialmente cualquier cosa en la que un rostro humano atractivo pueda ayudar a vender el tema o la información.
HeyGen te permite crear gemelos digitales que pueden aparecer en vídeos relativamente estáticos o en los que el otro está en movimiento. Por mi experiencia, elegí la opción “Foto fija”.
Configurando otro yo
Hay algunas reglas para crear tu avatar y creo que seguirlas como lo hice puede haber resultado en la calidad ligeramente desagradable de mi gemelo digital.
HeyGen recomienda que comiences el proceso grabando un vídeo tuyo usando una cámara profesional o una de tus mejores teléfonos inteligentespero el vídeo debe tener al menos 1080p. Si usas la versión gratuita como lo hice yo, notarás que los videos finales son solo de 720p. Actualice más tarde y podrá comenzar a producir avatares de video Full HD (más información sobre la estructura de precios más adelante).
Hay otras recomendaciones, como usar un “fondo bonito”, evitar sombras intensas” y ruido de fondo, y algunas que son clave para vender tu versión gemela digital. HeyGen me pidió que mirara directamente (pero no de manera espeluznante, supongo). ) frente a la cámara, haga gestos normales (abiertos a interpretación) por debajo del nivel del pecho y haga pausas entre oraciones. El último bit es en realidad un buen consejo para hacer videos reales. Tengo la costumbre de hablar en flujo de conciencia y olvidarme de hacer pausas y crear. fragmentos de sonido obvios para la edición.
Aquí, sin embargo, las pausas no se refieren a lo que estás diciendo, al menos en el vídeo de formación. Parece que se trata de aprender a manejar la cara y la boca de tu gemelo cuando hablas y cuando no.
En cualquier caso, podía decir lo que quisiera a la cámara siempre que fuera durante al menos 2 minutos. Más videos ayudarán con la calidad de los nuevos videos con tu avatar.
Entrenando para ser yo
Configuré mi iPhone 16 Pro Max y un par de luces y me filmé en la oficina de mi casa durante 2 minutos hablando de tonterías, asegurándome todo el tiempo de hacer pausas de 1 segundo y evitar que mis gestos fueran demasiado salvajes. Después de lanzarlo por Airdrop en mi MacBook Air, subí el video. Fue en este punto que quedó claro que, como usuario que no paga, estaba cediendo prácticamente todos los derechos del vídeo a HeyGen. No es óptimo en absoluto, pero no estaba dispuesto a empezar a pagar 24 dólares al mes por el plan básico y recuperar el control de mi imagen.
El sistema HeyGen tardó un tiempo considerable en incorporar el vídeo y preparar mi gemelo digital. Una vez que estuvo listo, pude crear mi primer video de 3 minutos. Los clientes que pagan pueden crear videos de 5 minutos o más, según el nivel de servicio que elijan. El pago también otorga acceso a un procesamiento de video más rápido.
Para crear un video, seleccioné el formato de video: vertical u horizontal. Grabé mi vídeo de entrenamiento en retrato, pero eso no pareció importar. También tuve que proporcionar un script que pudiera escribir o pegar en un campo que aceptara un máximo de 2000 caracteres.
Para alguien que se gana la vida escribiendo, tuve problemas con el guión y finalmente me decidí por un breve soliloquio de Hamlet. Después de comprobar la longitud del guión, el sistema se puso a trabajar y generó lentamente mi primer vídeo de HeyGen Digital Twin. Debo haber dejado accidentalmente algunos espacios en blanco al final de mi guión porque aproximadamente la mitad es mi yo digital luchando silenciosamente ante las cámaras. Es inquietante.
nada es real
@lanceulanoff
♬ sonido original – Lance Ulanoff
Seguí esto con un apretado video de TikTok donde revelé que el video que estaban viendo no era realmente yo. Mi tercer vídeo y el último de mi asignación mensual gratuita era en el que contaba un chiste: “¿Alguna vez has jugado tenis tranquilo? Es lo mismo que el tenis normal pero sin la raqueta. ¡Ja, ja, ja, ja, ja, ja, ja!”. Como habrás adivinado, el remate realmente no aterriza y debido a que mi gemelo digital nunca sonríe y ofrece la “risa” de una manera completamente carente de humor, nada de eso es ni remotamente divertido.
En todos estos videos, me sorprendió la calidad del audio. Es la esencia de mi voz pero tampoco mi voz. Es demasiado robótico y carente de emoción. Al menos está sincronizado correctamente con la boca. El apartado visual, por otro lado, es casi perfecto. Mi gemelo digital se parece a mí o, al menos, a una versión mía sin emociones a la que le gusta Tim Cook gestos con las manos al estilo de las notas clave. Para ser justos, no sabía qué hacer con mis manos cuando grabé originalmente mi video de entrenamiento, y me preocupaba que si no controlaba mis gestos, a menudo salvajes, se verían extraños con mi gemelo digital. Me equivoqué. Este gemelo demasiado controlado es el más extraño.
Simplemente no
¿Puede una versión mía con IA contar un chiste? Más o menos. #heygen @HeyGen_Official pic.twitter.com/ODke9z67VH9 de octubre de 2024
En TikTok, alguien escribió: “A nadie le gusta esto. Nadie quiere esto”. Cuando publiqué el vídeo en Threads, las reacciones variaron desde la conmoción hasta la consternación. La gente notó mis gestos con las manos “que distraen”, los llamaron “espeluznantes” y les preocupaba que esos videos representaran la “muerte de la verdad”.
Pero aquí está la cuestión. Si bien el video generado por IA es preocupante, no dice nada que no haya escrito o copiado y pegado. Sí, mi gemelo digital ya es más que asombroso y profundamente inquietantemente preciso, pero al menos está cumpliendo mis órdenes. La preocupación es que si tienes un buen vídeo de 2 minutos de otra persona hablando, ¿podrías subirlo y luego hacer que diga lo que quieras? Probablemente.
HeyGen recibe crédito por crear de manera efectiva un generador de video gemelo digital sin complicaciones. Está lejos de ser perfecto y podría mejorarse enormemente si también hicieran que los usuarios lo entrenaran en emociones (el correcto busca “divertido”, “triste”, “enojado”, ya lo entiendes) y una variedad más amplia de expresiones faciales (una sonrisa o dos estarían bien). Hasta entonces, estos gemelos digitales serán nuestros dobles sin emociones, esperando hacer nuestras ofertas en video.