Meta lanza una versión 'abierta' del generador de podcasts de Google

Meta ha lanzado una implementación “abierta” del función viral para generar un podcast en NotebookLM de Google.

Llamado CuadernoLlamael proyecto utiliza el propio Meta Llama modelos para gran parte del procesamiento, como era de esperar. Al igual que NotebookLM, puede generar resúmenes estilo podcast de ida y vuelta de los archivos de texto cargados en él.

NotebookLlama primero crea una transcripción a partir de un archivo, por ejemplo, un PDF de un artículo de noticias o una publicación de blog. Luego, agrega “más dramatización” e interrupciones antes de alimentar la transcripción a modelos abiertos de conversión de texto a voz.

Créditos de imagen:Meta

Los resultados no parecen tan buenos como los de NotebookLM. En el CuadernoLlama muestras He escuchado que las voces tienen una cualidad robótica muy obvia y tienden a hablar entre sí en puntos extraños.

Pero los investigadores de Meta detrás del proyecto dicen que la calidad podría mejorarse con modelos más potentes.

“El modelo de texto a voz es la limitación de cuán natural sonará”, escribieron en la página GitHub de NotebookLlama. “(Además) otra forma de escribir el podcast sería hacer que dos agentes debatan el tema de interés y escriban el esquema del podcast. Ahora utilizamos un único modelo para escribir el esquema del podcast”.

NotebookLlama no es la primera intentar para replicar la función de podcast de NotebookLM. Algunos proyectos han tenido más éxito que otros. Pero ninguno, ni siquiera el propio NotebookLM, ha logrado resolver el problema. problema de alucinaciones que persigue a toda la IA. Es decir, los podcasts generados por IA son Seguro que contiene algunas cosas inventadas..

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here