Google actualizó el jueves la función de resumen de audio de su asistente de investigación y toma de notas de IA CuadernoLMque recientemente ganó mucha atención por su tipo podcast conversaciones de audio basadas en el contenido que comparten los usuarios, con la capacidad de guiar esas conversaciones y centrarse en temas específicos en lugar de simplemente generar resúmenes de audio holísticos.
Hoy en día, las descripciones generales de audio en NotebookLM permiten a los usuarios digerir y comprender la información en documentos extensos o videos a través de conversaciones de audio generadas por IA. Poco después de su lanzamiento El mes pasado, la función ayudó a NotebookLM a captar la atención, ya que muchos comenzaron a compartir resúmenes de audio de su contenido en las redes sociales, incluidos los creados con su diarios o diarios.
Si bien Google no ha revelado la tracción que ha recibido NotebookLM como resultado, los datos de la plataforma de análisis de tráfico del sitio web SimilarWeb sugiere que NotebookLM experimentó un aumento de más del 371% en su tráfico en septiembre a 3,07 millones de visitas mensuales, frente a las 652.181 de hace un mes.
Hasta ahora, Audio Overviews generaba automáticamente conversaciones de IA a partir de las fuentes de los usuarios. Pero dado que las conversaciones a veces giran en torno a contenido que no es importante, Google está presentando una actualización que le permite personalizar las descripciones generales según sus necesidades. Esto permite a los usuarios hacer que el audio se centre más en un tema particular dentro de su contenido.
Un control dedicado “Personalizar” está disponible antes del botón “Generar” existente para permitirle proporcionar instrucciones para que los hosts de IA en el audio se concentren en un punto específico.
Raiza Martin, líder de producto de NotebookLM y gerente senior de producto de IA en Google Labs, dijo a TechCrunch que la actualización brinda a los usuarios una forma de empujar a la IA para que se mueva en la dirección que desean.
“Todo el equipo se ha dedicado a escuchar y analizar todos los comentarios que hemos recibido. Y la característica número uno que surgió y que la gente quería era simplemente darle un pequeño empujón a la IA”, dijo.
Personalizar los resúmenes de audio también puede ayudar a reducir las alucinaciones hasta cierto punto, es decir, aquellas ocasiones en las que la IA elabora el contenido por sí sola. No obstante, Martin dijo que el equipo de NotebookLM rastrea los comentarios de los usuarios e intenta detectar las alucinaciones lo más rápido posible.
También enfatizó que personalizar los resúmenes de audio no significa que se utilizarán instrucciones del usuario para entrenar el modelo de IA.
“En general, no nos formamos con los datos de los usuarios. Entonces, su uso, o cualquier consulta que ingrese, cualquier respuesta que ingrese, no entrenamos a los modelos con él”, dijo, y agregó: “Solicitamos muchos comentarios de nuestros usuarios”.
Además de la opción de personalización, los usuarios pueden escuchar en segundo plano en Audio Overviews. Esto le permite continuar trabajando en NotebookLM, consultar sus fuentes, recibir citas y explorar citas relevantes mientras el audio se reproduce en segundo plano.
NotebookLM fue lanzado inicialmente como un proyecto en la conferencia de desarrolladores I/O de Google el año pasado y debutó para el acceso público en Estados Unidos en diciembre. Él Ampliado a mercados como India y Reino Unido.y más de 200 países en junio. Aunque el producto inicialmente tuvo cierta tracción dentro de los casos de uso de educación e investigación, las empresas y organizaciones solo comenzaron a probarlo después de que Google amplió su soporte para más fuentes y agregó nuevas funciones.
Ahora, Google dice que más de 80.000 organizaciones utilizan NotebookLM, lo que ve como una oportunidad para explorar la monetización. Con la esperanza de aprovechar esta tracción, la compañía lanzó el jueves el programa piloto NotebookLM Business.
Las empresas pueden postularse para el piloto y, si son aceptadas, dijo Google, obtendrán acceso temprano a las funciones del producto, capacitación y soporte por correo electrónico.
Martin le dijo a TechCrunch que, bajo el piloto empresarial, su equipo capacita a las organizaciones interesadas en utilizar NotebookLM sobre cómo lo utilizan otras empresas.
“(También) queremos que las empresas nos digan que estas son las funciones que queremos implementar”, dijo.
La disponibilidad general y el precio de NotebookLM Business se anunciarán a finales de este año. Sin embargo, Google aún no ha revelado el cronograma exacto ni ningún detalle específico sobre los niveles de precios.
NotebookLM actualmente recibe 4,17 millones de visitas mensuales, de las cuales 2,5 millones provienen de computadoras de escritorio y 1,6 millones de dispositivos móviles, según SimilarWeb.
Actualmente, el asistente no tiene una aplicación móvil dedicada y está disponible en todas las pantallas a través de su sitio web. Sin embargo, Martin le dijo a TechCrunch que el equipo está explorando activamente una experiencia móvil nativa para expandir la presencia de NotebookLM entre los usuarios de teléfonos inteligentes. También está explorando más voces, idiomas y controles para las descripciones generales de audio.
Además, el equipo exploró y creó prototipos de diferentes números de oradores, para ir más allá de los dos oradores existentes para discusiones de audio de IA, aunque no es probable que esté disponible pronto ya que Martin dijo que no era la característica más solicitada por los usuarios.
El mes pasado, NotebookLM Se agregaron videos y archivos de audio de YouTube. como fuentes para generar resúmenes junto con fuentes existentes como Google Drive, URL, PDF y texto.
Martin dijo que NotebookLM considera los archivos PDF y los videos de YouTube como las dos fuentes principales. El equipo también observó un “porcentaje muy alto” de usuarios que escucharon una descripción general en audio y utilizaron el chat. El siguiente grupo más grande son los usuarios que sólo utilizan el chat sin generar una descripción general de audio.