La filtración de Reddit muestra que el asistente de voz de ChatGPT tiene más trucos bajo la manga

de OpenAI Asistente de voz ChatGPT Claramente está tratando de mover la aguja de los comandos de voz.

En una muestra publicada en línea de lo que se espera que sea el modo de voz avanzado actualizado de ChatGPT, Redditor RozziElCreador mostró cómo suena la nueva opción de voz y cómo puede incorporar efectos de sonido en sus respuestas. No solo la voz es increíblemente realista, sino que también hay sonidos de tormentas en el momento oportuno de fondo que añaden otro nivel de inmersión.

Ya quedamos impresionados cuando OpenAI reveló su Actualización de GPT-4o A principios de este año, mostró su asistente de inteligencia artificial que resuelve problemas matemáticos y canta. Sin embargo, la empresa siguió sorprendiéndonos con demostraciones cargadas en Es YouTubedonde podremos ver ChatGPT inventar historias con Múltiples personajes y diferentes voces. e incluso dos instancias de GPT-4o interactuando entre sí. Esta última actualización filtrada con efectos de sonido nos muestra que ChatGPT de OpenAI tiene incluso más casos de uso de los que le dimos crédito al principio.

Un borrador prometedor

Al escuchar la muestra de audio, los efectos de sonido tenían una apariencia aproximada de cómo suena una tormenta real. Teniendo en cuenta que esta filtración probablemente estuvo relacionada con una liberación accidental, es posible que obtengamos una versión más refinada una vez que OpenAI finalmente lance su modo de voz avanzado. Aun así, está claro cómo algunos efectos de sonido crean algo de misterio y dramatismo en la historia aleatoria que le pides a ChatGPT que genere.

Puede parecer básico dadas todas las hazañas de IA que hemos visto hasta ahora, pero considere que el chatbot de IA fue lo suficientemente inteligente como para crear un fragmento de sonido apropiado y programarlo para una inmersión máxima, todo mientras entregaba su respuesta con una increíble voz parecida a la humana.

La capacidad adicional de crear efectos de sonido sería perfecta para muchas indicaciones, como generar un cuento para la hora de dormir para tu hijo o convertir texto simple en un audiolibro más atractivo y personalizado; un usuario de Reddit incluso sugirió que podría reemplazar a tu maestro de mazmorras durante una campaña de Dungeons & Dragons. Aquí no faltan posibilidades y no hay duda de que OpenAI podría mejorar esta función en el futuro.

Aún no está listo para su lanzamiento

Aunque pudimos ver un adelanto del modo de voz avanzado de ChatGPT gracias a esta filtración de Reddit, no parece que esté listo para un lanzamiento oficial todavía. Incluso el usuario de Reddit que se topó con el nuevo modo dijo que el asistente de voz dejó de funcionar poco después de que terminara el audio de muestra. Además de eso, OpenAI anunció recientemente que Tuvo que retrasarse lanzamiento del Modo de Voz Avanzado porque necesitaba más tiempo para realizar pruebas.

La última actualización de la compañía se complicó aún más gracias a problemas legales; actor Scarlett Johansson amenazó con una demanda contra OpenAI debido a lo similar que sonaba la opción Sky ahora eliminada con la voz del actor.

De cualquier manera, el último adelanto del nuevo modo de voz de OpenAI nos da una idea del futuro de modelos de lenguaje grandes más avanzados que impulsan los chatbots de IA y cómo podrían aumentar las entradas de voz. Abróchate el cinturón, porque las cosas están a punto de ponerse aún más raras.

Fuente