OpenAI presenta inteligencia artificial de voz avanzada para suscriptores

Empresa de inteligencia artificial (IA) IA abierta ha comenzado Desplegando Una función de voz avanzada para su ChatGPT plataforma.

La función, que utiliza el modelo GPT-4o de la compañía, ofrece respuestas de audio hiperrealistas, según un artículo de TechCrunch del martes (30 de julio). informeLas nuevas capacidades de audio supuestamente permiten a los usuarios tener conversaciones en tiempo real y sin demoras con ChatGPT e incluso interrumpirlo a mitad de oración, lo que aborda desafíos clave para lograr interacciones de IA realistas.

La versión alfa del modo de voz avanzado se está lanzando para un grupo selecto de suscriptores de ChatGPT Plus, con planes de implementar una implementación más amplia para todos los usuarios premium en otoño. Este enfoque cauteloso surge después de la controversia en torno a la demostración inicial de la tecnología en mayo.

Durante esa presentación, la capacidad de voz, denominada “Sky”, llamó la atención por su asombroso parecido con la voz de la actriz Scarlett Johansson, incluso cuando la actriz dijo que había negado repetidamente el permiso a OpenAI para usar su voz.

Johansson, quien tuvo un papel protagónico en la película con temática de inteligencia artificial “Her”, posteriormente buscó asesoría legal para proteger su imagen. OpenAI negó haber usado la voz de Johansson, pero eliminó la controvertida demostración, lo que pone de relieve el complejo panorama legal que rodea a la IA y los derechos de imagen de las celebridades.

Para mitigar el posible uso indebido, OpenAI ha limitado el sistema a cuatro voces predefinidas creadas en colaboración con actores de voz pagos. La empresa enfatizó que ChatGPT no puede hacerse pasar por individuos específicos o figuras públicas, una medida diseñada para prevenir la creación de deepfakes engañosos, una preocupación creciente en la industria de la IA.

“Probamos las capacidades de voz de GPT-4o con más de 100 miembros externos del equipo rojo en 45 idiomas”, dijo la empresa. escribió en Xanteriormente Twitter, en una serie de publicaciones el martes para anunciar la nueva oferta. “Para proteger la privacidad de las personas, hemos entrenado al modelo para que solo hable con las cuatro voces preestablecidas y hemos creado sistemas para bloquear las salidas que difieren de esas voces. También hemos implementado barandillas para bloquear las solicitudes de contenido violento o con derechos de autor”.

OpenAI también ha implementado filtros para bloquear solicitudes de generación de música o audio con derechos de autor, una medida probablemente influenciada por recientes acciones legales contra empresas de IA por supuestas infracciones de derechos de autor.

La industria de la música, en particular, ha sido proactiva a la hora de desafiar el contenido generado por IA, y ya se han presentado demandas contra los generadores de canciones con IA. Suno y Audio.



Fuente