El director ejecutivo de OpenAI, Sam Altman, dice que la falta de capacidad informática está retrasando los productos de la empresa

En un Reddit amael director ejecutivo de OpenAI, Sam Altman, admitió que la falta de capacidad informática es un factor importante que impide a la empresa enviar productos con la frecuencia deseada.

“Todos estos modelos se han vuelto bastante complejos”, escribió en respuesta a una pregunta sobre por qué los próximos modelos de IA de OpenAI estaban tardando tanto. “También nos enfrentamos a muchas limitaciones y decisiones difíciles sobre (cómo) asignamos nuestra computación a muchas grandes ideas”.

Muchos informes sugieren que OpenAI ha tenido dificultades para asegurar suficiente infraestructura informática para ejecutar y entrenar sus modelos generativos. Esta misma semana, Reuters, citando fuentes, dicho que OpenAI ha estado trabajando durante meses con Broadcom para crear un chip de IA para modelos en ejecución, que podría llegar tan pronto como 2026.

En parte como resultado de la capacidad limitada, dijo Altman, la característica conversacional que suena realista de OpenAI para ChatGPT, Modo de voz avanzadono obtendrá las capacidades de visión que se mostraron por primera vez en abril en el corto plazo. En su evento de prensa de abril, OpenAI presentado la aplicación ChatGPT que se ejecuta en un teléfono inteligente y responde a señales visuales, como la ropa que alguien llevaba, a la vista de la cámara del teléfono.

Informes de Fortune reveló más tarde que la demostración se apresuró a desviar la atención de la conferencia de desarrolladores I/O de Google, que se estaba llevando a cabo esa misma semana. Muchos dentro de OpenAI no pensaron que GPT-4o estuviera listo para ser revelado; es revelador que la versión solo de voz del Modo de Voz Avanzado estaba demorado durante meses.

En la AMA, Altman indicó que la próxima versión importante del generador de imágenes de OpenAI, DALL-Eno tiene cronograma de lanzamiento. (“Todavía no tenemos un plan de lanzamiento”, dijo). Mientras tanto, sorala herramienta de generación de videos de OpenAI, se ha visto frenada por la “necesidad de perfeccionar el modelo, lograr la seguridad/suplantación/otras cosas correctamente y escalar la computación”, escribió Kevin Weil, director de productos de OpenAI, quien también participó en la AMA.

Según se informa, Sora ha sufrido contratiempos técnicos que lo posicionan mal frente a sistemas rivales de Luma, Runway y otros. Por The Information, el sistema original, revelado en febrero, tomó más de 10 minutos de procesamiento para crear un videoclip de 1 minuto.

En octubre, uno de los codirectores de Sora, Tim Brooks, izquierda para Google.

Más tarde en la AMA, Altman dijo que OpenAI todavía considerando permitir contenido “NSFW” en ChatGPT “algún día” (“creemos totalmente en tratar a los usuarios adultos como adultos”, escribió), y que la principal prioridad de la compañía es mejorar su o1 Serie de modelos de “razonamiento” y sus sucesores. Abierto AI vista previa Una serie de características llegarán a o1 en su conferencia DevDay en Londres esta semana, incluida la comprensión de imágenes.

“Tenemos algunos lanzamientos muy buenos a finales de este año”, escribió Altman. “Sin embargo, nada de lo que vamos a llamar GPT-5”.

Fuente