¿Los modelos de IA actuales realmente recuerdan, piensan, planifican y razonan, tal como lo haría un cerebro humano? Algunos laboratorios de IA te harían creer que sí, pero según el científico jefe de IA de Meta, Yann LeCun, la respuesta es no. Sin embargo, cree que podríamos llegar allí en aproximadamente una década, aplicando un nuevo método llamado “modelo mundial”.
A principios de este año, OpenAI lanzó una nueva función que llama “memoria”que permite a ChatGPT “recordar” sus conversaciones. la startup última generación de modelos, o1muestra la palabra “pensar” mientras genera un resultado, y OpenAI dice que los mismos modelos son capaces de realizar un “razonamiento complejo”.
Todo eso suena como si estuviéramos bastante cerca de AGI. Sin embargo, durante un Charla reciente en el Foro Hudson.LeCun socavó a los optimistas de la IA, como el fundador de xAI, Elon Musk, y el cofundador de Google DeepMind, Shane Legg, quienes sugieren que la IA a nivel humano está a la vuelta de la esquina.
“Necesitamos máquinas que comprendan el mundo; (máquinas) que pueden recordar cosas, que tienen intuición, que tienen sentido común, cosas que pueden razonar y planificar al mismo nivel que los humanos”, dijo LeCun durante la charla. “A pesar de lo que hayas escuchado de algunas de las personas más entusiastas, los sistemas de inteligencia artificial actuales no son capaces de hacer nada de esto”.
LeCun dice que los grandes modelos de lenguaje actuales, como los que impulsan ChatGPT y Meta AI, están lejos de ser una “IA a nivel humano”. La humanidad podría estar a “años o décadas” de lograr tal cosa, dijo más tarde. (Sin embargo, eso no impide que su jefe, Mark Zuckerberg, le pregunte cuándo se implementará AGI).
La razón es sencilla: esos LLM funcionan prediciendo el siguiente token (generalmente unas pocas letras o una palabra corta), y los modelos de imagen/video actuales predicen el siguiente píxel. En otras palabras, los modelos de lenguaje son predictores unidimensionales y los modelos de imagen/video de IA son predictores bidimensionales. Estos modelos se han vuelto bastante buenos para predecir en sus respectivas dimensiones, pero en realidad no comprenden el mundo tridimensional.
Debido a esto, los sistemas de inteligencia artificial modernos no pueden realizar tareas simples que la mayoría de los humanos pueden realizar. LeCun observa cómo los humanos aprenden a recoger la mesa a los 10 años y a conducir un coche a los 17, y aprenden ambas cosas en cuestión de horas. Pero incluso los sistemas de inteligencia artificial más avanzados del mundo, construidos sobre miles o millones de horas de datos, no pueden operar de manera confiable en el mundo físico.
Para lograr tareas más complejas, LeCun sugiere que necesitamos construir modelos tridimensionales que puedan percibir el mundo que nos rodea y centrarnos en un nuevo tipo de arquitectura de IA: los modelos mundiales.
“Un modelo mundial es tu modelo mental de cómo se comporta el mundo”, explicó. “Puedes imaginar una secuencia de acciones que podrías realizar, y tu modelo mundial te permitirá predecir cuál será el efecto de la secuencia de acciones en el mundo”.
Considere el “modelo mundial” en su propia cabeza. Por ejemplo, imagina que ves un dormitorio desordenado y quieres limpiarlo. Puedes imaginar cómo recoger toda la ropa y guardarla sería suficiente. No es necesario probar varios métodos ni aprender a limpiar una habitación primero. Tu cerebro observa el espacio tridimensional y crea un plan de acción para lograr tu objetivo en el primer intento. Ese plan de acción es el ingrediente secreto que prometen los modelos mundiales de IA.
Parte del beneficio aquí es que los modelos mundiales pueden absorber muchos más datos que los LLM. Eso también los hace computacionalmente intensivos, razón por la cual Los proveedores de la nube se apresuran a asociarse con empresas de inteligencia artificial..
Los modelos mundiales son la gran idea que ahora persiguen varios laboratorios de IA, y el término se está convirtiendo rápidamente en la próxima palabra de moda para atraer financiación de riesgo. Un grupo de investigadores de IA de gran prestigio, incluidos Fei-Fei Li y Justin Johnson, acaba de plantear 230 millones de dólares para su startupLaboratorios mundiales. La “madrina de la IA” y su equipo también están convencidos de que los modelos mundiales desbloquearán sistemas de IA significativamente más inteligentes. OpenAI también describe sus inéditos. generador de vídeo sora como modelo mundial, pero no ha entrado en detalles.
LeCun describió una idea para utilizar modelos mundiales para crear IA a nivel humano en un papel 2022 sobre “IA impulsada por objetivos”, aunque señala que el concepto tiene más de 60 años. En resumen, una representación básica del mundo (como un vídeo de una habitación sucia, por ejemplo) y la memoria se introducen en un modelo del mundo. Luego, el modelo mundial predice cómo será el mundo basándose en esa información. Luego le asignas objetivos al modelo mundial, incluido un estado alterado del mundo que te gustaría lograr (como una sala limpia), así como barandillas para garantizar que el modelo no dañe a los humanos para lograr un objetivo (no matar). conmigo en el proceso de limpieza de mi habitación, por favor). Luego, el modelo mundial encuentra una secuencia de acción para lograr estos objetivos.
Según LeCun, el laboratorio de investigación de IA a largo plazo de Meta, FAIR o Fundamental AI Research, está trabajando activamente para construir modelos mundiales y de IA basados en objetivos. FAIR solía trabajar en IA para los próximos productos de Meta, pero LeCun dice que en los últimos años el laboratorio se ha centrado exclusivamente en la investigación de IA a largo plazo. LeCun dice que FAIR ni siquiera utiliza LLM en estos días.
Los modelos mundiales son una idea intrigante, pero LeCun dice que no hemos avanzado mucho para hacer realidad estos sistemas. Hay muchos problemas muy difíciles para llegar desde donde estamos hoy, y dice que ciertamente es más complicado de lo que pensamos.
“Pasarán años antes de que podamos conseguir que todo aquí funcione, si no una década”, afirmó Lecun. “Mark Zuckerberg sigue preguntándome cuánto tiempo llevará”.