Meta lanza un modelo de IA que puede comprobar el trabajo de otros modelos de IA Por Reuters

Por Katie Paul

NUEVA YORK – El propietario de Facebook (NASDAQ 🙂, Meta, dijo el viernes que estaba lanzando un lote de nuevos modelos de IA de su división de investigación, incluido un “evaluador autodidacta” que puede ofrecer un camino hacia una menor participación humana en el proceso de desarrollo de la IA.

El lanzamiento sigue a la introducción de la herramienta por parte de Meta en un artículo de agosto, que detalla cómo se basa en la misma técnica de “cadena de pensamiento” utilizada por los modelos o1 recientemente lanzados por OpenAI para lograr que emita juicios confiables sobre las respuestas de los modelos.

Esa técnica implica dividir problemas complejos en pasos lógicos más pequeños y parece mejorar la precisión de las respuestas a problemas desafiantes en materias como ciencias, codificación y matemáticas.

Los investigadores de Meta utilizaron datos totalmente generados por IA para entrenar el modelo evaluador, eliminando también la aportación humana en esa etapa.

La capacidad de utilizar IA para evaluarla de manera confiable ofrece una idea de un posible camino hacia la construcción de agentes de IA autónomos que puedan aprender de sus propios errores, dijeron a Reuters dos de los investigadores de Meta detrás del proyecto.

Muchos en el campo de la IA imaginan a estos agentes como asistentes digitales lo suficientemente inteligentes como para llevar a cabo una amplia gama de tareas sin intervención humana.

Los modelos de mejora automática podrían eliminar la necesidad de un proceso a menudo costoso e ineficiente que se utiliza hoy en día llamado aprendizaje por refuerzo a partir de la retroalimentación humana, que requiere la participación de anotadores humanos que deben tener experiencia especializada para etiquetar los datos con precisión y verificar que respondan a consultas complejas de matemáticas y escritura. son correctos.

“Esperamos que, a medida que la IA se vuelva cada vez más sobrehumana, sea cada vez mejor en la comprobación de su trabajo, de modo que sea realmente mejor que el humano promedio”, dijo Jason Weston, uno de los investigadores.

“La idea de ser autodidacta y capaz de autoevaluarse es básicamente crucial para la idea de llegar a este tipo de nivel sobrehumano de IA”, dijo.

Otras empresas, incluidas Google (NASDAQ 🙂 y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF, o aprendizaje reforzado a partir de comentarios de IA. Sin embargo, a diferencia de Meta, esas empresas tienden a no lanzar sus modelos para uso público.

Otras herramientas de inteligencia artificial lanzadas por Meta el viernes incluyeron una actualización del modelo Segment Anything de identificación de imágenes de la compañía, una herramienta que acelera los tiempos de generación de respuestas de LLM y conjuntos de datos que pueden usarse para ayudar en el descubrimiento de nuevos materiales inorgánicos.



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here