Meta criticada por llamar a sus modelos de IA 'de código abierto'

Manténgase informado con actualizaciones gratuitas

Meta ha sido criticada por llamar a sus modelos de inteligencia artificial “de código abierto” por parte del grupo que ha encabezado la tecnología de código abierto en el mundo del software durante los últimos 25 años.

La empresa de redes sociales está “confundiendo” a los usuarios y “contaminando” el término código abierto al usarlo para describir su familia Llama de grandes modelos de lenguaje, dijo Stefano Maffulli, director de la Iniciativa de Código Abierto. El organismo acuñó el término código abierto a finales de la década de 1990 y desde entonces ha sido considerado el guardián del concepto.

En una entrevista con el Financial Times, dijo que esto era “extremadamente dañino” en un momento en que organismos como la Comisión Europea buscaban apoyar verdaderas tecnologías de código abierto que están fuera del control de cualquier empresa en particular.

Llama, que según Meta ha sido descargado más de 400 millones de veces, se ha convertido en el más popular entre una ola de supuestamente Modelos de IA de “código abierto” que han surgido para desafiar a los principales sistemas propietarios, como GPT-4 de OpenAI y Gemini de Google.

Sin embargo, la mayoría de ellos, incluido Llama, no llegan a alcanzar una apertura total, lo que impide el tipo de experimentación y adaptación en IA que el código abierto trajo al mundo del software.

Al crear confusión sobre qué modelos son verdaderamente abiertos, Meta corre el riesgo de obstaculizar el desarrollo a largo plazo de formas de IA dirigidas y controladas por los usuarios en lugar de estar estrictamente controladas por un puñado de empresas de tecnología, según el jefe de OSI.

Maffulli dijo que Google y Microsoft habían abandonado el uso del término código abierto para modelos que no son completamente abiertos, pero que las discusiones con Meta no habían logrado producir un resultado similar.

Meta dijo que estaba “comprometida con la IA de código abierto” y que Llama “ha sido la base de la innovación en IA a nivel mundial”.

Añadió: “Las definiciones de software de código abierto existentes no abarcan las complejidades de los modelos de IA que avanzan rápidamente en la actualidad. Estamos comprometidos a seguir trabajando con la industria en nuevas definiciones para servir a todos de manera segura y responsable dentro de la comunidad de IA”.

Muchos partidarios de las tecnologías de código abierto todavía atribuyen a los modelos Llama más limitados de Meta el haber roto el dominio de un puñado de grandes empresas de IA de EE. UU. y haber abierto el mercado de IA generativa a una mayor competencia.

Los modelos de Meta han sido “un soplo de aire fresco” para los desarrolladores, dijo Dario Gil, jefe de investigación de IBM, brindándoles una alternativa a lo que llamó los modelos de “caja negra” de las principales empresas de IA.

Sin embargo, la transparencia es limitada. Meta permite a los desarrolladores descargar sus modelos Llama de forma gratuita, pero los únicos detalles técnicos que publica son los pesos o “sesgos” que influyen en cómo responde el modelo a indicaciones particulares.

Además, la licencia bajo la cual se lanzó Llama no se ajusta a las definiciones de código abierto reconocidas por la OSI, ya que no permite el uso gratuito de la tecnología por parte de los mayores rivales de Meta.

Otros grupos tecnológicos, como la empresa francesa de inteligencia artificial Mistral, han optado por llamar a modelos como este “peso abierto” en lugar de código abierto.

“Los (modelos) de peso abierto son geniales. . . pero no es suficiente para seguir desarrollando”, afirmó Ali Farhadi, director del Instituto Allen para la IA, que ha lanzado un modelo de IA totalmente de código abierto llamado Olmo.

Los desarrolladores que utilizan modelos como Llama no pueden ver cómo fueron desarrollados ni construir sobre ellos para crear nuevos productos propios, como sucedió con el software de código abierto, añadió.

Para cumplir con la definición de IA de código abierto de la OSI, que se publicará oficialmente la próxima semana, los desarrolladores de modelos deben ser más transparentes. Junto con los pesos de sus modelos, también deberían revelar los algoritmos de entrenamiento y otro software utilizado para desarrollarlos.

OSI también pidió a las empresas de inteligencia artificial que divulguen los datos con los que se entrenaron sus modelos, aunque admitió que la privacidad y otras consideraciones legales a veces lo impiden.

Maffulli dijo que organismos como la Comisión Europea han tratado de otorgar un reconocimiento especial al código abierto en sus regulaciones para fomentar su uso en estándares tecnológicos ampliamente utilizados.

Si empresas como Meta logran convertirlo en un “término genérico” que puedan definir para su propio beneficio, podrán “insertar sus patentes generadoras de ingresos en estándares que la CE y otros organismos están presionando para que sean realmente abiertos”. ”, advirtió.

Fuente