El modelo de inteligencia artificial Qwen de Alibaba desafía el dominio de EE.UU. a pesar de las restricciones de los chips

Hasta ahora, el auge de la IA ha estado dominado por empresas estadounidenses como OpenAI, Google y Meta. Sin embargo, en los últimos meses, un nuevo nombre ha aparecido en las listas de evaluación comparativa: AlibabaiAlibabaAlibaba, fundada en 1999 por el empresario chino Jack Ma, es una de las empresas de comercio electrónico globales más destacadas que opera plataformas como AliExpress, Taobao y Tmall.LEER MÁSEn los últimos meses, las variantes de Qwen han encabezado las clasificaciones de los sitios que miden el rendimiento de un modelo de IA.

“Qwen 72B es el rey y los modelos chinos están dominando”, afirma Clem Delangue, director ejecutivo de Hugging Face escribió en juniodespués de que un modelo basado en Qwen llegara a la cima de su empresa. Clasificación de LLM abierta.

Se trata de un cambio sorprendente para la industria china de la IA, que muchos creían condenada por las restricciones a los semiconductores y las limitaciones en la capacidad de procesamiento. El éxito de Qwen demuestra que China puede competir con los mejores modelos de IA del mundo, lo que plantea serias dudas sobre cuánto tiempo más seguirán dominando el sector las empresas estadounidenses. Y al centrarse en capacidades como el soporte lingüístico, Qwen está abriendo nuevos caminos en lo que puede hacer un modelo de IA y para quién puede desarrollarse.

Esas capacidades han sido una sorpresa para muchos desarrolladores, incluso para aquellos que trabajan en Qwen. El desarrollador de IA David Ng utilizó Qwen para crear el modelo que encabezó la clasificación de Open LLM. También ha creado modelos utilizando la tecnología de Meta y Google, pero dice que la de Alibaba le dio los mejores resultados. “Por alguna razón, funciona mejor en los modelos chinos”, dijo. Resto del mundo“No sé por qué.”

“No podrían hacer esto si no tuvieran un cierto nivel de talento”.

A corto plazo, gran parte del éxito de Qwen se debe a su posición única en el mercado chino. En el lanzamiento, Alibaba afirmó unos 90.000 clientes Utilizaban algunos modelos de la serie Tongyi Qianwen LLM de Alibaba (el nombre “Qwen” proviene de una abreviatura del término, que se traduce aproximadamente como “conocimiento integral”). La mayoría de los clientes son empresas chinas que se mostrarían reacias a formar asociaciones directas con empresas estadounidenses como OpenAI o Anthropic.

Empresas de todo el mundo están intentando integrar la IA en sus productos y servicios, y las empresas chinas no son una excepción. Alibaba reclamos Qwen tiene más de 2,2 millones de usuarios corporativos, pero la mayoría de las colaboraciones públicas aún son experimentales. Un producto con tecnología Qwen creado para la división de dispositivos móviles de Xiaomi permite a los usuarios generar recetas a partir de la foto de un plato. Qwen también es el motor del asistente móvil de Xiaomi, que se ofrece tanto en teléfonos móviles como en sistemas para automóviles.

El desarrollo de Qwen brinda a las empresas chinas más estabilidad. Las empresas de inteligencia artificial estadounidenses tienen cortar el acceso a la API para los usuarios chinos, mientras que muchos sitios de IA son bloqueado por el gobierno centralPero lo más importante es que Qwen no es solo una alternativa disponible: está demostrando ser tan capaz como lo que está disponible en los EE. UU. Cuando lanzó la versión más reciente de Qwen, Alibaba compartió los resultados de referencia. Acercándose a los modelos emblemáticos de OpenAI y Anthropic.

Los ingenieros también pueden acceder al modelo fundacional de Alibaba desde casi cualquier lugar del planeta. La fluidez de Qwen en los principales idiomas que se encuentran fuera de la mayoría de los datos de entrenamiento de IA del mundo, incluidos los idiomas de bajos recursos como el birmano, el bengalí y el urdu, le da una ventaja. En comparación, el modelo de IA de código abierto de Meta, Llama, casos de uso previstos cubrir solo ingles

Algunos en la industria lo ven como una extensión del principio general de Alibaba de construir para todo el mundo, en lugar de priorizar a China. “Creo que la estrategia de Qwen ejemplifica la misión inicial de Alibaba de 'hacer que sea fácil hacer negocios en cualquier lugar'”, dijo Tiezhen Wang, ingeniero de Hugging Face. Resto del mundoafirmando que el modelo “tiene el potencial de revolucionar la comunicación empresarial global al trascender las fronteras lingüísticas e incluso culturales”.

Dylan Patel, de la empresa independiente de investigación y análisis SemiAnalysis, dijo: Resto del mundo que si bien Qwen no es tan bueno como GPT-4, se le acerca lo suficiente como para que se sorprenda. “Hacen afirmaciones, pero, por lo que he visto y usado, no es así”, dijo. Pero Patel dice que el modelo de Alibaba a menudo supera a sus rivales en áreas como las matemáticas formales y las operaciones multilingües.

El desempeño de Qwen es notable dadas las importantes barreras comerciales de Washington destinadas a frenar el desarrollo de la IA china. Desde 2022, Estados Unidos ha bloqueado las exportaciones de los chips más avanzados de Nvidia, los mismos chips que impulsan la última generación de modelos de IA. Gran parte del equipo necesario para fabricar chips avanzados en el país también tiene prohibida la exportación a China, por lo que las empresas tecnológicas nacionales como Huawei han tenido dificultades para llenar el vacío. A medida que las empresas de IA se apresuran a crear modelos cada vez más complejos, necesitan cantidades cada vez mayores de potencia de procesamiento, y el embargo de chips significa que las empresas chinas corren un riesgo real de quedarse sin esa potencia de procesamiento.

Pero aunque el embargo de chips sigue siendo un factor, los analistas ven el reciente éxito de la IA china como evidencia de que no ha hundido por completo la industria. “Estos comités de liderazgo de LLM, como mínimo, demuestran lo sofisticado que es el ecosistema en China”, dijo Karman Lucero, miembro del Centro Paul Tsai China de la Facultad de Derecho de Yale. Resto del mundo“No podrían hacerlo si no tuvieran un cierto nivel de talento, si no tuvieran acceso al menos a un cierto nivel de tecnología y si no tuvieran un cierto umbral de sofisticación para soportarlo”.

Fuente