Geekbench lanza una aplicación de evaluación comparativa de IA

Los incondicionales del benchmarking Laboratorios de primates El jueves se lanzó Geekbench AI 1.0. La aplicación, que actualmente está disponible para Android, Linux, MacOS y Windows, aplica los principios de Geekbench al aprendizaje automático, el aprendizaje profundo y otras cargas de trabajo de IA, en un intento de estandarizar las calificaciones de rendimiento en todas las plataformas. Es el sucesor de Geekbench ML (aprendizaje automático), que se anunció en 2021 y actualmente se encuentra en la versión 0.6.

“En los últimos años, las empresas se han unido para utilizar el término 'IA' en este tipo de cargas de trabajo (y en su marketing relacionado)”, afirma Primate Labs sobre el cambio de nombre. “Para garantizar que todos, desde los ingenieros hasta los entusiastas del rendimiento, comprendan lo que hace este parámetro de referencia y cómo funciona, sentimos que era hora de una actualización”.

A principios de esta semana, el creador de ChatGPT, OpenAI anunció una nueva versión de su propio modelo de referencia de IA. SWE-bench Verified es una oferta “validada por humanos” que utiliza la validación humana para determinar la eficacia de los modelos para resolver “problemas del mundo real”.

Fuente