La Olimpiada Internacional de Matemáticas no es sólo una secuencia aterradora de palabras para alguien tan ciego a las matemáticas como yo, sino también un campeonato mundial de matemáticas notoriamente desafiante para estudiantes de secundaria de más de 100 países diferentes. Cada año, los estudiantes compiten para mostrar su destreza matemática en un país anfitrión elegido, cada uno con el objetivo de resolver problemas que harían que el resto de nosotros nos encogiéramos de miedo.
Google DeepMind ha anunciado que dos de sus sistemas de IA, AlphaProof y AlphaGeometry 2, asumieron las preguntas del concurso de este año como un sistema combinado. Las soluciones de la IA fueron calificadas por ganadores anteriores de medallas de oro, el profesor Sir Timothy Gowers y el Dr. Joseph Myers, este último presidente del Comité de Selección de Problemas de la OMI 2024.
La IA no solo obtuvo una puntuación combinada de 28 sobre 42, un punto menos de los 29 necesarios para una medalla de oro, sino que también logró una puntuación perfecta en el problema más difícil de la competencia (a través de Ars-Tecnica). Menos mal, ya que quedaron dos problemas de combinatoria sin resolver. De todos modos, quédate con lo que sabes hacer bien, ¿no?
Sin embargo, hay un pequeño inconveniente. En un hilo de TwitterEl profesor Sir Timothy Gowers señala que, si bien la IA obtuvo una puntuación más alta que la mayoría, necesitó mucho más tiempo que sus competidores humanos para lograrlo. Los candidatos humanos envían sus respuestas en dos sesiones de cuatro horas y media, y si bien la IA resolvió un problema en cuestión de minutos, tardó hasta tres días en resolver los demás.
“Si a los competidores humanos se les hubiera permitido ese tiempo por problema, sin duda habrían obtenido mejores puntuaciones”, escribió Sir Gowers.
“Sin embargo, (i) esto está mucho más allá de lo que los demostradores automáticos de teoremas podían hacer antes, y (ii) es probable que estos tiempos se reduzcan a medida que se logren ganancias en eficiencia”.
Google DeepMind ha producido un programa que, en cierto sentido, ha logrado una medalla de plata en la Olimpiada Internacional de Matemáticas de este año. 🧵https://t.co/DIcsYXUv9725 de julio de 2024
No solo eso, sino que no es como si la IA se hubiera sentado frente a un papel de examen y hubiera comenzado a morder su lápiz. Los problemas se tradujeron manualmente a Inclinarseun asistente de pruebas y lenguaje de programación, por lo que autoformalización de las preguntas fueron realizadas por humanos anticuados.
Aun así, como señala el buen profesor, lo que la IA ha logrado aquí es mucho más complejo y matizado que simplemente resolver los problemas mediante la fuerza bruta:
“Podríamos estar cerca de tener un programa que permitiría a los matemáticos obtener respuestas a una amplia gama de preguntas, siempre que esas preguntas no fueran *demasiado* difíciles: el tipo de cosas que uno puede hacer en un par de horas”.
“¿Estamos cerca del punto en que los matemáticos serán redundantes? Es difícil decirlo. Supongo que todavía nos faltan uno o dos avances para lograrlo”.