Ya sabíamos mucho sobre AMDEl acelerador de próxima generación, el Instinct MI325X, de un evento anterior en junio de 2024, pero la compañía ahora ha revelado más en su evento AMD Advancing AI.
Primero, sabíamos que el Instinct MI325X era una actualización menor del MI300X, con la misma arquitectura CDNA 3, pero con el suficiente empuje para convertirlo en una alternativa viable al H200. NVIDIALa potencia de la IA.
Los lectores con ojos de águila también notarán que AMD ha reducido la capacidad de memoria integrada HBM3e de 288 GB a 256 GB, con una capacidad de memoria ahora sólo un 80% mayor que la del buque insignia de Nvidia en lugar de la más envidiable mejora del doble.
Preparando el terreno para el MI355X
Para hacer las cosas un poco más turbias, AMD también mencionó otro SKU, el MI325X OAM que tendrá, esperen, 288 GB de memoria; hemos pedido una aclaración y actualizaremos este artículo a su debido tiempo.
AMD proporcionó algunas comparaciones de rendimiento cuidadosamente seleccionadas con la H200 de Nvidia:
- 1,3 veces el rendimiento de inferencia en Mistral 7B en FP16
- 1,2 veces el rendimiento de inferencia en Llama 3.1 70B en FP8
- 1,4 veces el rendimiento de inferencia en Mixtral 8x7B en FP16
La compañía también reveló que el acelerador tiene 153 mil millones de transistores, lo mismo que el MI300X. El H200 tiene sólo 80 mil millones de transistores, mientras que las GPU Blackwell encabezarán la escala con más de 200 mil millones de transistores.
Sin embargo, la estrella del espectáculo tenía que ser el acelerador MI355X, que también se anunció en el evento con una fecha de lanzamiento para el segundo semestre de 2025. Fabricado en el nodo de 3 nm de TSMC y con la nueva arquitectura CDNA 4 de AMD, introduce los formatos FP6 y FP4 y se espera que ofrezca mejoras del 80% en FP16 y FP8, en comparación con el acelerador MI325X actual.
Por otra parte, el Instinct MI355X ofrecerá 288 GB HBM3E y un ancho de banda de memoria de 8 TB/s, una mejora del 12,5% y del 33,3% con respecto a su predecesor inmediato. Una plataforma OXM de 8 unidades, que también se lanzará en el segundo semestre de 2025, ofrecerá la asombrosa cifra de 18,5 petaflops en FP16, 37PF en FP8, 74PF en FP6 y FP4 (o 9,3PF por OXM).
El MI355x competirá contra el de Nvidia Blackwell B100 y B200 cuando se lance en 2025, y será fundamental en el intento de Lisa Su de potenciar las aspiraciones de AMD de alcanzar a su rival.
Nvidia sigue firmemente a la cabeza, con más del 90% del mercado mundial de aceleradores de IA, lo que la convierte en la empresa más valiosa del mundo en el momento de escribir este artículo, con el precio de sus acciones en su máximo histórico y una capitalización de mercado de 3,3 billones de dólares.
AMD también presentó su nueva familia de CPU de la serie EPYC 9005 con un modelo de 192 núcleos eso cuesta casi $ 15,000.