Los inversores invierten en nuevas empresas de fotónica para evitar que los centros de datos acaparen energía y acelerar la IA

Oriole Networks, una empresa británica con planes para una infraestructura de red completamente nueva para grupos de supercomputación de IA basada en el uso de luz en lugar de electricidad para transmitir datos, ha recaudado 22 millones de dólares de la firma de capital de riesgo Plural, con sede en Londres.

La fotónica, que es la ciencia de generar, manipular y detectar luz, de repente se ha convertido en un tema candente en la industria tecnológica como una posible solución a dos grandes problemas que enfrentan los centros de datos de IA: sus colosales demandas de electricidad y el tiempo que puede tardar en entrenarse. Modelos de IA en conjuntos de datos masivos. Esta misma semana, otras dos empresas que trabajan en redes fotónicas para chips de IA anunciaron importantes rondas de financiación.

Lightmatter, anunció que había recaudado 400 millones de dólares en un acuerdo de capital de riesgo liderado por Precio de T. Rowe eso valora la empresa de siete años en 4.400 millones de dólares. Y Xscape Photonics anunció que había cerrado una ronda de inversión de 44 millones de dólares liderada por IAG Capital, con la rama de capital de riesgo del fabricante de equipos de red Cisco y NVIDIA entre sus otros inversores.

No se anunciaron cifras de valoración como parte de las recaudaciones de fondos de Xscape ni de Oriole Networks, las cuales fueron rondas de Serie A.

La razón por la que la fotónica está repentinamente de moda tiene que ver con una serie de desafíos que enfrentan las empresas de tecnología cuando buscan construir centros de datos cada vez más grandes llenos de cientos de miles de chips especializados (en la mayoría de los casos, unidades de procesamiento de gráficos (o GPU)) utilizados. para entrenar y ejecutar aplicaciones de IA.

Los equipos de conmutación y redes convencionales, que utilizan principalmente cableado de cobre a través del cual pasa electricidad para transmitir información, se están convirtiendo en un cuello de botella en la rapidez y facilidad con la que se pueden entrenar grandes modelos de IA. En otros casos, se utiliza fibra óptica, pero con sólo unos pocos colores de luz viajando en un solo cable, lo que también limita la cantidad de información que se puede transmitir.

Los modelos de IA basados ​​en redes neuronales deben transportar una gran cantidad de datos continuamente de un lado a otro a través de toda la red. Pero mover todos estos datos entre GPU, incluidas aquellas que pueden estar ubicadas en bastidores de servidores distantes, depende de las rutas de cableado y de la capacidad de los equipos de conmutación para enviar datos comprimidos al lugar correcto.

Según George Zervas, cofundador de Oriole Network y dijo el director de tecnología.

Cuanto más grande sea el modelo de IA y más bastidores de servidores involucrados, más probable será que esta vía de cableado se congestione, de manera similar a cómo los atascos retrasan a los viajeros. Para los modelos de IA más grandes, el 90% de su tiempo de entrenamiento puede consistir en esperar a que los datos estén en tránsito a través del clúster de supercomputación, en lugar del tiempo que realmente les toma a los chips ejecutar los cálculos necesarios.

Los equipos de red convencionales, que utilizan electricidad para transmitir datos, también contribuyen significativamente a los requisitos energéticos de los centros de datos, ya que consumen energía directamente y porque el cableado de cobre disipa el calor, lo que significa que se requiere más energía para enfriar el centro de datos. En algunos centros de datos, el equipo de red por sí solo puede representar el 20% del consumo total de energía de la instalación.

Dependiendo de qué fuente de energía se utilice para alimentar el centro de datos, esta demanda eléctrica puede generar una huella de carbono colosal. Mientras tanto, muchos centros de datos requieren grandes cantidades de agua para ayudar a enfriar los bastidores de chips utilizados para ejecutar aplicaciones de IA.

Las empresas de computación en la nube están anticipando las necesidades de energía de los futuros centros de datos de IA, lo que los está llevando a hacer esfuerzos extremos para asegurar suficiente energía. Google, Amazonasy microsoft Todos han llegado a acuerdos que permitirían dedicar reactores nucleares exclusivamente a alimentar sus centros de datos. Mientras tanto, OpenAI había informado al gobierno de EE. UU. sobre un plan para posiblemente construir múltiples centros de datos que consumirían cada uno cinco gigavatios de energía al año, más de lo que consume actualmente toda la ciudad de Miami.

La fotónica potencialmente resuelve todos estos desafíos. El uso de fibra óptica para transmitir datos en forma de luz en lugar de electricidad hace posible conectar más chips en un grupo de supercomputación directamente entre sí, reduciendo o eliminando la necesidad de cambiar de equipo. La fotónica también utiliza mucha menos electricidad para transmitir datos que la electrónica y las señales fotónicas no producen calor en tránsito.

Diferentes empresas fotónicas tienen diferentes ideas sobre cómo utilizar la tecnología para renovar los centros de datos. Lightmatter está creando un producto llamado Passage que es una superficie conductora de luz en la que se pueden montar múltiples chips de IA, lo que permite la transmisión de datos fotónicos entre cualquiera de los chips en esa superficie de Passage sin la necesidad de conexiones por cable o cableado de cobre. Luego, el cableado de fibra óptica se utilizaría para conectar varios productos Passage en un único bastidor de servidores y para las conexiones entre bastidores. Xscape prevé el uso de equipos fotónicos y cableado que puedan transmitir y detectar cientos de colores diferentes de luz a través de un solo cable, aumentando enormemente la cantidad de datos que podrían fluir a través de la red en cualquier momento.

Pero Oriole Networks puede tener la visión más amplia, utilizando la fotónica para conectar cada chip de IA en un grupo de supercomputación a todos los demás chips del grupo completo. Esto podría dar como resultado tiempos de entrenamiento para los modelos de IA más grandes, como el GPT-4 de OpenAI, que son entre 10 y 100 veces más rápidos, afirmó Oriole Networks. También puede significar que las redes se pueden entrenar usando una fracción menos de energía que la que consumen los clústeres de supercomputación de IA actuales.

Para lograr esto, Oriole imagina no sólo nuevos equipos de comunicación fotónica sino también nuevo software para ayudar a programar la red y un nuevo dispositivo de hardware que pueda actuar como el “cerebro” de toda la red, determinando qué paquetes de información deberán enviarse. entre qué chips y exactamente en qué momento.

“Es completamente radical”, dijo el director ejecutivo de Oriole, James Regan. “No hay ninguna conmutación de paquetes eléctricos en la red”.

Oriole Networks se escindió del University College London en 2023, pero se basa en tecnología en la que sus fundadores, en particular Zervas, fueron pioneros durante las últimas dos décadas. Además de Zervas, que es un veterano investigador en fotónica, UCL PhD. El estudiante Alessandro Ottino y el becario postdoctoral Joshua Benjamin, experto en el diseño de redes de comunicación, cofundaron la empresa. Contrataron como directora ejecutiva a Regan, una emprendedora experimentada que ayudó a crear una empresa de fotónica anterior.

La empresa emplea actualmente a 30 personas. Recaudó una ronda inicial de financiación inicial de 13 millones de dólares en marzo de un grupo de inversores que incluye la rama de capital riesgo de XTX Markets, que opera uno de los grupos de GPU más grandes de Europa. UCL Technology Fund, XTX Ventures, Clean Growth Fund y Dorilton Ventures también participaron tanto en la ronda Seed como en la inversión Serie A más reciente.

Regan dijo que Oriole está utilizando otras empresas para fabricar el equipo fotónico que está diseñando, lo que permitirá a la empresa mantener sus requisitos de capital más bajos de lo que sería de otro modo y le permitirá avanzar más rápido. Dijo que su objetivo es tener equipos iniciales con clientes potenciales para probarlos en 2025.

La compañía ha mantenido conversaciones con la mayoría de los proveedores de servicios en la nube de “hiperescala”, así como con varias empresas de semiconductores que fabrican GPU y chips de inteligencia artificial.

Ian Hogarth, el socio de Plural que dirigió la inversión Serie A, dijo que se sintió atraído por Oriole Networks porque representaba “un cambio de paradigma” en lugar de un enfoque incremental para hacer que los centros de datos de IA sean más eficientes en energía y recursos. Hogarth, que también es presidente del Instituto de Seguridad de la IA del Reino Unido, dijo que estaba impresionado por la “bruta ambición y velocidad que los fundadores (de Oriole) han aportado al problema”.

Dijo que la empresa encaja con otras inversiones que Plural ha realizado en empresas que ayudan a combatir el cambio climático. Finalmente, dijo que sentía que era importante para Europa “tener activos realmente sólidos en lo que respecta a la evolución de la pila informática y no desperdiciar la oportunidad de traducir inventos brillantes de universidades europeas y del Reino Unido en empresas icónicas”.

Por supuesto, ha habido exageraciones sobre la fotónica antes, y no siempre ha dado resultado. Durante el primer auge de Internet a finales de los años 1990 y principios de los 2000, también hubo gran entusiasmo acerca de la posibilidad de que la fotónica se convirtiera en la principal columna vertebral de Internet, incluidos los equipos de conmutación. Los capitalistas de riesgo de entonces también invirtieron dinero en el sector. Pero la mayoría de esas inversiones no dieron resultado debido a la falta de madurez en la industria de la fotónica. Las piezas eran difíciles y costosas de fabricar y tenían tasas de falla más altas que los semiconductores y los equipos de conmutación electrónica más convencionales. Luego, cuando estalló la burbuja de las puntocom, en gran medida se llevó consigo el auge de la fotónica.

Regan dice que las cosas son diferentes hoy. El ecosistema de empresas que fabrican circuitos integrados fotónicos y equipos fotónicos es más sólido que antes y la tecnología mucho más confiable, afirmó. Hace una década, una empresa como Oriole Networks habría tenido que fabricar ella misma gran parte del equipo que quiere producir, una propuesta mucho más arriesgada y que requiere mucho más capital. Hoy en día, existe una cadena de suministro confiable de fabricantes contratados que pueden ejecutar diseños desarrollados por Oriole, afirmó.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here