Intel se une a NVIDIA para lanzar la plataforma de rack híbrido

kyojuro domingo, 19 de octubre de 2025

Intel ha presentado recientemente una innovadora iniciativa en la Cumbre Global OCP 2025, revelando una solución de servidor híbrido a nivel de rack que integra su chip Gaudi 3 AI con las GPU de arquitectura Blackwell de NVIDIA. Este desarrollo representa un cambio importante en la estrategia de hardware de IA de Intel, pasando de un enfoque competitivo solitario a una presencia de mercado más colaborativa e integrada.

El sistema recién introducido, conocido como Gaudi 3 Rack Scale Solution, tiene un diseño montado en rack con múltiples bandejas de computación y conmutación. Cada bandeja está equipada con dos procesadores Xeon, cuatro aceleradores Gaudi 3, cuatro tarjetas de red NVIDIA ConnectX-7 400GbE y una DPU BlueField-3. Dentro del rack, 16 bandejas de computación están completamente interconectadas, proporcionando hasta 51,2 Tb/s de capacidad de red a través de switches Broadcom Tomahawk 5. La arquitectura se destaca por su alto ancho de banda, baja latencia y escalabilidad horizontal centrada en Ethernet, ofreciendo una infraestructura robusta ideal para operaciones de inferencia de IA.

En particular, este sistema no se limita solamente al ecosistema de Intel; se integra perfectamente con las GPU Blackwell B200 de NVIDIA. Utilizando una estrategia de 'inferencia descompuesta' para ejecutar modelos de IA, Blackwell maneja la etapa de 'preentrenamiento', computacionalmente intensiva, mientras que Gaudi 3 se ocupa de la fase de 'decodificación', que, aunque menos exigente computacionalmente, es sensible a la latencia. Esta división del trabajo permite que ambas arquitecturas aprovechen sus fortalezas: las capacidades de computación de matrices excepcionales de Blackwell se maximizan, y Gaudi 3 gestiona eficazmente solicitudes de inferencia altamente concurrentes, gracias a su ancho de banda de memoria superior y características de comunicación Ethernet. Según SemiAnalysis, el rendimiento combinado de estos racks compactos de alta densidad es aproximadamente 1,7 veces mayor que las configuraciones utilizando solo GPU B200.

Estratégicamente, en un mercado ya dominado por NVIDIA en la computación de IA, la plataforma de Gaudi en solitario tiene un margen competitivo limitado. Al integrarse a nivel de rack con la plataforma Blackwell, Intel aprovecha el ecosistema de software altamente desarrollado de NVIDIA, incluidas las tecnologías CUDA y NVLink, ampliando así la aplicabilidad de sus soluciones de hardware. Esta asociación estratégica, aunque discreta, subraya el enfoque pragmático de Intel, que optimiza las arquitecturas de red abiertas y las conexiones Ethernet para fortalecer su posición en el ecosistema de IA.

Sin embargo, persisten desafíos. La pila de software y las herramientas de desarrollo de la plataforma Gaudi todavía no rivalizan con la madurez de CUDA, lo que requiere esfuerzos de ingeniería significativos para su aplicación en el mundo real. Además, Gaudi 3, construido sobre un proceso de 5 nm, está destinado a ser un producto de transición con la hoja de ruta de Intel indicando un cambio a una nueva arquitectura el próximo año. Los analistas sugieren que esta solución de rack híbrido podría servir principalmente como una 'estrategia de escaparate', diseñada para demostrar la capacidad de Intel para ofrecer soluciones adaptables a nivel de sistema dentro del campo de servidores de IA, no solo para competir a nivel de chips.

NVIDIA está preparada para obtener beneficios significativos de esta colaboración, ya que el diseño de Gaudi 3 Rack Scale integra numerosos componentes de redes y comunicaciones de NVIDIA, como la serie ConnectX NIC y las DPU BlueField, consolidando aún más el dominio de NVIDIA en redes de alto ancho de banda y tecnologías de clúster heterogéneo. Para Intel, se espera que esta sinergia impulse el envío de productos Gaudi y demuestre la interoperabilidad de Xeon con aceleradores de IA en implementaciones de múltiples nodos.

A medida que el sector del hardware de IA evoluciona rápidamente, este modelo de 'colaboración entre campos' podría anunciar una nueva tendencia. En lugar de estar dominados por una sola entidad, los futuros centros de datos pueden contar con un clúster de computación altamente eficiente compuesto por arquitecturas diversificadas. Para Intel, la Gaudi 3 Rack Scale no es meramente un experimento de producto, sino un movimiento estratégico para reposicionarse dentro del panorama de infraestructura de IA, pasando de la competencia solitaria a la integración y optimización a nivel de sistema.

Noticias relacionadas

© 2025 - TopCPU.net