CITIC Securities: Enfocarse en la línea principal de inflación de la cadena de potencia de cálculo, optimista sobre el GTC de Nvidia para fortalecer la confianza en el crecimiento sostenido de la industria de IA

robot
Generación de resúmenes en curso

CITIC Securities publicó un informe de investigación que indica que la conferencia GTC 2026 de NVIDIA está próxima, y se espera que la gama de productos de chips de la compañía se amplíe aún más. Además de las seis piezas clave en la plataforma Vera Rubin AI, es posible que se revelen más detalles sobre el chip Rubin Ultra y los gabinetes en la conferencia, lo que podría traer innovaciones en arquitectura de diseño como interconexión de datos y suministro de energía. La introducción de nuevos productos como placas orthogonal y CPO también tiene una alta probabilidad de concretarse. Enfocándose en la inflación de la cadena de potencia computacional, en un contexto donde la demanda global de capacidad de cálculo continúa superando las expectativas, la prosperidad y los aumentos de precios en las etapas upstream probablemente persistirán, consolidándose como la línea principal de crecimiento con mayor certeza en el sector tecnológico actual. La firma confía en que la GTC 2026 reforzará la confianza del mercado en el crecimiento sostenido de la industria de IA y en la realización de su lógica de incremento.

Puntos principales de CITIC Securities:

Punto 1: La plataforma Rubin introduce una nueva combinación de chips, demostrando un diseño de colaboración extrema.

En la CES 2026, NVIDIA presentó la plataforma Vera Rubin AI con un conjunto completo de seis chips principales: Rubin GPU, Vera CPU, BlueField-4 DPU, NVLink 6 Switch, ConnectX-9 SuperNIC y Spectrum-6 Ethernet Switch, que incluyen todos los componentes principales dentro del gabinete. Todos los chips han sido actualizados a la tecnología de proceso de 3nm de TSMC y equipados con HBM4, con una capacidad y ancho de banda de memoria completamente mejorados. Esta generación de productos permite una mayor sinergia entre GPU y CPU, así como entre chips de interconexión, y su diseño modular hace que la integridad del gabinete sea más sólida en comparación con la generación anterior, Blackwell.

Punto 2: Se espera que se revelen más detalles sobre Rubin Ultra, anticipando innovaciones en arquitectura de interconexión de datos y suministro de energía.

Dado que en CES 2026 NVIDIA confirmó que la plataforma Vera Rubin ya está en producción en serie, la firma cree que en GTC 2026 NVIDIA podría revelar más detalles sobre los chips Rubin Ultra y los gabinetes. Además de que Rubin Ultra, mediante la integración de cuatro núcleos de cálculo (DIE), duplica el rendimiento en comparación con Rubin, hay dos áreas clave en su arquitectura que merecen atención:

  1. Interconexión de datos: se espera una expansión significativa en escala, con posibles mejoras en la placa de interconexión de cobre (backplane) a una arquitectura de red superpuesta de doble capa que combine PCB orthogonal (interconexión interna de los canisters) y interconexión óptica (entre canisters). Nuevos procesos y materiales como 78L RPCB, M9 CCL, Q glass, CPO podrían implementarse.

  2. Sistema de suministro de energía: la alimentación y el consumo energético se están convirtiendo en limitantes para la expansión de la capacidad de cálculo. Se anticipan soluciones como sistemas de alimentación de corriente continua de alta tensión (HVDC) de 800V y alimentación modular, con posibles mejoras en procesos como PCB embebido y semiconductores de tercera generación GaN.

Punto 3: NVIDIA podría lanzar un nuevo chip de inferencia, el LPU, para fortalecer su línea de productos de inferencia.

Se espera que NVIDIA eleve la inferencia de IA a infraestructura de nivel de sistema, con una separación PD entre LPU y CPX para fortalecer la línea de productos de inferencia.

En cuanto a LPU: en GTC, se prevé que NVIDIA presente un nuevo chip de inferencia que integre tecnología Groq LPU, diseñado específicamente para inferencia de modelos de lenguaje grande (LLM). Este chip probablemente utilice una arquitectura personalizada basada en Tensor Streaming Processor (TSP) rediseñado y SRAM en el chip, lo que aumentaría significativamente la velocidad de almacenamiento y recuperación de datos, siendo muy adecuado para las altas demandas de ancho de banda de memoria en la etapa de decodificación.

En cuanto a CPX: el Rubin CPX lanzado en 2025 puede reducir costos en la fase de prellenado (Prefill) y podría usar GDDR7 o HBM3E como memoria principal. Según SemiAnalysis, el CPX podría cambiar de su forma original integrada en la bandeja de computación Rubin a una configuración en gabinete independiente que se entregue junto con NVL72 VR200. Además, la cadena de suministro indica que LPU también podría lanzarse en gabinetes independientes de 256 tarjetas LPX.

Punto 4: Se anticipa una actualización de la próxima generación de arquitectura Feynman.

La tendencia en el diseño de la próxima generación de arquitectura Feynman de NVIDIA está ganando atención en la industria, y es posible que NVIDIA la muestre en GTC 2026. Según Trendforce, Feynman será probablemente uno de los primeros chips en usar el proceso A16 de TSMC, con posibles mejoras en la alimentación mediante tecnología SPR (Backside Power Delivery), liberando espacio para el enrutamiento, y la incorporación de tecnología de apilamiento 3D para integrar el hardware LPU de Groq.

Se estima que su producción podría comenzar en 2028, con entregas a partir de 2029. Aunque los detalles específicos de Feynman aún no están claros, la firma considera que la comprensión de NVIDIA sobre la futura dirección de actualización de la infraestructura de cálculo de IA será crucial. En un contexto de desaceleración de la Ley de Moore, cómo innovar en capacidad de cálculo, memoria y potencia operativa para sostener la iteración continua de la industria de IA, y cómo evolucionarán los roles y la importancia del entrenamiento y la inferencia, así como la visibilidad del retorno de inversión en IA, serán temas que NVIDIA podría explorar en GTC, brindando inspiración y sorpresas al sector.

Factores de riesgo:

Riesgos geopolíticos, menor volumen de nuevos productos de líderes en capacidad de cálculo en el extranjero, menor crecimiento en demanda del mercado de IA, aumento sostenido en precios de componentes como almacenamiento, riesgos de cambios tecnológicos y de iteración de productos, riesgos regulatorios y de privacidad de datos, y mayor competencia en la industria de PCB.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado