A medida que la industria de la inteligencia artificial desplaza su enfoque del entrenamiento de modelos hacia la inferencia a gran escala, la estructura de costes de los recursos informáticos está experimentando una transformación fundamental. En junio de 2026, Intel presentó en Computex 2026 su nuevo acelerador de inferencia de IA para centros de datos, "Crescent Island". Basado en la arquitectura Xe3P y equipado con memoria LPDDR5X, esta solución representa un giro estratégico claro para el gigante tradicional de los chips en el ámbito de la infraestructura de IA. En lugar de desafiar directamente el dominio de Nvidia en el mercado de entrenamiento, Intel apunta al segmento de inferencia con un posicionamiento diferenciado: "bajo coste, rendimiento suficiente".
Desglose de la arquitectura del producto: el fundamento técnico de Xe3P y LPDDR5X
La característica más distintiva de Crescent Island reside en su arquitectura de memoria. A diferencia de la mayoría de los aceleradores de entrenamiento de IA actuales, que dependen de memorias de alto ancho de banda, Intel ha optado por LPDDR5X, una tecnología de memoria madura y de bajo consumo ampliamente utilizada en dispositivos móviles y electrónica de consumo masivo.
En cuanto a especificaciones, el diseño de referencia incluye 160 GB de memoria LPDDR5X, ampliables hasta 480 GB mediante acuerdos con ODM. El consumo energético de la tarjeta es de 350 W, utiliza refrigeración por aire y es compatible con toda la gama de tipos de datos, desde FP4/MXFP4 nativos hasta FP64. Según los cálculos de TechTimes, basados en una interfaz de memoria de 640 bits y LPDDR5X a 10,7 Gbps, el ancho de banda de memoria es de aproximadamente 684 GB/s, frente a los cerca de 4,8 TB/s de la Nvidia H200 con HBM3e. Esta diferencia de ancho de banda es significativa para cargas de trabajo de entrenamiento, pero en tareas de inferencia a gran escala y alta concurrencia con grandes modelos de lenguaje, el beneficio marginal del ancho de banda es menor que el valor marginal de la eficiencia energética y el coste. Intel subraya que este chip está "diseñado para Agentic AI", siendo la métrica clave "Token/Watt": maximizar las peticiones de inferencia procesadas por unidad de energía.
En cuanto a la compatibilidad de despliegue, el perfil de bajo consumo de LPDDR5X permite la solución de 350 W refrigerada por aire. Esto significa que Crescent Island no requiere infraestructuras especializadas de refrigeración líquida y puede integrarse directamente en racks estándar y entornos de centros de datos existentes, reduciendo los costes de adaptación tras la compra.
Contexto de mercado: expansión y diferenciación estructural en el mercado de inferencia de IA
Para comprender el posicionamiento estratégico de Crescent Island, es esencial calibrar primero la escala y la lógica de crecimiento del mercado actual de inferencia de IA.
Existen múltiples formas de definir el mercado de inferencia de IA, por lo que las distinciones son importantes. En una definición restringida—mercado de chips de inferencia de IA (solo hardware IC, excluyendo software y servicios auxiliares)—se prevé que crezca desde unos 17 730 millones de dólares en 2025 hasta 20 510 millones en 2026, con una tasa de crecimiento anual compuesta (CAGR) de aproximadamente el 15,6 %. En una definición más amplia—mercado de inferencia de IA (incluyendo hardware, software y servicios de plataforma)—el valor fue de unos 103 730 millones de dólares en 2025 y se espera que alcance los 117 800 millones en 2026, con una CAGR cercana al 12,98 %. Esta última refleja la escala global de la inversión en infraestructura y es el terreno donde compiten los proveedores de centros de datos (CPU, GPU, redes, memoria, software).
Estructuralmente, las cargas de trabajo de inferencia están aumentando rápidamente su peso dentro del cómputo total de IA. Expertos de la plataforma Nebius señalaron recientemente que la inferencia representa ya entre el 90 % y el 95 % de la demanda empresarial de IA. Cada vez más empresas dependen de modelos preentrenados o servicios API en lugar de entrenar modelos fundacionales desde cero. Como resultado, la propuesta de valor de la infraestructura de IA está pasando de "maximizar el rendimiento de entrenamiento" a "optimizar los costes de inferencia". El crecimiento más rápido de las cargas de inferencia frente al entrenamiento es la base lógica para la entrada de Crescent Island en el mercado.
La posición de Nvidia en el entrenamiento de IA sigue siendo incontestable. Los análisis del sector muestran que la cuota de mercado global de Nvidia en aceleradores de IA (entrenamiento e inferencia combinados) supera el 70 %, y en entrenamiento de alto nivel roza el monopolio con un 98 %. Sin embargo, esta estructura conlleva riesgos: a medida que la inferencia se convierte en la corriente principal, la "prima de monopolio" del entrenamiento—actualmente la parte más lucrativa de los ingresos de Nvidia—se verá diluida y sustituida por un mercado de inferencia más grande pero de menor margen. Crescent Island busca capitalizar esta transición.
Análisis competitivo: las estructuras de costes divergentes de Intel y Nvidia
La competencia entre Crescent Island y los productos de Nvidia es, en esencia, un enfrentamiento directo entre dos curvas de costes fundamentalmente diferentes para la misma tarea.
En cuanto a la lista de materiales (BOM), datos de desmontaje de Silicon Analysts muestran que el coste total de fabricación de la Nvidia H100 ronda los 3 320 dólares (oblea lógica ~300, HBM3 ~1 350, encapsulado CoWoS-S ~750, pruebas/ensamblaje ~920). La H200, con una capacidad de HBM aumentada a 141 GB, eleva el coste de fabricación a unos 4 800 dólares. La B200 utiliza un diseño de doble chip, lo que reduce el coste de la oblea lógica pero incrementa el de memoria y encapsulado, alcanzando un total de unos 6 400 dólares. La proporción de HBM en el total de la BOM ha pasado del 14 % en la A100 al 43 % en la H200, convirtiéndose en la principal variable de coste.
En el lado del alquiler, el precio bajo demanda de la H100 es de unos 2,95 $/hora, la H200 ronda los 3,50 $/hora y la B200 oscila entre 4,90 y 6,50 $/hora. Con contratos de 1-2 años y una compra mínima de 10 000 unidades, los precios bajan notablemente: H100 a ~1,50 $/hora, H200 a ~2,20 $/hora y B200 a ~3,50 $/hora. Es relevante destacar que los precios de alquiler de la H200 subieron tras mayo de 2026—la plataforma Nebius incrementó la H200 de 1,45 a 2,45 $/hora desde el 1 de junio de 2026—, lo que eleva aún más los costes operativos de inferencia.
El precio de Crescent Island aún no se ha anunciado, pero el coste por capacidad de LPDDR5X es significativamente inferior al de HBM, el perfil de 350 W reduce los gastos eléctricos y de refrigeración, y la refrigeración por aire simplifica la infraestructura del centro de datos. Esto crea un espacio teórico para que el coste total de propiedad de Crescent Island sea muy inferior al de productos comparables de Nvidia. El responsable del Data Center Group de Intel, Kevork Kechichian, declaró al Financial Times que Crescent Island evitará el bastión de Nvidia en entrenamiento, centrándose en tareas de inferencia que gestionan peticiones de usuarios, con el objetivo principal de reducir los costes de hardware y refrigeración para los clientes de IA.
En cuanto a la entrega, Intel prevé proporcionar muestras a clientes en la segunda mitad de 2026 y comenzar envíos limitados antes de fin de año. Es probable que la validación de despliegues a gran escala se complete a principios de 2027.
Perspectiva estratégica: brechas de oferta y demanda en inferencia y posicionamiento de Intel
La contradicción estructural del mercado de inferencia actual es que las GPU diseñadas para entrenamiento ofrecen un exceso de ancho de banda y capacidad de cómputo, que a menudo permanece infrautilizado en escenarios de inferencia. Las empresas que adquieren GPU de gama alta para demandas máximas de inferencia se enfrentan a un despilfarro persistente de capital "sobredimensionado" durante la operación normal. Crescent Island se sitúa en esta intersección: ofrece "inferencias suficientes" en lugar de "entrenamiento excesivo", logrando así menores costes iniciales y operativos.
Este planteamiento es lógicamente similar al de nuevos proveedores centrados en inferencia, como Groq. Sin embargo, Intel cuenta con capacidades de integración más completas a nivel de sistema. En Computex 2026, Intel también presentó soluciones de infraestructura de IA a escala de rack, construyendo arquitecturas heterogéneas de inferencia con procesadores Xeon 6+ y la RDU (Reconfigurable Dataflow Unit) de SambaNova, cubriendo toda la cadena de cómputo desde el chip hasta el rack. La lógica competitiva subyacente es que, a medida que los cuellos de botella en las cargas de trabajo de IA pasan del cómputo puro al movimiento de datos, la orquestación de tareas y la coordinación del sistema, el valor de las CPU como plano de control generalista se amplifica, un área donde Intel cuenta con una gran experiencia en infraestructura.
En el plano del ecosistema de software, CUDA de Nvidia ha construido una lealtad excepcional entre los desarrolladores durante más de 20 años, con más de 5 millones de desarrolladores creando aplicaciones de IA y más del 90 % de las tareas de entrenamiento de IA ejecutándose sobre CUDA. El marco unificado de programación oneAPI de Intel, en su versión 2026.0, ha fusionado el Base Toolkit y el HPC Toolkit en un solo paquete, ofreciendo un modelo de programación unificado para CPUs, GPUs, FPGAs y aceleradores, optimizado para los últimos Xeon y Arc tanto en entrenamiento como en inferencia. Sin embargo, la migración de CUDA a oneAPI sigue siendo costosa: las herramientas automáticas actuales de conversión de CUDA a DPC++ pueden transformar entre el 90 % y el 95 % del código, pero el resto requiere reescritura y ajuste manual. Este coste de fricción impactará significativamente en la velocidad y amplitud de la adopción de Crescent Island en escenarios de inferencia.
Riesgos y variables
Entre los principales factores de riesgo a considerar se encuentran:
En primer lugar, no se han divulgado datos de rendimiento. Hasta la presentación en Computex de junio de 2026, Intel no ha proporcionado benchmarks concretos de cómputo para Crescent Island. La brecha entre el rendimiento y las expectativas del mercado será un factor decisivo para su aceptación.
En segundo lugar, volatilidad en la cadena de suministro de HBM. La elección de LPDDR5X por parte de Intel supone implícitamente que la capacidad de HBM seguirá limitada durante años. Se prevé que los precios de HBM3e aumenten entre un 15 % y un 20 % en los próximos trimestres, la capacidad de encapsulado CoWoS sigue siendo insuficiente en un 40 % a 50 % y los plazos de entrega de pedidos se extienden entre 40 y 52 semanas. Si la cadena de suministro de HBM se relaja significativamente entre 2027 y 2028, la prima de los productos HBM se reducirá y la ventaja marginal de coste de LPDDR5X disminuirá.
En tercer lugar, costes de migración del ecosistema. El ecosistema de CUDA es una barrera competitiva que va más allá de la lógica técnica. Para grandes empresas con voluminosos repositorios de código de entrenamiento e inferencia, los costes de migración no son solo técnicos: implican inercia organizativa, reservas de talento y evaluación de riesgos. Esta barrera no técnica a veces resulta más difícil de superar que las propias especificaciones técnicas.
En cuarto lugar, ciclos macro de demanda. El éxito de Crescent Island depende en última instancia de su adopción por parte de los operadores de centros de datos a hiperescala. En junio de 2026, la validación de despliegue con clientes de Intel aún está en fases iniciales. El chip de IA Maia 2 de Microsoft utiliza el proceso 18A de Intel, pero Maia 2 es un ASIC de inferencia personalizado, distinto del posicionamiento de Crescent Island. Google Cloud y AWS mantienen una colaboración profunda con los procesadores Intel Xeon a nivel de CPU, pero no está claro si emplearán Crescent Island para la aceleración de inferencia de IA.
Conclusión: el reto verificable de la inferencia de bajo coste
El fundamento técnico de Crescent Island tiene una base clara para su entrada en el mercado: las cargas de trabajo de inferencia crecen rápidamente, la oferta de HBM sigue siendo limitada y el coste marginal de expansión de los centros de datos no deja de aumentar. Sin embargo, una buena dirección no garantiza resultados.
El mercado no necesita un caso teórico sobre "por qué Crescent Island podría tener éxito", sino datos verificables: métricas publicadas de cómputo TOPS o TFLOPS, valores concretos de Token/Watt y feedback real de despliegues de clientes de Intel. La entrega y validación de estos datos se materializarán a medida que lleguen las muestras en la segunda mitad de 2026 y comiencen los despliegues reales en 2027.
Para el mercado de inferencia de IA, la relevancia de Crescent Island quizá no resida en cambiar inmediatamente la cuota de mercado de Nvidia, sino en ofrecer una alternativa clara: a medida que la inferencia se consolida como el principal escenario de la infraestructura de IA, "suficiente y asequible" podría convertirse en una opción empresarial viable junto a "la más potente y la más cara". Si esta hipótesis se cumple, será el propio mercado quien lo determine en los próximos 12 a 18 meses.




