A OpenAI e a Broadcom apresentaram o Jalapeño a 24 de junho de 2026, um chip acelerador de IA concebido à medida especificamente para inferência de modelos de linguagem de grande escala. O chip representa o primeiro Processador de Inteligência da OpenAI e o primeiro componente de uma plataforma de computação multigeracional planeada, desenvolvida em conjunto pelas duas empresas, com o objetivo declarado de melhorar a velocidade, a eficiência e a acessibilidade de sistemas de IA avançados. Este marco reflete uma orientação estratégica mais ampla na qual a OpenAI trabalha cada vez mais para obter controlo sobre toda a pilha de infraestrutura que sustenta os seus modelos e aplicações, em vez de depender exclusivamente de plataformas de computação externas.
O Jalapeño foi concebido de raiz com base em investigação interna sobre os requisitos da inferência moderna de LLMs. A sua arquitetura reflete conhecimentos derivados do roteiro de desenvolvimento de modelos da OpenAI, incluindo considerações sobre otimização de kernels, gestão de memória, redes e sistemas de serviço. O chip foi desenvolvido em parceria com a Broadcom e a Celestia, que contribuíram com processos de fabrico, integração de placas e bastidores, sistemas de rede e infraestrutura de implementação em grande escala. De acordo com as empresas, o design pretende manter-se flexível para diferentes modelos de linguagem de grande escala, não se limitando a uma única arquitetura ou linha de produtos.
Amostras de engenharia iniciais já estão a executar cargas de trabalho de aprendizagem automática em ambientes laboratoriais à frequência operacional e níveis de potência alvo, incluindo cargas de trabalho associadas a modelos avançados como o GPT-5.3-Codex-Spark. Avaliações internas iniciais sugerem que o Jalapeño pode obter um desempenho por watt melhorado em comparação com os principais aceleradores de IA existentes. A arquitetura diz-se que enfatiza a redução do movimento de dados e uma distribuição mais equilibrada dos recursos de computação, memória e rede, visando aproximar a utilização real dos limites teóricos do hardware. As tecnologias de silício da Broadcom, incluindo os seus componentes de rede Tomahawk, são posicionadas como facilitadores chave da implementação em grande escala.
O chip foi desenvolvido em parceria com a Broadcom e a Celestia. A Broadcom contribuiu com tecnologias de silício e componentes de rede, incluindo sistemas de rede Tomahawk. A Celestia contribuiu com processos de fabrico, integração de placas e bastidores, sistemas de rede e infraestrutura de implementação em grande escala. O design é informado por sistemas de produção utilizados em produtos como o ChatGPT, Codex e serviços baseados em API, bem como pelos requisitos previstos para futuras aplicações baseadas em agentes.
A empresa enquadrou o desenvolvimento como parte de uma mudança mais ampla para um modelo económico orientado pela computação. Neste contexto, o chip é apresentado como um esforço para aumentar a disponibilidade de recursos computacionais, reduzir custos operacionais e melhorar a capacidade de resposta dos sistemas de IA em aplicações de consumo e empresariais. A estratégia subjacente envolve uma integração mais estreita entre o desenvolvimento de modelos, a conceção de hardware e a implementação de infraestrutura, permitindo a otimização em todo o sistema, em vez de em componentes isolados.
A abordagem de engenharia por detrás do Jalapeño é altamente especializada para inferência de LLMs, em vez de cargas de trabalho de computação generalizadas. É informada por sistemas de produção utilizados em produtos como o ChatGPT, Codex e serviços baseados em API, bem como pelos requisitos previstos para futuras aplicações baseadas em agentes. O objetivo do design é combinar alta capacidade de processamento com latência reduzida, permitindo um desempenho mais responsivo para casos de uso interativos de IA à escala.
Um aspeto chave do programa é o co-design de sistemas de software e hardware, onde os modelos e a infraestrutura evoluem em conjunto. Isto inclui arquitetura de chip, sistemas de memória, camadas de rede, mecanismos de escalonamento e estruturas de implementação. Ao alinhar estes componentes, o sistema pretende melhorar a eficiência e reduzir o custo por unidade de inteligência fornecida.
A estratégia de plataforma mais ampla posiciona o Jalapeño como o primeiro passo de um roteiro de infraestrutura a longo prazo, cuja implementação faseada está prevista para começar em 2026, incorporando contribuições da Broadcom em silício e redes e da Celestia em integração de sistemas.
O que anunciaram a OpenAI e a Broadcom a 24 de junho de 2026?
A OpenAI e a Broadcom anunciaram o Jalapeño, um chip acelerador de IA concebido à medida especificamente para inferência de modelos de linguagem de grande escala. O chip representa o primeiro Processador de Inteligência da OpenAI e o primeiro componente de uma plataforma de computação multigeracional planeada, desenvolvida em conjunto pelas duas empresas.
Que cargas de trabalho estão as amostras de engenharia iniciais do Jalapeño a executar?
Amostras de engenharia iniciais já estão a executar cargas de trabalho de aprendizagem automática em ambientes laboratoriais à frequência operacional e níveis de potência alvo, incluindo cargas de trabalho associadas a modelos avançados como o GPT-5.3-Codex-Spark.
Quando está previsto o início da implementação faseada do Jalapeño?
A estratégia de plataforma mais ampla posiciona o Jalapeño como o primeiro passo de um roteiro de infraestrutura a longo prazo, cuja implementação faseada está prevista para começar em 2026.
Notícias relacionadas
OpenAI lança o seu primeiro chip de IA, Jalapeño, com desempenho comparável ao NVIDIA Blackwell
OpenAI e Broadcom Apresentam Jalapeño, Primeiro Chip de IA Personalizado para Inferência de LLM
Qualcomm apresenta CPU Dragonfly C1000 para data center, Meta primeiro cliente
OpenAI e Broadcom Revelam Chip de IA Personalizado Jalapeño para Inferência
O modelo GLM-5.2 da z.AI ganha atenção nos EUA com alto desempenho a baixo custo