OpenAI e Broadcom Revelam Chip de IA Jalapeño para Inferência de LLM

2026-06-25 11:03:21

TIA-0,69%

A OpenAI e a Broadcom apresentaram o Jalapeño em 24 de junho de 2026, um chip acelerador de IA projetado sob medida especificamente para inferência de grandes modelos de linguagem. O chip representa o primeiro Processador de Inteligência da OpenAI e o componente inicial de uma plataforma de computação planejada para múltiplas gerações, desenvolvida em conjunto pelas duas empresas, com o objetivo declarado de melhorar a velocidade, eficiência e acessibilidade de sistemas avançados de IA. O marco reflete uma direção estratégica mais ampla na qual a OpenAI está cada vez mais trabalhando para obter controle sobre toda a pilha de infraestrutura que sustenta seus modelos e aplicações, em vez de depender exclusivamente de plataformas de computação externas.

Arquitetura do Jalapeño e Especificações Técnicas

O Jalapeño foi projetado do zero com base em pesquisas internas sobre os requisitos da inferência moderna de LLM. Sua arquitetura reflete insights derivados do roteiro de desenvolvimento de modelos da OpenAI, incluindo considerações sobre otimização de kernels, gerenciamento de memória, rede e sistemas de atendimento. O chip foi desenvolvido em parceria com a Broadcom e a Celestia, que contribuíram com processos de fabricação, integração de placas e racks, sistemas de rede e infraestrutura de implantação em larga escala. De acordo com as empresas, o design pretende ser flexível para diferentes grandes modelos de linguagem, não se limitando a uma única arquitetura ou linha de produtos.

Amostras de engenharia iniciais já estão executando cargas de trabalho de aprendizado de máquina em ambientes laboratoriais na frequência operacional e níveis de potência alvo, incluindo cargas de trabalho associadas a modelos avançados, como o GPT-5.3-Codex-Spark. Avaliações internas iniciais sugerem que o Jalapeño pode atingir desempenho melhorado por watt em comparação com os principais aceleradores de IA existentes. Diz-se que a arquitetura enfatiza a redução do movimento de dados e uma distribuição mais equilibrada dos recursos de computação, memória e rede, visando aproximar a utilização no mundo real dos limites teóricos do hardware. As tecnologias de silício da Broadcom, incluindo seus componentes de rede Tomahawk, são posicionadas como habilitadoras chave para implantação em larga escala.

Papéis da Parceria com Broadcom e Celestia

O chip foi desenvolvido em parceria com a Broadcom e a Celestia. A Broadcom contribuiu com tecnologias de silício e componentes de rede, incluindo os sistemas de rede Tomahawk. A Celestia contribuiu com processos de fabricação, integração de placas e racks, sistemas de rede e infraestrutura de implantação em larga escala. O design é informado por sistemas de produção usados em produtos como ChatGPT, Codex e serviços baseados em API, bem como pelos requisitos previstos para futuras aplicações baseadas em agentes.

Estratégia de Integração de Infraestrutura Full-Stack da OpenAI

A empresa enquadrou o desenvolvimento como parte de uma mudança mais ampla em direção a um modelo econômico orientado pela computação. Nesse contexto, o chip é apresentado como um esforço para aumentar a disponibilidade de recursos computacionais, reduzir custos operacionais e melhorar a capacidade de resposta dos sistemas de IA em aplicações de consumo e empresariais. A estratégia subjacente envolve uma integração mais estreita entre o desenvolvimento de modelos, o design de hardware e a implantação de infraestrutura, permitindo otimização em todo o sistema, em vez de em componentes isolados.

A abordagem de engenharia por trás do Jalapeño é altamente especializada para inferência de LLM, e não para cargas de trabalho computacionais generalizadas. Ela é informada por sistemas de produção usados em produtos como ChatGPT, Codex e serviços baseados em API, bem como pelos requisitos previstos para futuras aplicações baseadas em agentes. O objetivo do design é combinar alta taxa de transferência com latência reduzida, permitindo um desempenho mais responsivo para casos de uso interativos de IA em escala.

Um aspecto fundamental do programa é o co-design de sistemas de software e hardware, onde modelos e infraestrutura evoluem juntos. Isso inclui arquitetura de chip, sistemas de memória, camadas de rede, mecanismos de escalonamento e estruturas de implantação. Ao alinhar esses componentes, o sistema visa melhorar a eficiência e reduzir o custo por unidade de inteligência entregue.

A estratégia de plataforma mais ampla posiciona o Jalapeño como o primeiro passo em um roteiro de infraestrutura de longo prazo, programado para implantação em fases a partir de 2026, incorporando contribuições da Broadcom em silício e rede e da Celestia em integração de sistemas.

FAQ

O que a OpenAI e a Broadcom anunciaram em 24 de junho de 2026?

A OpenAI e a Broadcom anunciaram o Jalapeño, um chip acelerador de IA projetado sob medida especificamente para inferência de grandes modelos de linguagem. O chip representa o primeiro Processador de Inteligência da OpenAI e o componente inicial de uma plataforma de computação planejada para múltiplas gerações, desenvolvida em conjunto pelas duas empresas.

Quais cargas de trabalho as primeiras amostras de engenharia do Jalapeño estão executando?

As primeiras amostras de engenharia já estão executando cargas de trabalho de aprendizado de máquina em ambientes laboratoriais na frequência operacional e níveis de potência alvo, incluindo cargas de trabalho associadas a modelos avançados, como o GPT-5.3-Codex-Spark.

Quando está programado o início da implantação em fases do Jalapeño?

A estratégia de plataforma mais ampla posiciona o Jalapeño como o primeiro passo em um roteiro de infraestrutura de longo prazo, programado para implantação em fases a partir de 2026.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

1h atrás

OpenAI e Broadcom revelam chip de IA Jalapeno para inferência de LLM em 25 de Junho

7h atrás

OpenAI apresenta Jalapeño, primeiro chip de IA personalizado construído com a Broadcom

13h atrás

OpenAI e Broadcom Lançam Jalapeño Chip para Inferência de LLM em Escala

OpenAI lança primeiro chip de IA Jalapeño, com desempenho comparável ao Blackwell da NVIDIA.

Market Whisper6h atrás

OpenAI e Broadcom revelam Jalapeño, primeiro chip de IA personalizado para inferência de LLM

Oliver Grant7h atrás

Qualcomm Apresenta CPU Dragonfly C1000 para Data Center, Meta é a Primeira Cliente

Oliver Grant17h atrás

OpenAI e Broadcom Revelam Chip de IA Personalizado Jalapeño para Inferência

Oliver Grant23h atrás

O modelo GLM-5.2 da z.AI ganha atenção do mercado com alto desempenho e baixo custo

Oliver Grant06-23 08:52

Comentário

0/400

Sem comentários