OpenAI e Broadcom revelam Jalapeño, primeiro chip de IA personalizado para inferência de LLM

OpenAI e Broadcom apresentaram hoje o Jalapeño, o primeiro Processador de Inteligência da OpenAI, projetado para inferência em modelos de linguagem de grande escala. O chip foi entregue ao CEO da OpenAI, Sam Altman, e ao presidente Greg Brockman pelo presidente e CEO da Broadcom, Hock Tan, e pelo presidente Charlie Kawwas. O acelerador representa o primeiro chip de IA de uma plataforma de computação com múltiplas gerações que as empresas estão construindo juntas para tornar a IA avançada mais rápida, confiável e acessível. A OpenAI projetou o chip do zero com base em seu entendimento dos fundamentos de LLMs, com a Broadcom e a Celestica ajudando a industrializar a plataforma por meio da implementação do chip, integração de sistemas de placa e rack, redes de alto desempenho e sistemas de produção escaláveis.

OpenAI e Broadcom Entregam Chip Jalapeño à Liderança da Empresa

A entrega do chip marca um passo importante na estratégia da OpenAI de construir a pilha completa por trás de seus modelos e produtos. O Jalapeño foi desenvolvido por meio da colaboração entre OpenAI, Broadcom e Celestica, com cada parceiro contribuindo com expertise especializada para a plataforma.

A OpenAI projetou a arquitetura do chip com base em seu roteiro de modelos, kernels, sistemas de serviço e necessidades de produtos. A Broadcom contribuiu com a implementação do chip e tecnologias de rede, incluindo o silício Tomahawk, para levar a plataforma à produção em larga escala. A Celestica forneceu expertise em placas, integração de sistemas de rack e sistemas de produção escaláveis.

Arquitetura do Jalapeño Otimizada para Cargas de Trabalho de Inferência de LLMs

O Jalapeño foi projetado com flexibilidade para trabalhar com todos os LLMs, guiado pelos insights da OpenAI sobre as necessidades de inferência de modelos de IA atuais e futuros em toda a indústria. Amostras de engenharia já estão executando cargas de trabalho de ML no laboratório na frequência e potência alvo de produção, incluindo o GPT-5.3-Codex-Spark.

Testes iniciais mostram que o Jalapeño proporcionará um desempenho por watt substancialmente melhor do que o estado da arte atual. A arquitetura reduz a movimentação de dados e equilibra recursos de computação, memória e rede para atingir uma utilização realizada muito mais próxima do pico teórico de desempenho. Um relatório técnico detalhado será apresentado nos próximos meses.

"O Jalapeño foi projetado do zero para inferência de LLMs usando insights detalhados de nossa estreita colaboração com os pesquisadores da OpenAI", disse Richard Ho, que lidera o programa de hardware da OpenAI. "Otimizamos a arquitetura em torno dos kernels, movimentação de memória, rede e padrões de serviço que mais importam para modelos de IA de fronteira. Com base em testes iniciais, o Jalapeño executará com eficiência nossas cargas de trabalho mais importantes próximas aos limites teóricos do hardware."

O chip é um design de folha em branco para inferência moderna de LLMs, não um acelerador de uso geral adaptado de cargas de trabalho de IA anteriores. Ele é informado pelos sistemas que a OpenAI opera todos os dias em ChatGPT, Codex, API e futuros produtos baseados em agentes. O objetivo é combinar a potência e a taxa de transferência dos principais aceleradores de IA atuais com uma latência mais próxima dos sistemas de inferência especializados mais rápidos.

Desenvolvimento Concluído em Prazo de Nove Meses Usando Design Assistido por IA

O Jalapeño foi desenvolvido em conjunto, do design inicial à conclusão da fabricação (tape-out), em apenas nove meses. As empresas acreditam que isso representa o ciclo de desenvolvimento de ASIC mais rápido já alcançado em semicondutores avançados de alto desempenho.

O cronograma acelerado reflete um profundo codesenvolvimento de software e hardware com as equipes de engenharia da OpenAI, a expertise de implementação de silício da Broadcom e o uso de modelos da OpenAI para acelerar partes do processo de design e otimização. Os mesmos modelos disponibilizados aos usuários estão ajudando a melhorar a infraestrutura usada para executar modelos futuros.

Plataforma de Computação com Múltiplas Gerações Planejada com Broadcom e Celestica

O Jalapeño é o primeiro passo de uma plataforma de computação com múltiplas gerações que combina aceleradores projetados pela OpenAI com a implementação de silício, redes e tecnologias de conectividade da Broadcom, e a expertise em placas, racks e sistemas da Celestica.

"O mundo está migrando para uma economia movida a computação", disse Greg Brockman, presidente e cofundador da OpenAI. "O Jalapeño faz parte de nossa estratégia de infraestrutura de pilha completa de longo prazo para tornar a computação mais abundante, resultando em uma IA mais rápida, confiável e acessível para pessoas e empresas, e que pode ser usada para resolver problemas mais importantes. Ao projetar mais da pilha nós mesmos, podemos oferecer mais inteligência com maior eficiência e continuar impulsionando a IA avançada em direção a um acesso mais amplo."

Implantação Programada até o Final de 2026

A plataforma de computação com múltiplas gerações foi projetada para implantação inicial até o final de 2026, com expansão nos anos seguintes. A OpenAI opera em toda a pilha, incluindo arquitetura de chip, kernels, sistemas de memória, redes, escalonamento, sistemas de implantação e experiência do produto, com cada camada otimizada para tornar seus modelos mais rápidos, confiáveis e acessíveis para os usuários.

FAQ

O que é o Jalapeño e quando foi apresentado?

O Jalapeño é o primeiro Processador de Inteligência da OpenAI, um acelerador de IA projetado especificamente para inferência em modelos de linguagem de grande escala. A OpenAI e a Broadcom apresentaram o chip hoje.

Quanto tempo levou para desenvolver o Jalapeño?

O Jalapeño foi desenvolvido em conjunto, do design inicial à conclusão da fabricação (tape-out), em nove meses. As empresas acreditam que isso representa o ciclo de desenvolvimento de ASIC mais rápido já alcançado em semicondutores avançados de alto desempenho.

Quando o Jalapeño será implantado?

A plataforma de computação com múltiplas gerações que inclui o Jalapeño foi projetada para implantação inicial até o final de 2026, com expansão planejada nos anos seguintes.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários