OpenAI 和 Broadcom 推出用於 LLM 推理的 Jalapeño AI 晶片

TIA-0.69%

OpenAI 和 Broadcom 於 2026 年 6 月 24 日發表了 Jalapeño,這是一款專為大型語言模型推論而設計的客製化 AI 加速晶片。該晶片是 OpenAI 首款智慧處理器,也是兩家公司共同開發、規劃多世代運算平台的第一個元件,目標是提升先進 AI 系統的速度、效率與可及性。這項里程碑反映了 OpenAI 日益趨向掌控其模型與應用背後的完整基礎設施堆疊,而非僅依賴外部運算平台的更廣泛策略方向。

Jalapeño 架構與技術規格

Jalapeño 從零開始設計,基於內部對現代 LLM 推論需求的研究。其架構反映了 OpenAI 模型開發路線圖所帶來的見解,包括核心最佳化、記憶體處理、網路與服務系統方面的考量。該晶片與 Broadcom 及 Celestia 合作開發,後兩者貢獻了製造流程、電路板與機架整合、網路系統以及大規模部署基礎設施。根據兩家公司說法,此設計旨在保持對不同大型語言模型的靈活性,不限於單一架構或產品線。

早期工程樣品已在實驗室環境中,以目標運作頻率與功耗水平執行機器學習工作負載,包括與 GPT-5.3-Codex-Spark 等先進模型相關的工作負載。初步內部評估顯示,Jalapeño 可能比現有領先 AI 加速器達到更佳的每瓦效能。該架構據稱強調減少資料移動,以及運算、記憶體與網路資源的更均衡分配,目標是讓實際利用率更接近理論硬體極限。Broadcom 的矽技術(包括其 Tomahawk 網路元件)被定位為大規模部署的關鍵推動因素。

Broadcom 與 Celestia 合作夥伴角色

該晶片與 Broadcom 及 Celestia 合作開發。Broadcom 貢獻了矽技術與網路元件,包括 Tomahawk 網路系統。Celestia 貢獻了製造流程、電路板與機架整合、網路系統以及大規模部署基礎設施。設計參考了用於 ChatGPT、Codex 及 API 型服務(API-based services)等產品的生產系統,以及未來基於代理的應用程式預期需求。

OpenAI 全堆疊基礎設施整合策略

該公司將此開發定位為朝向運算驅動經濟模式更廣泛轉型的一部分。在此背景下,該晶片被呈現為一項努力,旨在增加運算資源的可用性、降低營運成本,並改善消費級與企業級應用中 AI 系統的反應能力。背後策略涉及模型開發、硬體設計與基礎設施部署之間更緊密的整合,從而在整個系統層面(而非孤立元件)進行最佳化。

Jalapeño 的工程方法高度專注於 LLM 推論,而非一般化運算工作負載。設計參考了用於 ChatGPT、Codex 及 API 型服務(API-based services)等產品的生產系統,以及未來基於代理的應用程式預期需求。設計目標是結合高吞吐量與低延遲,從而在大規模互動式 AI 使用案例中實現更具回應性的效能。

該計畫的一個關鍵面向是軟硬體系統的共同設計,讓模型與基礎設施共同演進。這包括晶片架構、記憶體系統、網路層、排程機制與部署框架。透過協調這些元件,系統旨在提升效率,並降低每單位智慧輸出的成本。

更廣泛的平台策略將 Jalapeño 定位為長期基礎設施路線圖的第一步,該路線圖預計從 2026 年開始分階段部署,並結合 Broadcom 在矽與網路方面的貢獻,以及 Celestia 在系統整合方面的貢獻。

常見問題

OpenAI 和 Broadcom 在 2026 年 6 月 24 日宣布了什麼?

OpenAI 和 Broadcom 宣布了 Jalapeño,這是一款專為大型語言模型推論而設計的客製化 AI 加速晶片。該晶片是 OpenAI 首款智慧處理器,也是兩家公司共同開發、規劃多世代運算平台的第一個元件。

早期 Jalapeño 工程樣品正在執行哪些工作負載?

早期工程樣品已在實驗室環境中,以目標運作頻率與功耗水平執行機器學習工作負載,包括與 GPT-5.3-Codex-Spark 等先進模型相關的工作負載。

Jalapeño 的分階段部署預計何時開始?

更廣泛的平台策略將 Jalapeño 定位為長期基礎設施路線圖的第一步,該路線圖預計從 2026 年開始分階段部署。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆