OpenAI 和 Broadcom 推出用於 LLM 推理的 Jalapeño AI 晶片

2026-06-25 11:03:21

TIA-0.69%

OpenAI 和 Broadcom 於 2026 年 6 月 24 日發表了 Jalapeño，這是一款專為大型語言模型推論而設計的客製化 AI 加速晶片。該晶片是 OpenAI 首款智慧處理器，也是兩家公司共同開發、規劃多世代運算平台的第一個元件，目標是提升先進 AI 系統的速度、效率與可及性。這項里程碑反映了 OpenAI 日益趨向掌控其模型與應用背後的完整基礎設施堆疊，而非僅依賴外部運算平台的更廣泛策略方向。

Jalapeño 架構與技術規格

Jalapeño 從零開始設計，基於內部對現代 LLM 推論需求的研究。其架構反映了 OpenAI 模型開發路線圖所帶來的見解，包括核心最佳化、記憶體處理、網路與服務系統方面的考量。該晶片與 Broadcom 及 Celestia 合作開發，後兩者貢獻了製造流程、電路板與機架整合、網路系統以及大規模部署基礎設施。根據兩家公司說法，此設計旨在保持對不同大型語言模型的靈活性，不限於單一架構或產品線。

早期工程樣品已在實驗室環境中，以目標運作頻率與功耗水平執行機器學習工作負載，包括與 GPT-5.3-Codex-Spark 等先進模型相關的工作負載。初步內部評估顯示，Jalapeño 可能比現有領先 AI 加速器達到更佳的每瓦效能。該架構據稱強調減少資料移動，以及運算、記憶體與網路資源的更均衡分配，目標是讓實際利用率更接近理論硬體極限。Broadcom 的矽技術（包括其 Tomahawk 網路元件）被定位為大規模部署的關鍵推動因素。

Broadcom 與 Celestia 合作夥伴角色

該晶片與 Broadcom 及 Celestia 合作開發。Broadcom 貢獻了矽技術與網路元件，包括 Tomahawk 網路系統。Celestia 貢獻了製造流程、電路板與機架整合、網路系統以及大規模部署基礎設施。設計參考了用於 ChatGPT、Codex 及 API 型服務（API-based services）等產品的生產系統，以及未來基於代理的應用程式預期需求。

OpenAI 全堆疊基礎設施整合策略

該公司將此開發定位為朝向運算驅動經濟模式更廣泛轉型的一部分。在此背景下，該晶片被呈現為一項努力，旨在增加運算資源的可用性、降低營運成本，並改善消費級與企業級應用中 AI 系統的反應能力。背後策略涉及模型開發、硬體設計與基礎設施部署之間更緊密的整合，從而在整個系統層面（而非孤立元件）進行最佳化。

Jalapeño 的工程方法高度專注於 LLM 推論，而非一般化運算工作負載。設計參考了用於 ChatGPT、Codex 及 API 型服務（API-based services）等產品的生產系統，以及未來基於代理的應用程式預期需求。設計目標是結合高吞吐量與低延遲，從而在大規模互動式 AI 使用案例中實現更具回應性的效能。

該計畫的一個關鍵面向是軟硬體系統的共同設計，讓模型與基礎設施共同演進。這包括晶片架構、記憶體系統、網路層、排程機制與部署框架。透過協調這些元件，系統旨在提升效率，並降低每單位智慧輸出的成本。

更廣泛的平台策略將 Jalapeño 定位為長期基礎設施路線圖的第一步，該路線圖預計從 2026 年開始分階段部署，並結合 Broadcom 在矽與網路方面的貢獻，以及 Celestia 在系統整合方面的貢獻。

常見問題

OpenAI 和 Broadcom 在 2026 年 6 月 24 日宣布了什麼？

OpenAI 和 Broadcom 宣布了 Jalapeño，這是一款專為大型語言模型推論而設計的客製化 AI 加速晶片。該晶片是 OpenAI 首款智慧處理器，也是兩家公司共同開發、規劃多世代運算平台的第一個元件。

早期 Jalapeño 工程樣品正在執行哪些工作負載？

早期工程樣品已在實驗室環境中，以目標運作頻率與功耗水平執行機器學習工作負載，包括與 GPT-5.3-Codex-Spark 等先進模型相關的工作負載。

Jalapeño 的分階段部署預計何時開始？

更廣泛的平台策略將 Jalapeño 定位為長期基礎設施路線圖的第一步，該路線圖預計從 2026 年開始分階段部署。

View Source

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。