美團 LongCat-2.0 開源：1.6 兆參數無需輝達 GPU

2026-07-01 02:46:54

據路透社於 6 月 30 日報道，美團（Meituan）發布開源 AI 模型 LongCat-2.0，參數規模達 1.6 兆，採用稀疏混合專家（Sparse MoE）架構，完全使用國產 ASIC 超級叢集晶片訓練，未使用任何輝達 GPU 或 CUDA 軟體棧，模型上下文視窗達 100 萬 tokens。

LongCat-2.0 的技術規格與目標應用場景

LongCat-2.0 採用稀疏混合專家（Sparse MoE）架構，與 DeepSeek 和 Mistral 旗下 Mixtral 方案相近：模型不同時激活全部 1.6 兆個參數，而是由內部路由器為每個 token 選擇一組專門子模型，相較於相同規模的密集模型可降低推理成本。主要技術規格與部署限制如下：

參數規模：1.6 兆（稀疏 MoE 架構，不同時激活全部參數）

上下文視窗：100 萬 tokens（DeepSeek-R1-0528 和 GPT-OSS 均為 12.8 萬）

訓練硬體：國產 ASIC 超級叢集（無輝達 GPU，無 CUDA 軟體棧）

目標應用：AI 代理、編碼工具（程式碼理解、全庫編輯、自動化任務）

部署形式：資料中心級推理叢集，不支援消費級設備或大多數本地部署

國產晶片訓練的市場背景與伯恩斯坦數據

美團聲稱 LongCat-2.0 的核心推理架構具有可移植性，可在中國現有硬體上運行。此次發布正值美國出口管制持續限制先進 AI 晶片向中國企業出口。

股票研究公司伯恩斯坦（Bernstein）估計，輝達目前在中國 AI 晶片市場佔約 40% 份額，華為份額與之相近；伯恩斯坦同時預測，華為今年將取得進展，使輝達在中國市場的份額下降約 8 個百分點。

性能聲明的現有狀態：尚無第三方驗證

美團在已發布的基準測試中將 LongCat-2.0 與多款封閉源模型進行比較，但相關報道指出，這些性能聲明迄今尚未獲得獨立公正的第三方評估驗證。

報道同時指出，針對國產晶片的最佳化或限制 LongCat-2.0 在輝達硬體上的效能，而輝達硬體目前仍主導全球資料中心。美團表示其核心推理架構仍具有可移植性，獨立測試將決定中國以外開發者的採用意願。

常見問題

LongCat-2.0 的 100 萬 token 上下文視窗對哪些應用場景有意義？

截至報道時，DeepSeek-R1-0528 和 OpenAI GPT-OSS 上下文視窗上限均為 12.8 萬 tokens；LongCat-2.0 聲稱達到 100 萬 tokens，對需要處理超長程式碼庫、複雜任務鏈的 AI 代理應用具有潛在意義。惟上述規格聲明尚待獨立驗證。

美團的 AI 研發背景是什麼？

美團核心業務為食品外送和本地生活服務。2023 年以 2.81 億美元收購 AI 新創公司光年科技（Light Year Beyond）後進入 AI 領域，2025 年才公開宣布內部模型計劃，LongCat-2.0 定位為公司 AI 代理與編碼工具的推理引擎。

LongCat-2.0 的稀疏 MoE 架構與 1.6 兆密集模型相比有何優缺點？

稀疏 MoE 的核心優勢是不激活全部參數，路由至特定子模型，相較於同等規模的密集模型可降低推理計算成本。但針對特定硬體（如國產 ASIC）優化的架構，在其他硬體（如輝達 GPU）上的效能可能存在限制，獨立測試結果尚未公布。

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。