據路透社於 6 月 30 日報道,美團(Meituan)發布開源 AI 模型 LongCat-2.0,參數規模達 1.6 兆,採用稀疏混合專家(Sparse MoE)架構,完全使用國產 ASIC 超級叢集晶片訓練,未使用任何輝達 GPU 或 CUDA 軟體棧,模型上下文視窗達 100 萬 tokens。
LongCat-2.0 的技術規格與目標應用場景
LongCat-2.0 採用稀疏混合專家(Sparse MoE)架構,與 DeepSeek 和 Mistral 旗下 Mixtral 方案相近:模型不同時激活全部 1.6 兆個參數,而是由內部路由器為每個 token 選擇一組專門子模型,相較於相同規模的密集模型可降低推理成本。主要技術規格與部署限制如下:
參數規模:1.6 兆(稀疏 MoE 架構,不同時激活全部參數)
上下文視窗:100 萬 tokens(DeepSeek-R1-0528 和 GPT-OSS 均為 12.8 萬)
訓練硬體:國產 ASIC 超級叢集(無輝達 GPU,無 CUDA 軟體棧)
目標應用:AI 代理、編碼工具(程式碼理解、全庫編輯、自動化任務)
部署形式:資料中心級推理叢集,不支援消費級設備或大多數本地部署
國產晶片訓練的市場背景與伯恩斯坦數據
美團聲稱 LongCat-2.0 的核心推理架構具有可移植性,可在中國現有硬體上運行。此次發布正值美國出口管制持續限制先進 AI 晶片向中國企業出口。
股票研究公司伯恩斯坦(Bernstein)估計,輝達目前在中國 AI 晶片市場佔約 40% 份額,華為份額與之相近;伯恩斯坦同時預測,華為今年將取得進展,使輝達在中國市場的份額下降約 8 個百分點。
性能聲明的現有狀態:尚無第三方驗證
美團在已發布的基準測試中將 LongCat-2.0 與多款封閉源模型進行比較,但相關報道指出,這些性能聲明迄今尚未獲得獨立公正的第三方評估驗證。
報道同時指出,針對國產晶片的最佳化或限制 LongCat-2.0 在輝達硬體上的效能,而輝達硬體目前仍主導全球資料中心。美團表示其核心推理架構仍具有可移植性,獨立測試將決定中國以外開發者的採用意願。
常見問題
LongCat-2.0 的 100 萬 token 上下文視窗對哪些應用場景有意義?
截至報道時,DeepSeek-R1-0528 和 OpenAI GPT-OSS 上下文視窗上限均為 12.8 萬 tokens;LongCat-2.0 聲稱達到 100 萬 tokens,對需要處理超長程式碼庫、複雜任務鏈的 AI 代理應用具有潛在意義。惟上述規格聲明尚待獨立驗證。
美團的 AI 研發背景是什麼?
美團核心業務為食品外送和本地生活服務。2023 年以 2.81 億美元收購 AI 新創公司光年科技(Light Year Beyond)後進入 AI 領域,2025 年才公開宣布內部模型計劃,LongCat-2.0 定位為公司 AI 代理與編碼工具的推理引擎。
LongCat-2.0 的稀疏 MoE 架構與 1.6 兆密集模型相比有何優缺點?
稀疏 MoE 的核心優勢是不激活全部參數,路由至特定子模型,相較於同等規模的密集模型可降低推理計算成本。但針對特定硬體(如國產 ASIC)優化的架構,在其他硬體(如輝達 GPU)上的效能可能存在限制,獨立測試結果尚未公布。