聯想AI服務器首次實現本地部署DeepSeek滿血大模型低於1TB,支持100併發

DEEPSEEK-2.05%
G3-3.69%
金十數據3月3日訊,近日,聯想集團宣佈基於聯想問天WA7780 G3服務器,在行業內首次實現單機部署DeepSeek-R1/V3 671B大模型,以低於行業公認1TGB顯存(實際768GB)承載100併發用戶流暢體驗。據聯想實測數據顯示,在512 token標準測試環境下,該系統可支持100個併發用戶持續獲得每秒10 token的穩定輸出,首token響應時間壓縮至30秒內。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
Andruchovip
· 2025-03-03 05:30
作者真棒!!!
查看原文回復0