エヌビディアは初のGroqチップLPXを発表:Vera Rubinとの組み合わせにより、メガワットあたりの推論効率が最大35倍向上し、次世代のKyberプロトタイプも展示されました。

Gate Newsの報道によると、3月17日に英偉達はGroq 3 LPU(言語処理ユニット)チップを発表しました。これは、英偉達が昨年12月に約200億ドルで買収したAI推論チップのスタートアップ企業Groqから最初にリリースされるチップであり、今年の第3四半期から出荷開始が見込まれています。Groq 3 LPXラックには256個のLPUを搭載でき、128GBのオンチップSRAMと毎秒640TBの拡張インターコネクト帯域を備えています。公式によると、LPXはVera Rubin NVL72と組み合わせて展開することで、1メガワットあたりの推論スループットを最大35倍向上させることができ、また兆のパラメータや百万トークンのコンテキスト推論シナリオにおける収益潜在力も解放します。黄仁勲氏は、これら二つのプロセッサを「極端に異なるが相互に統一されたもの」と表現し、LPXのオンチップメモリはモデルの利用可能な総メモリ容量を大幅に拡張しています。LPXのラックは、今年下半期にVera Rubinプラットフォームとともに発売される予定です。さらに、黄仁勲氏は次世代のラックアーキテクチャの試作機であるコードネームKyberも披露しました。Kyberは144個のGPU計算トレイを垂直配置に変更し、物理密度を向上させ、遅延を低減します。Vera Rubinの後継プラットフォームであるVera Rubin Ultraに搭載され、2027年のリリースが予定されています。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし