2026-06-21 04:33:19
Tinygradのレポートによると、GLM 5.2は$150,000のデュアルBlackwell構成で1秒あたり120トークンを達成しました
BlockBeatsによると、6月21日にTinygradが、GLM 5.2はデュアルネットワーク化されたBlackwellアーキテクチャのtinybox構成で、1秒あたり120トークンの推論速度を達成したと報告した。$150,000の構成は、標準のtinyboxユニットを2台にするか、tinybox Proを1台にするかのいずれかで利用可能だ。Tinygradは、この提供内容をクラウドベースの推論サービスに代わるプライベート展開の選択肢として位置づけており、スローガンは「一度買えば、二度とクラウド料金は払わない。」だ。GLMは、この性能主張を公式に確認していない。