2026-02-19 16:41:14

谷歌今天發布了Gemini 3.1 Pro，剛看到測試評分，感覺這是衝著屠榜來的（模型軍備競賽繼續，利好半導體！）😂

官方定位很明確：專為複雜任務設計，比如深度研究、工程難題、長鏈推理和agentic工作流。
核心亮點：1M token上下文窗口（保持不變）
多模態支持（文本+圖像+視頻+音頻+代碼）
輸出最高64k tokens
性能對比當前主流模型（Claude Opus 4.6、GPT-5.2/5.3等）：
ARC-AGI-2（最難的抽象推理基準）：
Gemini 3.1 Pro 77.1%，領先Claude 4.6（68.8%）約8-9個百分點，
領先GPT-5系列20-30+個百分點。這是最大進步，代表核心推理質的飛躍。
GPQA Diamond（PhD級科學推理）：94.3%，小幅領先Claude 4.6（91.3%）和GPT-5.2（92.4%），差距2-3個百分點，基準已接近飽和。
SWE-Bench Verified（真實軟體工程任務）：80.6%，領先Claude 4.6（約76-77%）3-5個百分點，領先GPT明顯（5-15%）。
其他：Terminal-Bench、APEX-Agents等長時agent任務上也拿下多個第一；LMArena/Artificial Analysis指數目前排第1，成本效率高。
更重要的是，成本優勢明顯：
API定價（每1M tokens，基於Vertex AI / Gemini API最新數據，≤200k上下文標準價）：
Gemini 3.1 Pro：輸入 $2.00，輸出 $12.00（>200k上下文翻倍到$4/$18）
Claude Opus 4.6：輸入 $5.00，輸出 $25.00
GPT-5.2 / 5.x：輸入通常$10–15+，輸出$30–75+（高端tier更高，具體視版本）
優勢幅度：輸入：Gemini比Claude便宜約60%（2 vs 5），比GPT系列便宜70–80%以上。
輸出：Gemini比Claude便宜約52%（12 vs 25），比GPT便宜60–80%以上。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人點讚了這條動態

讚賞
1
留言
轉發
分享

留言

0/400

暫無留言

熱門話題
查看更多
#
加密市場上漲
30.9萬熱度
#
比特幣反彈
11.67萬熱度
#
美伊局勢影響
17.42萬熱度
#
原油價格飆升
39.05萬熱度
#
幣圈生存指南
8.82萬熱度

熱門 Gate Fun
查看更多

1
TREADOR
THE TREADOR
市值:$0.1持有人數:1
0.00%
2
😂
GEDO
市值:$2437.93持有人數:1
0.00%
3
BAIKAL
BAIKAL PURE WATER
市值:$2431.03持有人數:2
0.00%
4
DMY
Digital Money
市值:$2396.55持有人數:1
0.00%
5
SHPS
Shweps
市值:$2382.75持有人數:0
0.00%

谷歌今天發布了Gemini 3.1 Pro，剛看到測試評分，感覺這是衝著屠榜來的（模型軍備競賽繼續，利好半導體！）😂

熱門話題

加密市場上漲

比特幣反彈

美伊局勢影響

原油價格飆升

幣圈生存指南

熱門 Gate Fun

TREADOR

THE TREADOR

😂

GEDO

BAIKAL

BAIKAL PURE WATER

DMY

Digital Money

SHPS

Shweps

置頂