付款方式為

USD

支援 Visa、Mastercard、SEPA 等多種支付方式

靈活買賣幣，0手續費

加密貨幣付款卡，全球付款無憂

基礎交易

自由交易加密貨幣

借幣交易，放大收益

閃兌與定投

大小額通兌、0 費率、無滑點

自動調倉無懼強平，自帶槓桿放大收益

提前交易，先發制人

進階交易

使用 Gate 錢包進行鏈上交易

鏈上掘金，智選新幣

交易機器人

智能策略，自動交易

跟隨專家實現收益增長

一份保證金，跨平台共用

數百種永續合約市場

一站交易全球傳統資產

歐式 T 型報價，豐富的到期日和行權價

實現最大化資金效率

從零開始掌握合約交易技巧

參與活動贏取獎勵

使用模擬資金，無風險體驗真實交易

美股差價合約衍生品

參與真實美股市場，投資熱門股票與 ETF

參與真實港股市場，交易優質港股資產

高槓桿，7×24 全天候交易

錨定真實股票資產發行

打新自由，直通全球股票發行市場

鑄造 GUSD，賺取國債 RWA 收益

買賣熱門股票，解鎖豐厚空投

打新

參與活動賺糖果，贏超值空投獎勵

一鍵質押，賺取潛力新幣

持有 GT，免費領取海量空投

打新自由，直通全球股票發行市場

交易鏈上資產，享空投福利

合約交易得積分，空投獎勵待領取

理財產品

閒置代幣，隨時賺取收益

定期定額，讓理財變得更簡單

低買高賣，波動獲益

通過靈活質押資產獲取收益

抵押資產，即時借幣

一站式借貸入口

VIP 專屬理財

尊享理財訂製，助力財富增值

私人財富管理

臻享訂製財富方案

頂尖量化，穩健護航

鏈上精選，質押賺幣

到期前不強平，安心持幣享槓桿收益

USD1 年化 12%

無需鎖倉，隨時交易提現

分享動態，發現價值

每日行情分析直播

隨時隨地與幣友即時交流

一站式獲取最新行業資訊

更多

推廣

參與活動，贏取豐厚獎勵

邀友入駐，共享高額收益

專屬返佣，輕鬆賺取高收益

擴大影響力，享海量空投

平台動態，實時更新

行業深度分析

超高費率折扣

提供一站式資產管理解決方案

提供企業級虛擬資產解決方案

開發者中心（API）

連接至 Gate 交易所的生態系統

OTC 銀行轉帳

提供多種法幣自營出入金渠道

經紀商專案

豐厚的 API 返佣機制

AI

您的對話式 AI 全能夥伴

在社交 App 中直接使用 Gate AI

Gate 藍龍蝦，開箱即用

Gate for AI Agent

AI 基礎設施，Gate MCP、Skills 與 CLI

Gate Skills Hub

從辦公到交易，一站式技能庫讓 AI 更好用

其他

常見問題解答與幫助指南

學習加密貨幣投資知識

與冠軍攜手同行

Gate 承諾 100%儲備金

守護您的資產安全

Perplexity公開搜索Agent後訓練方法，基於Qwen3.5的模型在準確率和成本上超過GPT-5.4

2026-04-23 05:07:25

根據動察 Beating 監測，Perplexity 研究團隊發表技術文章，公開其網頁搜索 agent 的後訓練流程。該流程基於開源模型 Qwen3.5-122B-A10B 和 Qwen3.5-397B-A17B，採用兩階段方案：先用監督微調（SFT）建立指令遵循、語言一致性等部署必需行為，再用線上策略強化學習（RL）優化搜索準確率和工具使用效率。

RL 階段使用 GRPO 算法，訓練數據由兩部分組成：一是自研合成的多跳可驗證問答數據集，從內部種子查詢出發，通過實體鏈構造需要 2 到 4 跳推理的問題，並由多個獨立求解器驗證答案唯一性；二是基於評分標準（rubric）的通用對話數據，將指令遵循、格式約束等部署要求轉化為可客觀檢查的原子條件，用於在 RL 階段防止 SFT 建立的行為退化。

獎勵設計的核心是門控聚合：只有基線正確（問答對或評分標準全部滿足）時，偏好得分才參與計算，防止高偏好信號掩蓋事實錯誤。效率懲罰採用組內錨定方式，以同組正確回答為基準，對超出的工具調用次數和生成長度施加平滑懲罰。

評測顯示後訓練後的 Qwen3.5-397B-SFT-RL 在多個搜索基準上表現最優。在 FRAMES 上，單次工具調用即達 57.3%，比 GPT-5.4 高 5.7 個百分點，比 Sonnet 4.6 高 4.7 個百分點。中等預算（4 次工具調用）下達 73.9%，每查詢成本 2.0 美分；同條件下 GPT-5.4 為 67.8% / 8.5 美分，Sonnet 4.6 為 62.4% / 15.3 美分。成本數據按各廠商公開 API 定價計算，未含快取優化。

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。

回覆

0/400

暫無回覆