xAI 發布 Voice Agent Builder Beta,Grok Voice 基準測試超越 GPT

XAI4.74%
GROK3.29%

xAI 於 7 月 1 日宣布推出 Voice Agent Builder Beta 版,這是完全無程式碼的 AI 語音代理建置平台,讓用戶可在 2 分鐘內透過自然語言提示建置完成企業級語音代理;平台採用與 Grok Voice 緊密耦合的端到端 Speech-to-Speech 單一語音路徑,基準測試超越 GPT。

τ-voice Bench 基準測試:Grok Voice Think Fast 1.0 超越 GPT

xAI AI語音代理建置平台 (來源:xAI 網站)

根據 xAI 官方公布,Grok Voice Think Fast 1.0 在 τ-voice Bench 語音基準測試排行榜位居首位,在反應速度與推理能力兩項指標上直接超越 Google Gemini 3.1 Flash Live 及 OpenAI GPT Realtime 1.5。

xAI 說明,Grok Voice 使用真實且被設計為「最困難」的通話情境訓練,涵蓋低品質電話雜音、強烈口音、用戶中途打斷及模糊指令等場景,並原生支援 25 種以上語言。

端到端 Speech-to-Speech 架構:單一語音路徑取代傳統 STT+LLM+TTS 拼裝架構

xAI 官方說明,傳統企業 AI 語音客服須將語音轉文字(STT)、大型語言模型(LLM)與文字轉語音(TTS)三個獨立系統串接,這種拼裝架構增加了多跳點延遲,並提高錯誤率與運營成本。

Voice Agent Builder 採用與 Grok Voice 緊密耦合的端到端 Speech-to-Speech 單一語音路徑,整個語音處理流程不分段切換,旨在降低延遲並減少串接錯誤。

知識庫、工具串接、語音克隆與電話接入:四大核心功能規格

根據 xAI 官方功能說明,Voice Agent Builder 四大核心功能模組規格如下:

知識庫(Knowledge Base):支援上傳 Word、Excel、PDF、JSON 等格式,可整理為跨代理共享的 Collections,確保產品規格與政策一致性

工具串接(Tools & Connectors):內建 Google/Outlook 日曆、Web 搜尋、X(Twitter)搜尋及 Notion;支援轉接真人客服、結束通話與即時團隊通知

語音與電話(Voice & Telephony):提供 80 款以上內建語音;支援僅需 2 分鐘音訊的品牌語音克隆;可免費獲取 xAI 提供的電話號碼,或透過 SIP 串接現有總機系統

透明計價(Pricing):算力 API 費用每分鐘 0.05 美元,不收額外平台費;使用 xAI 提供的電話號碼時,額外收取每分鐘 0.01 美元通訊費

企業安全機制:自動錄音逐字稿、工具使用記錄與對話邊界設定

根據 xAI 官方公告,Voice Agent Builder 針對企業級用戶內建監控機制(Observability)與安全護欄(Guardrails):每通電話自動錄音並生成逐字稿;管理員可隨時查看 AI 在通話中使用的工具記錄;並可設定嚴格的對話邊界,例如強制禁止 AI 讀出客戶信用卡卡號,或禁止與用戶討論離題的政治話題。

xAI 在官方公告中表示:「用耳朵判斷比看基準測試更準確——建一個代理,用你最困難的工作流程打電話試試看。」

常見問題

xAI Voice Agent Builder 的算力費用是多少?

根據 xAI 官方公告,算力 API 費用為每分鐘 0.05 美元,不收額外平台費;若使用 xAI 免費提供的電話號碼,則額外收取每分鐘 0.01 美元通訊費。

Grok Voice Think Fast 1.0 在 τ-voice Bench 的表現如何?

根據 xAI 官方公布,Grok Voice Think Fast 1.0 在 τ-voice Bench 基準測試中超越 Google Gemini 3.1 Flash Live 及 OpenAI GPT Realtime 1.5,在反應速度與推理能力兩項指標上位居排行榜首位。

xAI Voice Agent Builder 目前可在哪裡試用?

根據 xAI 官方公告,Voice Agent Builder Beta 版已於 xAI Console 正式上線,開放試用。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆