根據 Cursor 近期的披露,該公司推出一種名為 autoinstall 的訓練技術,供其 Composer 模型系列使用:採用上一代模型,為下一代強化學習自動設置可執行的環境。在訓練 Composer 2 時,Cursor 使用了 Composer 1.5 來完成這項任務。該方法分兩步進行:首先,代理會閱讀程式碼倉庫的文件與設定,以產生 10 個驗證指令及其預期輸出;其次,另一名代理會使用其中 3 個指令,從零開始設定環境,直到指令能成功執行為止,最多嘗試 5 次重試。Composer 2 在衡量環境設定能力的基準測試 Terminal-Bench 上達到 61.7% 的分數,較 Composer 1.5 的 47.9% 高出 14 個百分點。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
帕蘭提爾的 Maven 系統在伊朗行動的前 48 小時內打擊 1,000+ 個目標
根據 Yonhapnews,Palantir 的 Maven 智慧系統(MSS)在美國針對伊朗的軍事行動前 48 小時內打擊超過 1,000 個目標的過程中扮演了重要角色。美國國防部已愈來愈多地將 AI 系統整合到軍事決策流程中,包含 P
GateNews47分鐘前
百度的 昆侖晶片(Kunlun Chip)尋求在上海科創板及香港雙重上市,估值超過 300 億美元
根據彭博資訊,百度的人工智慧晶片子公司昆侖晶片正尋求在上海的科創板與香港進行雙重上市。該公司由百度持有 58% 股權,已透過中國國際金融股份有限公司向中國證券監管機構提交了 IPO 申請,並且
GateNews1小時前
Google Gemini API 將於 6 月 8 日中斷相容性,舊版 SDK 將會出錯
根據 Google 的說法,Gemini Interactions API 將進行一次相容性破壞更新。新版本會在 5 月 26 日起成為預設設定,舊版則會在 6 月 8 日前被完全棄用。使用 Python 或 JavaScript SDK 版本 1.x.x 的請求在該日期之後將回傳錯誤。
開發者必須修改兩項
GateNews1小時前
軟銀公布全年財報,投資者質疑美國 OpenAI$60B 的資金規劃
根據彭博社報導,軟銀集團(SoftBank Group)公布了截至 3 月止的全年獲利,因投資人審視該公司將如何資助其對 OpenAI 的預定 600 億美元投資。該公司在財年錄得約 3.3 兆日圓(200.8 億美元)的淨利,受惠於
GateNews2小時前
AI 職缺增加 50%,隨著亞洲人才戰重塑就業市場
亞洲的 AI 人才擾動
根據 Seek 首席商務官 Peter Bithos 的說法,儘管整體就業市場持平,與去年同期相比,與 AI 相關的職缺已增加 50%。他在最近一期以「就業版圖如何」為主題的播客節目中,談到了就業環境的變化。
Crypto Frontier2小時前
余文浩,前騰訊 AI 研究員,上個月加入 OpenAI 擔任 AGI 研究員
根據 Beating,Yu Wenhao,曾任 Tencent AI 西雅圖實驗室的資深研究員,上個月加入 OpenAI,成為一名 AGI 研究員。他在 LinkedIn 上確認,他將投入參與塑造下一代 AI 模型,並推進 AGI 的開發。
Yu 擁有電腦科學領域的 Ph.D.,來自
GateNews3小時前