Mistral AI 發佈 Leanstral:首個 Lean 4 開源代碼 Agent,可自動輸出形式化證明

GateNews

Gate News 消息,3 月 17 日,Mistral AI 今日發布 Leanstral,這是首個專為形式化驗證工具 Lean 4 設計的開源代碼 Agent。該模型的核心創新在於,AI 生成代碼的同時可輸出可被 Lean 4 自動校驗的形式化證明,從而繞開傳統 AI 代碼生成中人工審查的瓶頸環節。

Leanstral 採用稀疏 MoE 架構,擁有 120B 總參數和 6B 激活參數,以 Apache 2.0 協議開源,並針對 lean-lsp-mcp 進行了專項訓練優化。用戶可在 Mistral Vibe 中通過命令 /leanstall 零配置啟動,或通過免費 API 端點 labs-leanstral-2603 調用,同時支持下載權重進行自部署。

Mistral 同步發布了新評估基準 FLTEval,以 Lean 4 社區的費馬大定理形式化項目為測試場景。性能對比數據顯示:Leanstral pass@2 以 36 美元成本得分 26.3,超過成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,領先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能達到 39.6 分。在開源模型中,Qwen3.5-397B-A17B 需運行 4 次才能達到 25.4 分,仍低於 Leanstral pass@2 的表現。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Pi Network 協議 22.1 確認截止,v21.2 節點將自動斷網

Pi Network 主網節點運營商的協議 22.1 升級截止日期為 4 月 27 日,截止後仍運行 v21.2 版本的節點自動與主網斷開連接,喪失處理交易、驗證區塊及獲取節點獎勵的資格。CEX 技術指南同時確認,協議 23.0 的截止日期已從 5 月 18 日提前至 5 月 11 日,較原定時程提前一週。

Market Whisper26分鐘前

Solana 確立後量子遷移路線圖,核心開發團隊選定 Falcon 簽名方案

據 Solana 基金會官方部落格於 4 月 27 日文章,核心開發團隊 Anza 與 Firedancer 在獨立研究後,均選定 Falcon 作為網絡的後量子數位簽名方案,兩個團隊已分別在 GitHub 上發布初始實作版本。Solana 基金會同步公布包含三個階段的後量子遷移路線圖,並表示遷移預計不產生顯著影響。

Market Whisper33分鐘前

MARA 成立「非營利組織基金會」,聚焦 PQ 錢包與抗量子研發

MARA Holdings 執行長 Fred Thiel 於 4 月 27 日比特幣 2026 大會上宣布,正式成立非營利組織 MARA 基金會。根據 MARA Holdings 官方聲明,基金會三大核心任務為:推進後量子技術研發、支持 BIP-360 提案開發,以及建設比特幣交易手續費市場。

Market Whisper50分鐘前

Stacks 生態系 2026 年第一季度:sBTC TVL 達到 5.45 億美元,Zest 協議攀升至 7,590 萬美元

Gate News 訊息,4月28日 — Stacks 發布其 2026 年第一季度生態系統數據。sBTC (Stacks 的比特幣抵押代幣) 總鎖倉量 (TVL) 達到 $545 百萬,且存款上限已完全移除。Stacks 協議的去中心化金融 (DeFi) 進行中的部署資本合計 $121 百萬。 Zest

GateNews1小時前

Squads 釋出三款開源工具,用於 Solana 多重簽名管理

Gate News 消息,4 月 28 日——Solana 上的多重簽名(multisig)協議 Squads 已釋出三款開源工具,用於 Squads Protocol v4,以強化在 Solana 上的多重簽名管理實務,並與 STRIDE 合作提升生態系安全標準。 這三款工具包括 multisig-cli,一款 Rust 指令列工具,用於審查、模擬、簽署以及執行多重簽名提案,並具備針對高信任度作業情境而設計的直接帳戶與指令解析。Multisig-verifier 是一個靜態、無後端的瀏覽器介面,可直接透過 Solana RPC 讀取多重簽名錢包狀態,支援提案解碼、核准追蹤,以及透過個人錢包進行成員核准或拒絕。Multisig-monitor 是一款即時監控工具,可追蹤指定多重簽名錢包中的活動、解碼操作,並在提案建立、投票、執行或組態變更時發送通知。 Squads 表示,此次釋出是朝向開發多個彼此獨立的前端與存取端點邁出的第一步,鼓勵團隊透過不同介面交叉驗證簽名,以降低供應鏈風險與「盲簽」(blind signing)可能性。也規劃未來推出與 Squads 無關的獨立實例。

GateNews1小時前
留言
0/400
暫無留言