Mistral AI phát hành Leanstral: Agent mã nguồn mở Lean 4 đầu tiên, có thể tự động xuất bản chứng minh hình thức

Tin tức Gate News, ngày 17 tháng 3, Mistral AI đã chính thức ra mắt Leanstral, đây là mã nguồn mở đầu tiên dành riêng cho công cụ xác thực hình thức Lean 4. Mô hình này có điểm đột phá cốt lõi là khả năng sinh mã của AI đồng thời xuất ra các chứng minh hình thức có thể tự động kiểm tra bởi Lean 4, giúp vượt qua rào cản kiểm duyệt thủ công trong quá trình tạo mã AI truyền thống.

Leanstral sử dụng kiến trúc MoE thưa, có tổng cộng 120 tỷ tham số và 6 tỷ tham số kích hoạt, mở mã theo giấy phép Apache 2.0, và đã được tối ưu hóa huấn luyện đặc biệt cho lean-lsp-mcp. Người dùng có thể khởi động mà không cần cấu hình qua lệnh /leanstall trong Mistral Vibe hoặc gọi qua API miễn phí tại điểm cuối labs-leanstral-2603, đồng thời hỗ trợ tải trọng số để tự triển khai.

Mistral cũng đồng thời phát hành chuẩn đánh giá mới mang tên FLTEval, sử dụng dự án xác thực hình thức của định lý Fermat trong cộng đồng Lean 4 làm bối cảnh thử nghiệm. Kết quả so sánh hiệu suất cho thấy: Leanstral pass@2 với chi phí 36 USD đạt điểm 26.3, vượt xa Claude Sonnet 4.6 với chi phí 549 USD đạt 23.7 điểm; pass@16 với chi phí 290 USD đạt 31.9 điểm, dẫn trước Sonnet 8 điểm, trong khi Claude Opus 4.6 cần tới 1.650 USD mới đạt 39.6 điểm. Trong các mô hình mã nguồn mở, Qwen3.5-397B-A17B cần chạy 4 lần mới đạt 25.4 điểm, vẫn thấp hơn hiệu suất của Leanstral pass@2.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Curve Finance Tạm Ngừng Hạ Tầng LayerZero Sau Vụ Hack rsETH

Curve Finance đã tạm thời ngừng hạ tầng LayerZero của mình do một sự cố bảo mật liên quan đến rsETH. Nền tảng đang điều tra vấn đề này, ảnh hưởng đến một số hoạt động chuyển tiếp xuyên chuỗi (cross-chain bridging) trong khi các hoạt động khác vẫn diễn ra bình thường.

GateNews7giờ trước

Đồng sáng lập Monad Đề xuất Giới hạn Linh hoạt theo Mức trần Đối với Tiền gửi Thế chấp để Giảm Rủi ro Bị Tấn công

Keone Hon cho rằng các giao thức cho vay gộp nên triển khai các giới hạn tăng dần về lãi suất đối với việc tăng nguồn cung tài sản thế chấp để giảm thiểu rủi ro trong các cuộc tấn công. Anh ấy lập luận rằng điều này có thể đã ngăn chặn các khoản lỗ đáng kể, như trường hợp người gửi rsETH.

GateNews13giờ trước

SGB ra mắt dịch vụ đúc USDC trên mạng Solana

SGB cho phép đúc và hoàn trả USDC ngay lập tức trên Solana, cải thiện thanh toán xuyên biên giới với quyết toán theo thời gian thực. Dịch vụ hướng đến các tổ chức, loại bỏ trung gian và hỗ trợ thanh khoản cũng như quản lý kho bạc 24/7. Kế hoạch mở rộng bao gồm thêm nhiều stablecoin và khả năng tiếp cận của người dùng bán lẻ, li

CryptoFrontNews15giờ trước

Morpho Tạm Dừng Cầu Nối Cross-Chain OFT cho MORPHO Trên Arbitrum Sau Các Sự Kiện Từ Kelp DAO và LayerZero

Hiệp hội Morpho đã tạm thời đình chỉ cầu nối cross-chain OFT cho token MORPHO trên Arbitrum do các vấn đề gần đây liên quan đến Kelp DAO và Cầu nối LayerZero, chờ xác nhận nguyên nhân của sự cố rsETH.

GateNews15giờ trước

Việc Spark Protocol loại khỏi sàn vào tháng 1 đối với rsETH là lựa chọn thận trọng khi Aave đối mặt khủng hoảng thanh khoản ETH

Chiến lược của Spark Protocol là loại khỏi sàn các tài sản có mức sử dụng thấp và siết chặt tài sản thế chấp đã vấp phải phản ứng dữ dội ban đầu, nhưng đã tỏ ra sáng suốt trong giai đoạn thị trường biến động. Trong khi vẫn duy trì các trần lãi suất cao hơn, SparkLend đảm bảo thanh khoản, không giống Aave, hiện đang đối mặt với các rủi ro đáng kể.

GateNews18giờ trước

Kamino Tạm Dừng Tương Tác Tài Sản Liên Quan Đến LayerZero, Đóng Các Chức Năng Gửi Tiền và Cho Vay

Trước mắt, Kamino đã tạm thời ngừng các tương tác với các token liên quan đến LayerZero như một biện pháp phòng ngừa, đồng thời vẫn cho phép rút tiền và thanh toán nợ. Họ nhấn mạnh rằng biện pháp này nhằm quản lý rủi ro và các quỹ của người dùng vẫn an toàn.

GateNews19giờ trước
Bình luận
0/400
Không có bình luận