Google Cloud giới thiệu mô hình Gemini 3.2 Flash Lite với chi phí suy luận thấp hơn 95% so với GPT-5.5

Theo giám sát của Beating.AI, một tùy chọn mô hình mới có tên gemini-3.2-flash-lite-live-preview đã xuất hiện trong danh sách chọn mô hình của Google Cloud tính đến ngày 17/5. Các hậu tố “lite” và “live” cho thấy Google đang tạo một phiên bản chuyên biệt được tối ưu cho các tương tác thời gian thực có độ trễ cực thấp.

CEO Abacus.AI Bindu Reddy trước đó đã tiết lộ rằng Gemini 3.2 Flash đạt 92% năng lực lập trình và suy luận của GPT-5.5, đồng thời giữ chi phí suy luận chỉ bằng 1/20 so với GPT-5.5, với đa số truy vấn trả về phản hồi dưới 200 mili giây. Giới quan sát kỳ vọng mô hình nhẹ được tối ưu chi phí này sẽ được Google chính thức công bố tại sự kiện Google I/O vào ngày 20/5.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận