NVIDIA Phát hành Trọng số mô hình Cosmos-Reason2-32B chủ lực, mở rộng cửa sổ ngữ cảnh lên 256K token

Theo Beating, NVIDIA đã phát hành các trọng số cho Cosmos-Reason2-32B, phiên bản chủ lực của mô hình vật lý AI suy luận tầm nhìn-ngôn ngữ (VLM) nhằm giúp robot và hệ thống lái tự động hiểu các nguyên lý không gian, thời gian và vật lý. Mô hình 32 tỷ tham số, dựa trên Qwen3-VL-32B-Instruct, có sẵn theo NVIDIA Open Model License để sử dụng thương mại.

Mô hình có thể phân tích các luồng video để đánh giá an toàn khi lái xe, phát hiện vật thể trong ảnh với tọa độ 2D/3D và đóng vai trò như động cơ lập kế hoạch cho robot hình người và xe tự hành. So với thế hệ trước, Cosmos-Reason2 bổ sung khả năng phát hiện đối tượng với định vị thời gian chính xác và mở rộng cửa sổ ngữ cảnh lên 256K token.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận