Mô hình định tuyến (Model Routing) nổi lên như một giải pháp kiểm soát chi phí AI cho doanh nghiệp, gây sức ép lên OpenAI và Anthropic

Theo CNBC, các nhà lãnh đạo AI bao gồm CEO Cognition Scott Wu và CPO Cisco Jeetu Patel cho biết trong tuần này rằng model routing—một giải pháp ghép các tác vụ với đúng mô hình AI phù hợp dựa trên mức độ phức tạp—đang trở thành một kỷ luật kiểm soát chi phí quan trọng tại Mỹ trong khu vực doanh nghiệp.

Hiện tại, khoảng 95% việc sử dụng AI trong doanh nghiệp mặc định dùng các mô hình “frontier” đắt đỏ ngay cả cho các tác vụ thường ngày, theo CEO Glean Arvind Jain. Model routing có thể mang lại hiệu quả chi phí tốt hơn 5 đến 10 lần cho các công việc mang tính khuôn mẫu bằng cách dùng các lựa chọn rẻ hơn. Phân tích chi phí của Cisco cho thấy áp lực rõ rệt: với mức sử dụng token 200 USD mỗi nhân viên mỗi tuần, công ty phải đối mặt với khoảng 900 triệu USD chi phí AI hằng năm cho 90.000 nhân viên. Nếu doanh nghiệp ngày càng chuyển các tác vụ có khối lượng lớn và dễ dàng sang các mô hình rẻ hơn hoặc mô hình mã nguồn mở, OpenAI và Anthropic chỉ nhận thanh toán cho phần việc phức tạp, qua đó có thể thay đổi đáng kể các mô hình định giá mà cả hai công ty đã xây dựng dựa trên các định giá đó.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận