Qwable 27B: Mô hình AI cục bộ tái hiện Fable 5 Reasoning trên phần cứng tiêu dùng

Nhà phát triển Mia đã phát hành Qwable 27B trên Hugging Face, bản fine-tune đầy đủ của Qwen3.6-27B từ Alibaba được huấn luyện trên một bộ dữ liệu suy luận theo phong cách Fable 5, sau thông báo vào ngày 15/6/2026. Mô hình này tái tạo cách tư duy có cấu trúc của Fable 5 từ Anthropic khi chạy hoàn toàn trên phần cứng cục bộ, không tốn chi phí API và không có chính sách lưu giữ dữ liệu bắt buộc. Chẳng bao lâu sau, cộng tác viên mã nguồn mở Huihui-ai đã phát hành một bản bị “abliterated” loại bỏ hành vi từ chối tích hợp sẵn bằng cách chỉnh sửa trọng số mô hình thông qua cvector-generator của llama.cpp. Các bản phát hành diễn ra sau một tuần mà chính phủ Mỹ đã ra lệnh Fable 5 bị gỡ bỏ cho mọi công dân nước ngoài do một phát hiện liên quan đến jailbreak còn tranh cãi. Cả hai biến thể Qwable đều cung cấp lựa chọn cục bộ thay thế cho các dịch vụ AI dựa trên đám mây, loại bỏ sự phụ thuộc vào máy chủ và các yêu cầu xử lý dữ liệu bên thứ ba.

Kiến trúc Qwable 27B và Phương pháp huấn luyện

Qwable 27B là bản fine-tune đầy đủ từ mô hình nền Qwen3.6-27B của Alibaba, do nhà phát triển Mia xây dựng trên một tập dữ liệu gồm các ví dụ suy luận theo phong cách Fable 5. Cách huấn luyện là instruction fine-tuning trên các ví dụ kiểu “trace”, nơi nhà phát triển thu thập các ví dụ được định dạng giống các câu trả lời từng bước của Fable 5 và huấn luyện Qwen để tạo ra các cấu trúc đầu ra tương tự. Mô hình tham số 27 tỷ này nhắm tới cấu trúc tuân lệnh theo hướng dẫn của Fable 5, tạo ra kết quả có định hướng hơn, giải thích rõ hơn và hoàn thành tác vụ theo từng bước hơn so với mô hình Qwen nền.

Mô hình chạy ở định dạng GGUF, là loại tệp được nén tương thích với LM Studio và llama.cpp. Bản build Q4 đã lượng tử hóa cần khoảng 16,5 GB dung lượng lưu trữ. Tất cả quá trình xử lý diễn ra cục bộ mà không gửi dữ liệu lên máy chủ bên ngoài, loại bỏ yêu cầu lưu giữ dữ liệu bắt buộc 30 ngày mà Fable 5 áp đặt cho mọi luồng truy cập, bao gồm cả khách hàng doanh nghiệp từng có các thỏa thuận không lưu giữ trước đó.

Quy trình Abliteration Loại bỏ Cơ chế Từ chối

Huihui-ai đã áp dụng abliteration để tạo ra Huihui-Qwable-3.6-27b-abliterated, một biến thể loại bỏ hành vi từ chối của mô hình. Quy trình xác định một hướng từ chối được nhúng trong trọng số mô hình bằng cách chạy mô hình trên các tập lớn các prompt gây hại và vô hại, đo chênh lệch trong các kích hoạt nội bộ, sau đó chỉnh sửa trọng số để xóa bỏ chênh lệch đó. Sau khi abliteration, mô hình không còn chứa các tín hiệu toán học kích hoạt phản hồi từ chối.

Huihui-ai áp dụng trực tiếp kỹ thuật này lên Qwable GGUF bằng cvector-generator của llama.cpp, không cần môi trường Python, huấn luyện lại toàn bộ trọng số hay máy chủ thuê. Quy trình này khác với jailbreaking ở chỗ thay đổi vĩnh viễn kiến trúc mô hình thay vì khai thác lỗ hổng trong prompt. Trang model nêu rõ phiên bản đã abliterated chỉ dành cho mục đích nghiên cứu và môi trường được kiểm soát, với trách nhiệm pháp lý và đạo đức hoàn toàn thuộc về người dùng.

Các Bản build Có sẵn và Yêu cầu phần cứng

Bản Qwable đã abliterated có trên Hugging Face ở ba bản build. Phiên bản khuyến nghị Q4_K_M_Q8 nặng khoảng 19 GB và là lựa chọn nhỏ nhất, thân thiện với người dùng phổ thông nhất. Một phiên bản hỗ trợ dự đoán đa token có sẵn cho các hệ thống có đủ tài nguyên tính toán, giúp tạo phản hồi nhanh hơn. Cả bản Qwable tiêu chuẩn và biến thể đã abliterated đều chạy trên phần cứng phổ thông thông qua các runtime cục bộ như LM Studio.

Các Trường hợp sử dụng cho Bản tiêu chuẩn và đã Abliterated

Bản Qwable tiêu chuẩn phù hợp cho hỗ trợ lập trình, gỡ lỗi kỹ thuật và các quy trình cần mô hình hiển thị quá trình suy luận thay vì tạo câu trả lời trực tiếp. Nó chạy trong các thiết lập agent cục bộ và hầu hết các runtime cục bộ. Bản đã abliterated phục vụ các nhà nghiên cứu bảo mật cần hành vi mô hình “nguyên bản” mà không có lọc từ phía nhà cung cấp, các pipeline dữ liệu tổng hợp cần đầu ra cho các chủ đề nhạy cảm, và công việc đánh giá kiểm thử năng lực mô hình mà không bị can thiệp bởi chính sách nội dung. Trang model cảnh báo rằng việc giảm lọc an toàn đồng nghĩa đầu ra có thể nhạy cảm, gây tranh cãi hoặc không phù hợp.

FAQ

Qwable 27B là gì và khi nào được phát hành?

Qwable 27B là bản fine-tune đầy đủ của Qwen3.6-27B từ Alibaba được huấn luyện trên một bộ dữ liệu suy luận theo phong cách Fable 5, do nhà phát triển Mia công bố vào ngày 15/6/2026. Mô hình chạy cục bộ ở định dạng GGUF và yêu cầu khoảng 16,5 GB cho bản build đã lượng tử hóa Q4.

Phiên bản đã abliterated khác gì so với mô hình Qwable tiêu chuẩn?

Phiên bản đã abliterated, được tạo bởi Huihui-ai, loại bỏ hành vi từ chối bằng cách chỉnh sửa trọng số mô hình bằng cvector-generator của llama.cpp. Quy trình loại bỏ các tín hiệu toán học kích hoạt phản hồi từ chối, tạo ra một mô hình xử lý mọi prompt mà không có lọc nội dung, đồng thời vẫn giữ đầy đủ chức năng.

Yêu cầu phần cứng để chạy các mô hình Qwable là gì?

Bản build lượng tử hóa Q4 cần khoảng 16,5 GB dung lượng lưu trữ, trong khi phiên bản đã abliterated Q4_K_M_Q8 khuyến nghị nặng khoảng 19 GB. Cả hai mô hình đều chạy trên phần cứng phổ thông thông qua các runtime cục bộ như LM Studio hoặc llama.cpp, và có phiên bản hỗ trợ dự đoán đa token dành cho các hệ thống có năng lực tính toán cao hơn.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận