Qwable 27B: โมเดล AI ในพื้นที่จำลองเหตุผลของ Fable 5 บนฮาร์ดแวร์ระดับผู้บริโภค

นักพัฒนา Mia ปล่อย Qwable 27B บน Hugging Face โดยเป็นการปรับแต่งแบบ full fine-tune ของ Qwen3.6-27B จาก Alibaba ที่เทรนด้วยชุดข้อมูลการให้เหตุผลสไตล์ Fable 5 ตามประกาศเมื่อวันที่ 15 มิถุนายน 2026 โมเดลนี้ทำซ้ำแนวทางการคิดแบบมีโครงสร้างของ Fable 5 จาก Anthropic ขณะเดียวกันก็รันทั้งหมดบนฮาร์ดแวร์ภายในเครื่องโดยไม่เสียค่า API และไม่มีกฎบังคับสำหรับการเก็บรักษาข้อมูล หลังจากนั้นไม่นาน ผู้ร่วมพัฒนาโอเพนซอร์ส Huihui-ai ปล่อยเวอร์ชันที่ “abliterated” โดยตัดพฤติกรรมการปฏิเสธในตัวออกด้วยการปรับน้ำหนักโมเดลผ่าน llama.cpp's cvector-generator การปล่อยดังกล่าวเกิดขึ้นหลังจากสัปดาห์หนึ่งที่รัฐบาลสหรัฐสั่งให้ดึง Fable 5 ออกสำหรับชาวต่างชาติทั้งหมดจากข้อค้นพบการเจาะผ่าน (jailbreak) ที่เป็นข้อโต้แย้ง โมเดล Qwable ทั้งสองเวอร์ชันให้ทางเลือกที่รันในเครื่องแทนบริการ AI บนคลาวด์ โดยตัดการพึ่งพาเซิร์ฟเวอร์และความจำเป็นในการประมวลผลข้อมูลโดยบุคคลที่สาม

Qwable 27B Architecture and Training Methodology

Qwable 27B เป็นการปรับแต่งแบบ full fine-tune ของโมเดลฐาน Qwen3.6-27B ของ Alibaba ที่นักพัฒนา Mia สร้างขึ้นจากชุดข้อมูลตัวอย่างการให้เหตุผลสไตล์ Fable 5 แนวทางการเทรนคือ instruction fine-tuning บนตัวอย่างลักษณะ trace โดยผู้พัฒนารวบรวมตัวอย่างที่จัดรูปแบบเหมือนคำตอบแบบทีละขั้นของ Fable 5 และเทรนให้ Qwen สร้างเอาต์พุตที่มีโครงสร้างใกล้เคียงกัน โมเดลพารามิเตอร์ 27 พันล้านที่ได้ถูกออกแบบให้เข้ากับโครงสร้างการทำตามคำสั่งของ Fable 5 ทำให้ให้ผลลัพธ์ที่มีคำแนะนำมากขึ้น อธิบายได้มากขึ้น และมีการทำงานแบบทีละขั้นมากกว่าโมเดล Qwen เวอร์ชันฐาน

โมเดลนี้รันในรูปแบบ GGUF ซึ่งเป็นไฟล์ที่ถูกบีบอัดและรองรับกับ LM Studio และ llama.cpp เวอร์ชันที่ quantized เป็น Q4 ต้องใช้พื้นที่เก็บประมาณ 16.5 GB การประมวลผลทั้งหมดเกิดขึ้นในเครื่องโดยไม่ส่งข้อมูลไปยังเซิร์ฟเวอร์ภายนอก จึงตัดความจำเป็นตามข้อบังคับเรื่องการเก็บรักษาข้อมูล 30 วัน ซึ่ง Fable 5 กำหนดกับทราฟฟิกทั้งหมด รวมถึงลูกค้าองค์กรที่เคยมีข้อตกลงไม่เก็บข้อมูลเป็นศูนย์อยู่ก่อนแล้ว

Abliteration Process Removes Refusal Mechanisms

Huihui-ai ใช้เทคนิค abliteraton เพื่อสร้าง Huihui-Qwable-3.6-27b-abliterated ซึ่งเป็นเวอร์ชันที่ตัดพฤติกรรมการปฏิเสธของโมเดล กระบวนการนี้ระบุ “ทิศทางการปฏิเสธ” ที่ฝังอยู่ในน้ำหนักของโมเดลโดยรันโมเดลกับพรอมต์จำนวนมากที่เป็นอันตรายและไม่เป็นอันตราย วัดความแตกต่างของการกระตุ้นภายใน (internal activations) จากนั้นปรับน้ำหนักเพื่อกำจัดความแตกต่างนั้น หลังจากทำ abliteraton แล้ว โมเดลจะไม่มีสัญญาณทางคณิตศาสตร์ที่ใช้กระตุ้นการตอบกลับแบบปฏิเสธอีกต่อไป

Huihui-ai ใช้เทคนิคนี้โดยตรงกับไฟล์ Qwable GGUF ผ่าน llama.cpp's cvector-generator โดยไม่ต้องมีสภาพแวดล้อม Python ไม่ต้อง retrain น้ำหนักทั้งหมด และไม่ต้องเช่าเซิร์ฟเวอร์ กระบวนการนี้แตกต่างจากการเจาะผ่าน (jailbreaking) เพราะเป็นการดัดแปลงสถาปัตยกรรมของโมเดลแบบถาวร แทนที่จะใช้ประโยชน์จากช่องโหว่ของพรอมต์ การ์ดโมเดลระบุว่าเวอร์ชันที่ผ่าน abliteraton ใช้สำหรับงานวิจัยและสภาพแวดล้อมที่ควบคุมเท่านั้น โดยความรับผิดชอบด้านกฎหมายและจริยธรรมตกอยู่ที่ผู้ใช้ทั้งหมด

Available Builds and Hardware Requirements

Qwable ที่ผ่าน abliteraton มีให้ดาวน์โหลดบน Hugging Face ใน 3 แบบ แบบที่แนะนำ Q4_K_M_Q8 หนักประมาณ 19 GB และถือเป็นตัวเลือกที่เล็กที่สุดและเหมาะกับผู้ใช้ทั่วไปที่สุด เวอร์ชันที่รองรับการทำนายหลายโทเคนมีไว้สำหรับระบบที่มีทรัพยากรคอมพิวเตชันเพียงพอ ซึ่งช่วยให้สร้างคำตอบได้เร็วขึ้น ทั้ง Qwable แบบมาตรฐานและเวอร์ชันที่ผ่าน abliteraton รันบนฮาร์ดแวร์ผู้บริโภคได้ผ่านรันไทม์ภายในเครื่อง เช่น LM Studio

Use Cases for Standard and Abliterated Versions

Qwable แบบมาตรฐานเหมาะกับงานช่วยเขียนโค้ด การดีบักเชิงเทคนิค และเวิร์กโฟลว์ที่ต้องใช้โมเดลซึ่งแสดงกระบวนการให้เหตุผลมากกว่าการให้คำตอบตรง ๆ โดยรันได้ในชุดตั้งค่าแบบ local agent และรันไทม์ภายในเครื่องส่วนใหญ่ เวอร์ชันที่ผ่าน abliteraton ใช้สำหรับนักวิจัยด้านความปลอดภัยที่ต้องการพฤติกรรมดิบของโมเดลโดยไม่ผ่านการกรองฝั่งผู้ให้บริการ สายงานสร้างไปป์ไลน์ข้อมูลสังเคราะห์ที่ต้องการเอาต์พุตในหัวข้อที่อ่อนไหว และงานประเมินที่ทดสอบความสามารถของโมเดลโดยไม่ถูกรบกวนด้วยนโยบายคอนเทนต์ การ์ดโมเดลเตือนว่าการลดการกรองด้านความปลอดภัยทำให้ผลลัพธ์อาจมีความละเอียดอ่อน เป็นที่ถกเถียง หรือไม่เหมาะสม

FAQ

Qwable 27B คืออะไร และปล่อยเมื่อไหร่?

Qwable 27B เป็นการปรับแต่งแบบ full fine-tune ของ Qwen3.6-27B ของ Alibaba ที่เทรนบนชุดข้อมูลการให้เหตุผลสไตล์ Fable 5 โดยประกาศโดยนักพัฒนา Mia เมื่อวันที่ 15 มิถุนายน 2026 โมเดลนี้รันภายในเครื่องในรูปแบบ GGUF และในการ build ที่ quantized เป็น Q4 ต้องใช้พื้นที่ประมาณ 16.5 GB

เวอร์ชันที่ผ่าน abliteraton แตกต่างจากโมเดล Qwable แบบมาตรฐานอย่างไร?

เวอร์ชันที่ผ่าน abliteraton ซึ่งสร้างโดย Huihui-ai จะตัดพฤติกรรมการปฏิเสธออกด้วยการปรับน้ำหนักโมเดลโดยใช้ llama.cpp's cvector-generator กระบวนการนี้กำจัดสัญญาณทางคณิตศาสตร์ที่ใช้กระตุ้นการตอบกลับแบบปฏิเสธ ส่งผลให้ได้โมเดลที่ประมวลผลพรอมต์ทั้งหมดโดยไม่ต้องกรองคอนเทนต์ ขณะยังคงฟังก์ชันเต็มรูปแบบไว้

ข้อกำหนดด้านฮาร์ดแวร์สำหรับการรันโมเดล Qwable มีอะไรบ้าง?

เวอร์ชันที่ quantized เป็น Q4 ต้องใช้พื้นที่เก็บประมาณ 16.5 GB ส่วนเวอร์ชัน abliterated ที่แนะนำ Q4_K_M_Q8 หนักราว 19 GB ทั้งสองโมเดลรันบนฮาร์ดแวร์ผู้บริโภคผ่านรันไทม์ภายในเครื่องอย่าง LM Studio หรือ llama.cpp โดยมีเวอร์ชันที่รองรับการทำนายหลายโทเคนสำหรับระบบที่มีคอมพิวเตชันสูงกว่า

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น