Qwable 27B: نموذج ذكاء اصطناعي محلي يعيد إنتاج استدلالات Fable 5 على أجهزة المستهلكين

أطلقت المطوّرة Mia إصدار Qwable 27B على Hugging Face، وهو ضبطٌ كامل (fine-tune) لمعيار Qwen3.6-27B من Alibaba تم تدريبه على مجموعة بيانات للاستدلال بأسلوب Fable 5، وذلك بعد إعلان في 15 يونيو 2026. يُحاكي النموذج نهج التفكير المُهيكل الخاص بـ Fable 5 لدى Anthropic، بينما يعمل بالكامل على العتاد المحلي دون تكاليف واجهات برمجة تطبيقات ودون سياسات إلزامية للاحتفاظ بالبيانات. بعد وقت قصير، أطلق مساهم برمجيات مفتوحة المصدر Huihui-ai نسخة مخففة (abliterated) تُزيل سلوك الرفض المضمّن عبر تعديل أوزان النموذج باستخدام أداة cvector-generator التابعة لـ llama.cpp. جاءت الإصدارات عقب أسبوع أمرت فيه حكومة الولايات المتحدة بسحب Fable 5 لجميع الرعايا الأجانب، على خلفية نتيجة اختراق (jailbreak) محل نزاع. يوفر كلا متغيري Qwable بدائل محلية لخدمات الذكاء الاصطناعي السحابية، ما يلغي اعتماد الخوادم ومتطلبات معالجة بيانات طرف ثالث.

بنية Qwable 27B ومنهجية التدريب

يُعدّ Qwable 27B ضبطًا كاملاً لمعيار Qwen3.6-27B الأساسي من Alibaba تم إنشاؤه بواسطة المطوّرة Mia على مجموعة بيانات من أمثلة الاستدلال بأسلوب Fable 5. تتمثل منهجية التدريب في الضبط التعليمي على أمثلة على نمط تتبّع (trace)، حيث جمع المطوّر أمثلة مُهيكلة على غرار إجابات Fable 5 خطوة بخطوة، ودرّب Qwen لإنتاج مخرجات مشابهة في البنية. يتمثل الهدف في نموذج بمعلمات تبلغ 27 مليار مع مراعاة بنية اتباع التعليمات في Fable 5، لتقديم مخرجات أكثر إرشادًا وشرحًا وإتمام المهام خطوة بخطوة من نموذج Qwen الأساسي.

يعمل النموذج بصيغة GGUF، وهي نوع ملفات مضغوطة متوافق مع LM Studio وllama.cpp. يتطلب إصدار الكَمّ Q4 المُكمّم تقريبًا 16.5 جيغا بايت من التخزين. تحدث كل المعالجة محليًا دون إرسال البيانات إلى خوادم خارجية، ما يُلغي شرط الاحتفاظ الإلزامي لمدة 30 يومًا الذي فرضه Fable 5 على كل حركة مرور، بما في ذلك العملاء من المؤسسات الذين لديهم اتفاقيات سابقة بدون احتفاظ بالبيانات مطلقًا.

عملية التلطيف (Abliteration) تزيل آليات الرفض

طبّق Huihui-ai عملية abliteration لإنتاج Huihui-Qwable-3.6-27b-abliterated، وهي نسخة تلغي سلوك رفض النموذج. تحدد العملية اتجاه الرفض المُضمّن في أوزان النموذج عبر تشغيله على مجموعات كبيرة من موجهات ضارة وأخرى غير ضارة، وقياس الفروقات في التنشيطات الداخلية، ثم تعديل الأوزان لإزالة ذلك الفرق. بعد abliteration، لم يعد يتضمن النموذج إشارات رياضية تُحفّز استجابات الرفض.

طبّق Huihui-ai التقنية مباشرة على Qwable بصيغة GGUF باستخدام cvector-generator من llama.cpp، دون الحاجة إلى بيئة بايثون أو إعادة تدريب كاملة للأوزان أو خوادم مستأجرة. تختلف العملية عن التحايل (jailbreaking) من حيث إنها تعدل بنية النموذج بشكل دائم بدلًا من استغلال ثغرات في الموجهات. يوضح نموذج البطاقة (model card) أن النسخة المُلطّفة مخصصة للأبحاث والبيئات الخاضعة للضبط فقط، مع تحمل المسؤولية القانونية والأخلاقية بالكامل على عاتق المستخدمين.

الإصدارات المتاحة ومتطلبات العتاد

تتوفر نسخة Qwable المُلطّفة على Hugging Face بثلاثة إصدارات. يزن إصدار Q4_K_M_Q8 الموصى به تقريبًا 19 جيغا بايت ويمثل أصغر خيار وأكثره ملاءمة للاستهلاك لدى المستخدمين العاديين. يتوفر إصدار يدعم التنبؤ متعدد الرموز (multi-token prediction) للأنظمة التي تتوفر لديها موارد حوسبة كافية، ما يتيح توليد استجابات أسرع. يعمل كل من Qwable القياسي ونسخته المُلطّفة على عتاد المستهلك عبر بيئات تشغيل محلية مثل LM Studio.

حالات استخدام النسخة القياسية والنسخة المُلطّفة

يناسب Qwable القياسي المساعدة في البرمجة والتشخيص التقني وسير العمل التي تحتاج إلى نماذج تُظهر عمليات الاستدلال بدلًا من تقديم إجابات مباشرة. يعمل في إعدادات الوكلاء المحلية ومعظم بيئات التشغيل المحلية. تخدم النسخة المُلطّفة الباحثين في مجال الأمن الذين يحتاجون إلى سلوك النموذج الخام دون تصفية على مستوى المزود، وخطوط إنتاج للبيانات التركيبية التي تتطلب مخرجات حول موضوعات حساسة، وأعمال التقييم لاختبار قدرات النموذج دون تدخل سياسات المحتوى. تحذر بطاقة النموذج من أن تقليل التصفية الأمنية يعني أن المخرجات قد تكون حساسة أو مثيرة للجدل أو غير مناسبة.

الأسئلة الشائعة

ما هو Qwable 27B ومتى تم إصداره؟

Qwable 27B هو ضبطٌ كامل (fine-tune) لمعيار Qwen3.6-27B من Alibaba تم تدريبه على مجموعة بيانات للاستدلال بأسلوب Fable 5، وأعلن عنه المطوّر Mia في 15 يونيو 2026. يعمل النموذج محليًا بصيغة GGUF ويتطلب حوالي 16.5 جيغا بايت في إصدار الكَم Q4 المُكمّم.

كيف تختلف النسخة المُلطّفة عن نموذج Qwable القياسي؟

تُزيل النسخة المُلطّفة، التي أنشأها Huihui-ai، سلوك الرفض عبر تعديل أوزان النموذج باستخدام cvector-generator التابعة لـ llama.cpp. تقضي العملية على الإشارات الرياضية التي تُحفّز استجابات الرفض، ما ينتج نموذجًا يعالج جميع الموجهات دون تصفية محتوى مع الحفاظ على الوظائف الكاملة.

ما متطلبات العتاد لتشغيل نماذج Qwable؟

يتطلب إصدار Q4 المُكمّم حوالي 16.5 جيغا بايت من التخزين، بينما تزن النسخة المُلطّفة الموصى بها Q4_K_M_Q8 نحو 19 جيغا بايت. يعمل كلا النموذجين على عتاد المستهلك عبر بيئات تشغيل محلية مثل LM Studio أو llama.cpp، وتتوافر نسخة تدعم التنبؤ متعدد الرموز للأنظمة التي تمتلك قدرة حوسبية أعلى.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات