Qwable 27B: локальна AI-модель відтворює міркування Fable 5 на споживчому обладнанні

Розробниця Mia випустила Qwable 27B на Hugging Face: повне донавчання (full fine-tune) базової моделі Alibaba Qwen3.6-27B на датасеті міркувань у стилі Fable 5, після оголошення 15 червня 2026 року. Модель відтворює структурований підхід до мислення Anthropic Fable 5, повністю працюючи на локальному обладнанні без API-витрат і без обов’язкових політик збереження даних. Невдовзі відкритий співавтор Huihui-ai опублікував «аблітеровану» версію, яка прибирає вбудовану поведінку відмови, змінюючи ваги моделі за допомогою cvector-generator з llama.cpp. Релізи відбулися після тижня, протягом якого уряд США наказав відкликати Fable 5 для всіх іноземних громадян через спірне відкриття джейлбрейку. Обидва варіанти Qwable пропонують локальні альтернативи хмарним сервісам ШІ, усуваючи залежність від серверів і вимоги до обробки даних третіми сторонами.

Архітектура Qwable 27B і методологія тренування

Qwable 27B — це повне донавчання базової моделі Alibaba Qwen3.6-27B, створене розробницею Mia на датасеті прикладів міркувань у стилі Fable 5. Підхід до тренування — instruction fine-tuning на прикладах у стилі trace, де розробниця зібрала приклади, відформатовані як покрокові відповіді Fable 5, і навчила Qwen створювати схожі структури виходу. Отримана модель із 27 мільярдами параметрів орієнтується на інструкційно-відповідну структуру Fable 5, забезпечуючи більш спрямовані, пояснювальні та покрокові виходи виконання задач, ніж базова модель Qwen.

Модель працює у форматі GGUF — стислому типі файлу, сумісному з LM Studio та llama.cpp. Квантований білд Q4 потребує приблизно 16,5 GB пам’яті зберігання. Уся обробка відбувається локально без надсилання даних на зовнішні сервери, усуваючи обов’язкову вимогу 30 днів збереження даних, яку Fable 5 встановив для всього трафіку, включно з корпоративними клієнтами з попередніми угодами про нульове утримання.

Процес аблітерації прибирає механізми відмови

Huihui-ai застосував аблітерацію, щоб створити Huihui-Qwable-3.6-27b-abliterated — варіант, який усуває поведінку відмови моделі. Процес визначає напрям відмови, вбудований у ваги моделі, проганяючи модель на великих масивах шкідливих і нешкідливих запитів, вимірюючи різницю в її внутрішніх активаціях, а потім змінюючи ваги, щоб прибрати цю різницю. Після аблітерації модель більше не містить математичних сигналів, які запускають відповіді відмови.

Huihui-ai застосував техніку безпосередньо до Qwable GGUF через cvector-generator з llama.cpp, не потребуючи Python-середовища, повного перетренування ваг або орендованих серверів. Процес відрізняється від джейлбрейкінгу тим, що вносить постійні зміни в архітектуру моделі, а не експлуатує вразливості підказок. У картці моделі зазначено, що аблітерована версія призначена лише для досліджень і контрольованих середовищ, а юридична та етична відповідальність повністю покладається на користувачів.

Доступні білди та вимоги до апаратного забезпечення

Аблітерований Qwable доступний на Hugging Face у трьох білдах. Рекомендована версія Q4_K_M_Q8 важить приблизно 19 GB і є найменшим та найбільш зручним для споживачів варіантом. Версія з підтримкою передбачення мульти-токенів доступна для систем із достатніми обчислювальними ресурсами, забезпечуючи швидше формування відповіді. Обидва — стандартний Qwable і аблітерований варіант — працюють на споживчому обладнанні через локальні середовища виконання на кшталт LM Studio.

Варіанти використання для стандартної та аблітерованої версій

Стандартний Qwable підходить для допомоги в програмуванні, технічного дебагу та робочих процесів, які потребують моделей, що демонструють процеси міркування, а не генерують прямі відповіді. Він працює в локальних агентних налаштуваннях і в більшості локальних середовищ виконання. Аблітерована версія призначена для дослідників безпеки, яким потрібна «сиріша» поведінка моделі без фільтрації з боку провайдера, для конвеєрів синтетичних даних, яким потрібні виходи на чутливі теми, та для оцінювальних робіт, що тестують можливості моделі без втручання контентних політик. Картка моделі попереджає, що зменшене фільтрування безпеки означає: виходи можуть бути чутливими, суперечливими або невідповідними.

FAQ

Що таке Qwable 27B і коли його випустили?

Qwable 27B — це повне донавчання Alibaba Qwen3.6-27B на датасеті міркувань у стилі Fable 5, оголошене розробницею Mia 15 червня 2026 року. Модель працює локально у форматі GGUF і потребує приблизно 16,5 GB у своєму квантованому білді Q4.

Чим аблітерована версія відрізняється від стандартної моделі Qwable?

Аблітерована версія, створена Huihui-ai, прибирає поведінку відмови, змінюючи ваги моделі за допомогою cvector-generator з llama.cpp. Процес усуває математичні сигнали, які запускають відповіді відмови, внаслідок чого модель обробляє всі запити без фільтрації контенту, зберігаючи повну функціональність.

Які вимоги до апаратного забезпечення для запуску моделей Qwable?

Квантований білд Q4 потребує приблизно 16,5 GB пам’яті зберігання, тоді як рекомендована аблітерована версія Q4_K_M_Q8 важить близько 19 GB. Обидві моделі працюють на споживчому обладнанні через локальні середовища на кшталт LM Studio або llama.cpp, при цьому доступна версія з передбаченням мульти-токенів для систем із вищою обчислювальною потужністю.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів