开发者 Mia 在 Hugging Face 发布了 Qwable 27B,这是对阿里巴巴 Qwen3.6-27B 的完整微调,使用了 Fable 5 风格推理数据集进行训练,并延续了 2026 年 6 月 15 日的公告。该模型在完全依赖本地硬件运行、无需 API 费用、也不执行强制数据保留政策的情况下,复刻了 Anthropic 的 Fable 5 所采用的结构化思考方式。不久之后,开源贡献者 Huihui-ai 发布了一个消融版,通过使用 llama.cpp 的 cvector-generator 修改模型权重,移除了内置的拒绝行为。上述发布发生在一周之后:在该期间,U.S. government 下令将 Fable 5 撤下,原因是存在一起存在争议的越狱认定,波及所有外国国民。两种 Qwable 变体都为基于云的 AI 服务提供了本地替代方案,消除了对服务器的依赖以及第三方数据处理需求。
Qwable 27B 架构与训练方法
Qwable 27B 是开发者 Mia 基于阿里巴巴 Qwen3.6-27B 基座模型进行的完整微调,训练数据集由 Fable 5 风格推理示例构成。该训练方法采用指令微调,基于 trace 风格示例:开发者收集了类似 Fable 5 逐步回答的格式化示例,并训练 Qwen 生成相似的输出结构。最终得到的是一个 270 亿参数的模型,目标是对齐 Fable 5 的指令跟随结构,其生成的内容比基础 Qwen 模型更具引导性、更具解释性,并以逐步形式完成任务输出。
该模型以 GGUF 格式运行,这是与 LM Studio 和 llama.cpp 兼容的压缩文件类型。Q4 量化构建需要大约 16.5 GB 的存储空间。所有处理都在本地完成,不会向外部服务器发送数据,从而消除了 Fable 5 对所有流量(包括此前已达成零保留协议的企业客户)强制施加的 30 天数据保留要求。
消融流程移除拒绝机制
Huihui-ai 对模型进行了消融,生成了 Huihui-Qwable-3.6-27b-abliterated,这是一种消除了模型拒绝行为的变体。该流程通过在大量有害与无害提示上运行模型,识别嵌入在模型权重中的拒绝方向,并测量内部激活的差异,然后修改权重以消除该差异。消融之后,模型不再包含触发拒绝响应的数学信号。
Huihui-ai 使用 llama.cpp 的 cvector-generator 直接对 Qwable 的 GGUF 应用了该技术,无需 Python 环境、无需全权重重训,也无需租用服务器。该流程与越狱不同之处在于:它是对模型架构进行永久性修改,而不是利用提示漏洞。模型卡说明,该消融版本仅用于研究与受控环境,法律与伦理责任完全由用户承担。
可用构建与硬件需求
消融版 Qwable 可在 Hugging Face 以三种构建方式获取。推荐的 Q4_K_M_Q8 版本重量约为 19 GB,是最小、最适合普通消费者的选项。针对具备足够计算资源的系统,还提供了支持多 token 预测的版本,可实现更快的响应生成。标准 Qwable 以及消融版都可以通过 LM Studio 等本地运行时在消费级硬件上运行。
标准与消融版本的使用场景
标准 Qwable 适用于代码辅助、技术调试,以及需要展示推理过程而非直接给出答案的工作流。它适用于本地代理式部署以及大多数本地运行时。消融版用于需要原始模型行为的安全研究人员,适用于不经过提供方侧过滤的场景;也适用于需要在敏感主题上生成输出的合成数据流水线,以及用于在不受内容政策干扰下测试模型能力的评估工作。模型卡警告:由于安全过滤降低,输出可能变得敏感、具有争议或不适当。
常见问题
什么是 Qwable 27B,何时发布?
Qwable 27B 是对阿里巴巴 Qwen3.6-27B 的完整微调,训练于 Fable 5 风格推理数据集;由开发者 Mia 于 2026 年 6 月 15 日宣布。该模型以 GGUF 格式在本地运行,其 Q4 量化构建约需要 16.5 GB 的存储空间。
消融版与标准 Qwable 模型有什么不同?
由 Huihui-ai 创建的消融版通过使用 llama.cpp 的 cvector-generator 修改模型权重,移除了拒绝行为。该流程消除了触发拒绝响应的数学信号,从而得到一个能够处理所有提示且不进行内容过滤,同时保持完整功能的模型。
运行 Qwable 模型需要哪些硬件要求?
Q4 量化构建约需要 16.5 GB 的存储空间,而推荐的 Q4_K_M_Q8 消融版重量约为 19 GB。两种模型都可以通过 LM Studio 或 llama.cpp 等本地运行时在消费级硬件上运行,并提供了适用于计算能力更高系统的多 token 预测版本。