Qwable 27B：本地 AI 模型在消费级硬件上复制 Fable 5 推理

2026-06-23 22:12:28

开发者 Mia 在 Hugging Face 发布了 Qwable 27B，这是对阿里巴巴 Qwen3.6-27B 的完整微调，使用了 Fable 5 风格推理数据集进行训练，并延续了 2026 年 6 月 15 日的公告。该模型在完全依赖本地硬件运行、无需 API 费用、也不执行强制数据保留政策的情况下，复刻了 Anthropic 的 Fable 5 所采用的结构化思考方式。不久之后，开源贡献者 Huihui-ai 发布了一个消融版，通过使用 llama.cpp 的 cvector-generator 修改模型权重，移除了内置的拒绝行为。上述发布发生在一周之后：在该期间，U.S. government 下令将 Fable 5 撤下，原因是存在一起存在争议的越狱认定，波及所有外国国民。两种 Qwable 变体都为基于云的 AI 服务提供了本地替代方案，消除了对服务器的依赖以及第三方数据处理需求。

Qwable 27B 架构与训练方法

Qwable 27B 是开发者 Mia 基于阿里巴巴 Qwen3.6-27B 基座模型进行的完整微调，训练数据集由 Fable 5 风格推理示例构成。该训练方法采用指令微调，基于 trace 风格示例：开发者收集了类似 Fable 5 逐步回答的格式化示例，并训练 Qwen 生成相似的输出结构。最终得到的是一个 270 亿参数的模型，目标是对齐 Fable 5 的指令跟随结构，其生成的内容比基础 Qwen 模型更具引导性、更具解释性，并以逐步形式完成任务输出。

该模型以 GGUF 格式运行，这是与 LM Studio 和 llama.cpp 兼容的压缩文件类型。Q4 量化构建需要大约 16.5 GB 的存储空间。所有处理都在本地完成，不会向外部服务器发送数据，从而消除了 Fable 5 对所有流量（包括此前已达成零保留协议的企业客户）强制施加的 30 天数据保留要求。

消融流程移除拒绝机制

Huihui-ai 对模型进行了消融，生成了 Huihui-Qwable-3.6-27b-abliterated，这是一种消除了模型拒绝行为的变体。该流程通过在大量有害与无害提示上运行模型，识别嵌入在模型权重中的拒绝方向，并测量内部激活的差异，然后修改权重以消除该差异。消融之后，模型不再包含触发拒绝响应的数学信号。

Huihui-ai 使用 llama.cpp 的 cvector-generator 直接对 Qwable 的 GGUF 应用了该技术，无需 Python 环境、无需全权重重训，也无需租用服务器。该流程与越狱不同之处在于：它是对模型架构进行永久性修改，而不是利用提示漏洞。模型卡说明，该消融版本仅用于研究与受控环境，法律与伦理责任完全由用户承担。

可用构建与硬件需求

消融版 Qwable 可在 Hugging Face 以三种构建方式获取。推荐的 Q4_K_M_Q8 版本重量约为 19 GB，是最小、最适合普通消费者的选项。针对具备足够计算资源的系统，还提供了支持多 token 预测的版本，可实现更快的响应生成。标准 Qwable 以及消融版都可以通过 LM Studio 等本地运行时在消费级硬件上运行。

标准与消融版本的使用场景

标准 Qwable 适用于代码辅助、技术调试，以及需要展示推理过程而非直接给出答案的工作流。它适用于本地代理式部署以及大多数本地运行时。消融版用于需要原始模型行为的安全研究人员，适用于不经过提供方侧过滤的场景；也适用于需要在敏感主题上生成输出的合成数据流水线，以及用于在不受内容政策干扰下测试模型能力的评估工作。模型卡警告：由于安全过滤降低，输出可能变得敏感、具有争议或不适当。

常见问题

什么是 Qwable 27B，何时发布？

Qwable 27B 是对阿里巴巴 Qwen3.6-27B 的完整微调，训练于 Fable 5 风格推理数据集；由开发者 Mia 于 2026 年 6 月 15 日宣布。该模型以 GGUF 格式在本地运行，其 Q4 量化构建约需要 16.5 GB 的存储空间。

消融版与标准 Qwable 模型有什么不同？

由 Huihui-ai 创建的消融版通过使用 llama.cpp 的 cvector-generator 修改模型权重，移除了拒绝行为。该流程消除了触发拒绝响应的数学信号，从而得到一个能够处理所有提示且不进行内容过滤，同时保持完整功能的模型。

运行 Qwable 模型需要哪些硬件要求？

Q4 量化构建约需要 16.5 GB 的存储空间，而推荐的 Q4_K_M_Q8 消融版重量约为 19 GB。两种模型都可以通过 LM Studio 或 llama.cpp 等本地运行时在消费级硬件上运行，并提供了适用于计算能力更高系统的多 token 预测版本。

View Source

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。