A desenvolvedora Mia lançou o Qwable 27B no Hugging Face, um fine-tune completo do Qwen3.6-27B da Alibaba treinado em um dataset de raciocínio no estilo Fable 5, seguindo um anúncio de 15 de junho de 2026. O modelo replica a abordagem de pensamento estruturado do Fable 5 da Anthropic enquanto roda inteiramente em hardware local, sem custos de API nem políticas obrigatórias de retenção de dados. Pouco depois, o colaborador open-source Huihui-ai lançou uma versão abliterada que remove o comportamento de recusa embutido ao modificar os pesos do modelo usando o cvector-generator do llama.cpp. Os lançamentos foram precedidos por uma semana em que o governo dos EUA ordenou que o Fable 5 fosse retirado para todos os nacionais estrangeiros após uma alegação contestada de jailbreak. As duas variantes do Qwable oferecem alternativas locais a serviços de IA baseados na nuvem, eliminando dependências de servidor e a necessidade de processamento de dados por terceiros.
O Qwable 27B é um fine-tune completo do modelo base Qwen3.6-27B da Alibaba, construído pela desenvolvedora Mia com um dataset de exemplos de raciocínio no estilo Fable 5. A abordagem de treinamento é instruction fine-tuning em exemplos no estilo trace, em que a desenvolvedora coletou exemplos formatados como respostas passo a passo do Fable 5 e treinou o Qwen para produzir estruturas de saída semelhantes. O modelo resultante, com 27 bilhões de parâmetros, mira a estrutura de seguir instruções do Fable 5, gerando saídas mais guiadas, explicativas e passo a passo para conclusão de tarefas do que o modelo Qwen base.
O modelo roda no formato GGUF, o tipo de arquivo compactado compatível com LM Studio e llama.cpp. A versão quantizada Q4 exige aproximadamente 16,5 GB de armazenamento. Todo o processamento ocorre localmente, sem enviar dados a servidores externos, eliminando a exigência obrigatória de retenção de dados por 30 dias que o Fable 5 impôs a todo o tráfego, inclusive para clientes corporativos com acordos anteriores de zero retenção.
A Huihui-ai aplicou a abliteração para produzir o Huihui-Qwable-3.6-27b-abliterated, uma variante que elimina o comportamento de recusa do modelo. O processo identifica uma direção de recusa incorporada nos pesos do modelo ao rodar o modelo em grandes conjuntos de prompts prejudiciais e inofensivos, medindo diferenças em ativações internas, e então modificando os pesos para eliminar essa diferença. Após a abliteração, o modelo não contém mais os sinais matemáticos que disparam respostas de recusa.
A Huihui-ai aplicou a técnica diretamente no Qwable GGUF usando o cvector-generator do llama.cpp, sem exigir ambiente Python, retrain completo dos pesos ou servidores alugados. O processo difere de jailbreak ao modificar permanentemente a arquitetura do modelo em vez de explorar vulnerabilidades de prompt. O card do modelo especifica que a versão abliterada é apenas para pesquisa e ambientes controlados, com responsabilidade legal e ética recaindo inteiramente sobre os usuários.
O Qwable abliterado está disponível no Hugging Face em três builds. A versão recomendada Q4_K_M_Q8 pesa aproximadamente 19 GB e representa a opção menor e mais amigável para consumidores. Uma versão que oferece previsão multi-token está disponível para sistemas com recursos computacionais suficientes, permitindo geração de respostas mais rápida. Tanto o Qwable padrão quanto a variante abliterada rodam em hardware de consumidor por meio de runtimes locais como LM Studio.
O Qwable padrão é adequado para assistência em programação, depuração técnica e fluxos de trabalho que exigem modelos que exibam processos de raciocínio em vez de produzir respostas diretas. Ele roda em configurações locais de agentes e na maioria dos runtimes locais. A versão abliterada atende pesquisadores de segurança que precisam do comportamento bruto do modelo sem filtragem do lado do provedor, pipelines de dados sintéticos que precisam de saídas sobre tópicos sensíveis e trabalhos de avaliação testando as capacidades do modelo sem interferência das políticas de conteúdo. O card do modelo alerta que a redução da filtragem de segurança significa que as saídas podem ser sensíveis, controversas ou inadequadas.
O que é Qwable 27B e quando foi lançado?
Qwable 27B é um fine-tune completo do Qwen3.6-27B da Alibaba treinado em um dataset de raciocínio no estilo Fable 5, anunciado pela desenvolvedora Mia em 15 de junho de 2026. O modelo roda localmente no formato GGUF e exige aproximadamente 16,5 GB na sua build quantizada Q4.
Como a versão abliterada difere do modelo Qwable padrão?
A versão abliterada, criada pela Huihui-ai, remove o comportamento de recusa ao modificar os pesos do modelo usando o cvector-generator do llama.cpp. O processo elimina os sinais matemáticos que disparam respostas de recusa, resultando em um modelo que processa todos os prompts sem filtragem de conteúdo enquanto mantém funcionalidade completa.
Quais são os requisitos de hardware para rodar modelos Qwable?
A build quantizada Q4 exige aproximadamente 16,5 GB de armazenamento, enquanto a versão abliterada recomendada Q4_K_M_Q8 pesa cerca de 19 GB. Ambos os modelos rodam em hardware de consumidor por meio de runtimes locais como LM Studio ou llama.cpp, com uma versão de previsão multi-token disponível para sistemas com maior capacidade computacional.
Notícias relacionadas
Backblaze assina um acordo de armazenamento $335M CoreWeave à medida que a demanda por infraestrutura de IA dispara
O modelo GLM-5.2 da z.AI ganha atenção do mercado com alto desempenho e baixo custo
Ações do conceito de grandes modelos para o mercado de Hong Kong caem, Zhipu despenca 14,11% durante o pregão
YZi Labs lidera rodada de investimento inicial, e o Renaiss Protocol atinge mais de 20 milhões em receita em 6 meses
As restrições de acesso à IA da Anthropic mudam o foco do cripto para a IA descentralizada