DeepSeek implantou seu framework de aceleração de amostragem especulativa DSpark para os serviços de produção do DeepSeek-V4, após um relatório técnico conjunto com a Universidade de Pequim. O DSpark aumenta a velocidade de geração em 60% a 85% para a versão Flash e 57% a 78% para a versão Pro, sem comprometer a qualidade da saída.
DeepSeek disponibilizou como código aberto o conjunto completo do DeepSpec, juntamente com o framework. O DeepSpec oferece suporte a modelos populares de código aberto, incluindo Qwen3 e Gemma, fornecendo aos desenvolvedores um conjunto completo de ferramentas Python para treinar módulos de aceleração personalizados localmente.