De acordo com o relatório de IA da Jefferies publicado a 22 de junho, os modelos de IA chineses consumiram 18,8 biliões de tokens na semana com termo a 22 de junho, ultrapassando os modelos dos EUA, que consumiram 5,8 biliões. O DeepSeek V4 Flash ficou em primeiro lugar com 4,94 biliões de tokens, seguido pelo MiMo-V2.5 da Xiaomi, MiniMax M3 e Qwen da Tencent. Os dados da OpenRouter mostraram que o consumo de tokens a nível de plataforma cresceu 4,7% em termos semanais, para 46,7 biliões.
A mudança reflete o equilíbrio competitivo dos modelos chineses entre desempenho e custo. A Jefferies referiu que os modelos chineses já estreitaram a diferença de inteligência face aos seus equivalentes dos EUA, ao mesmo tempo que oferecem custos de API a uma fração das alternativas americanas, o que é atribuído à arquitetura MoE e a mecanismos de atenção otimizados. A despesa das empresas manteve-se contida, com o Índice de Despesa de Tokens de LLM da Jefferies nos 1,64–1,68 entre 14 e 19 de junho, abaixo dos 2,04 de 31 de maio, indicando que os programadores migraram para modelos mais baratos e mais eficientes.