Згідно з AI-звітом Jefferies, опублікованим 22 червня, китайські AI-моделі спожили 18,8 трильйона токенів за тиждень, що завершився 22 червня, перевищивши показники моделей США на 5,8 трильйона. DeepSeek V4 Flash посів перше місце з 4,94 трильйона токенів, далі йшли MiMo-V2.5 від Xiaomi, MiniMax M3 і Qwen від Tencent. Дані OpenRouter показали, що споживання токенів на рівні платформ зросло на 4,7% тиждень-до-тижня до 46,7 трильйона.
Зміна відображає конкурентний баланс китайських моделей між продуктивністю та вартістю. Jefferies зазначив, що китайські моделі вже звузили розрив в інтелектуальністі з американськими аналогами, водночас пропонуючи витрати на API на частку від американських альтернатив — це пояснюють архітектурою MoE та оптимізованими механізмами уваги. Промислові витрати залишалися стриманими: індекс витрат Jefferies LLM Token Expenditure Index становив 1,64–1,68 станом на 14–19 червня, знизившись із 2,04 станом на 31 травня, що вказує на те, що розробники переходили на дешевші та ефективніші моделі.