23 марта директор Национального бюро данных Лю Ли Хун объявил на Высшем форуме развития Китая шокирующие данные: среднесуточное количество вызовов AI Token в Китае выросло с 100 миллиардов в начале 2024 года до 100 триллионов к концу 2025 года, а в марте 2026 года превысило 140 триллионов, что более чем в тысячу раз за два года. В то же время данные крупнейшей глобальной платформы агрегирования API моделей ИИ OpenRouter показывают, что недельные вызовы крупных моделей Китая уже несколько недель подряд превосходят США, а три лидирующих места по глобальному объему вызовов занимают модели из Китая. Вспыхнула индустриальная революция, движимая Token, которая с беспрецедентной скоростью перестраивает глобальный технологический конкурентный ландшафт, бизнес-модели и даже национальные конкурентные преимущества.
В начале 2026 года в Кремниевой долине появились несколько новостей, привлекающих внимание мировой технологической элиты. Внутри OpenAI постепенно отказываются от использования почти 20-летнего ключевого показателя DAU (ежедневное активное число пользователей), переходя к TPD (Token Per Day — ежедневное потребление токенов) в качестве основного бизнес-показателя. Этот переход не случаен. Генеральный директор Nvidia Дженсен Хуанг на конференции GTC 2026 переопределил дата-центры как «фабрики токенов», указав, что будущее конкуренции — это «токеновая пропускная способность на ватт». Это не изолированный случай, а знак того, что новая интеллектуальная экономическая парадигма, основанная на Token как измерителе и торговой единице, полностью вступает в силу.
С точки зрения компьютерных наук, Token — это базовая единица обработки информации в моделях ИИ. Когда текст вводится в модель, он разбивается на слова или подслова; изображение — на пиксельные блоки; аудио — на временные сегменты. Эти неделимые базовые элементы можно назвать Token.
На практике измерение Token подчиняется определённым правилам. Для английского текста короткое слово может считаться одним Token, а более длинные — разбиваться на несколько. Простое эмпирическое правило: один Token примерно равен четырём английским символам. Для китайского текста обычно один иероглиф соответствует 1-2 Token. В процессе обучения модели, при обработке данных и при вызовах модели, каждое ключевое действие ИИ измеряется именно Token. Объём потреблённых Token напрямую отражает рабочую нагрузку модели и её ценность, что соответствует трудовой теории Маркса.
Главное достоинство Token — это предоставление количественной и сравнимой меры стоимости развития интеллектуальной экономики. По мере эволюции ИИ от текстовых модальностей к мультимодальным, а также в углублении применения в программировании, видео и научных исследованиях, стратегическая роль Token как «единого измерителя» становится всё более очевидной. Это не случайное решение, а закономерный результат развития отрасли: в индустриальную эпоху использовали «киловатт-час» для измерения электроэнергии, в эпоху интернета — «ГБ» для объёма данных, а в эпоху ИИ естественно использовать Token для измерения интеллектуального продукта. В экономике и бизнесе Token уже стал универсальной единицей, которая подлежит измерению, ценообразованию и торговле. Он связывает базовые ресурсы — энергию, вычислительные мощности, данные — с высшими уровнями — интеллектуальными сервисами, являясь универсальным мерилом производительности ИИ, расчёта затрат и расчетов по предоставлению AI-услуг.
Цепочка стоимости Token охватывает пять ключевых сегментов: производство аппаратного обеспечения, инфраструктурное строительство, предоставление вычислительных ресурсов, платформенный операторский бизнес и разработку приложений. В структуре затрат на производство основными статьями являются электроэнергия и амортизация оборудования, составляющие до 70–80%, что делает их ключевыми факторами международной конкурентоспособности Token. Показатель «Tokens per Watt» — токенов на ватт — становится основным индикатором конкурентоспособности AI-компаний. Это означает, что при фиксированном бюджете на электроэнергию тот, кто производит больше Token с меньшими затратами энергии, обладает минимальной себестоимостью и более сильными рыночными позициями.
По мере расширения сценариев использования методика измерения Token усложняется и переходит от простого подсчёта к многоаспектной, динамической системе взвешивания.
(1) Двоичная дифференциация входных и выходных данных. Самая базовая схема — это «входные Token» и «выходные Token». Входные Token — это информация, предоставленная пользователем модели (подсказки, загруженные документы, история диалогов), а выходные — сгенерированный моделью ответ. В коммерческом моделировании стоимость генерации часто в 3–5 раз выше стоимости входных Token, поскольку процесс требует значительных ресурсов памяти, пропускной способности и вычислительных циклов. Эта разница отражает фундаментальную разницу между «творческим трудом» и «чтением информации» в потреблении ресурсов.
(2) Измерение контекста и затраты на память. В 2024–2025 годах окна контекста крупных моделей выросли с 8K и 32K до 128K и даже 1 миллиона токенов. В 2026 году обработка сверхдлинных контекстов стала нормой. Однако длинный контекст — не бесплатный ресурс. Архитектура Transformer и механизм внимания (Attention) приводят к росту вычислительной сложности примерно по квадратичной или линейной зависимости. Поэтому современные системы вводят коэффициенты «веса контекста». Например, при диалоге с длиной в миллион Token, даже если ответ содержит всего 10 Token, система должна просканировать или извлечь огромную историю, что скрытое потребление учитывается как «активные контекстные Token». Это делает измерение более точным и отражает затраты на поддержание долгосрочной памяти модели.
(3) Tokenизация мультимодальных данных. С развитием мультимодальных больших моделей (LMM) изображения, видео и аудио также включены в систему измерения Token. Например, высокоразрешённое изображение разбивается на сотни визуальных патчей, каждый из которых кодируется как один или несколько визуальных Token. Минутное видео — на десятки тысяч временных визуальных Token. Такой унифицированный подход разрушает барьеры между модальностями, позволяя считать, например, генерацию 10-секундного видео эквивалентной написанию статьи на тысячу слов, что наглядно демонстрирует различия в информационной плотности.
(4) Скрытая ценность Token. С распространением AI-агентов (интеллектуальных систем) модель перестает отвечать однократно, а занимается автономным планированием, выполнением кода, рефлексией и многократным поиском. В этом процессе возникает множество промежуточных «мыслительных» Token, которые не показываются пользователю, но являются основой высокого качества результата. Новые стандарты измерения начинают различать «поверхностные» Token и «внутренние» — для логических рассуждений, научных расчетов и сложных цепочек мышления. В случае сложных задач внутренние Token могут быть в десятки раз больше конечных. Некоторые платформы уже экспериментируют с дифференцированным ценообразованием по числу шагов рассуждения или глубине цепочки мышления, что означает переход от подсчёта слов к оценке интеллектуальной сложности.
За последние годы развитие AI Token демонстрирует три ключевых тренда: экспоненциальный рост общего объема, экстремальное сжатие единиц измерения и сегментацию по ценностным уровням.
Тренд 1: взрывной рост потребления. В 2024 году глобальный суточный объем вызовов Token составлял около 100 миллиардов, а к первому кварталу 2026 года достиг 180 квадриллионов, что почти в 1800 раз больше. Такой рост — не линейное сложение, а результат качественного скачка в применениях. В начале доминировали диалоги человек-машина (чатботы), низкочастотные и поверхностные. В 2026 году основная роль принадлежит автономным агентам, которые при выполнении задач разбирают цели, вызывают инструменты, пишут и отлаживают код, проверяют результаты — и всё это может потреблять десятки или сотни тысяч Token. В будущем, с внедрением embodied AI (телесного ИИ), роботы каждую секунду будут воспринимать и принимать решения, превращая это в огромные потоки реальных Token, а к 2030 году суточное потребление может достигнуть квадриллионов.
Тренд 2: снижение стоимости единицы по закону Мура. Благодаря развитию аппаратных архитектур (например, массовое производство Nvidia Blackwell и последующих Rubin), оптимизации алгоритмов (смесь экспертов MoE, квантование, спекулятивное семплирование) и повышению эффективности кластерных систем, стоимость генерации одного высококачественного Token в 2026 году снизилась примерно в 100 раз по сравнению с 2023 годом. Этот эффект — парадокс Джевонса — в области ИИ проявляется ярко: повышение эффективности не уменьшает общий расход ресурсов, а стимулирует спрос. В будущем, с появлением фотонных вычислений, нейроморфных чипов и других революционных технологий, энергопотребление на Token может снизиться ещё сильнее, делая «бесконечный интеллект» теоретически возможным.
Тренд 3: сегментация и специализация ценности. В будущем рынок Token будет явно сегментирован: «стандартные» Token от универсальных моделей станут дешевыми и однородными, используемыми для базовых вопросов, переводов и классификаций; «продвинутые» Token, полученные после донастройки, с уникальными данными и глубокими рассуждениями, станут дорогими и редкими. Например, диагностические рекомендации медицинских моделей будут цениться гораздо выше, чем обычные чат-боты. Это создаст «фьючерсные рынки» и системы сертификации качества Token, за которые пользователи будут платить премию.
1. Объем производства и потребления: Китай обогнал США по суммарным показателям
Преимущество США в области ИИ — в дизайне чипов и возможностях моделей. Nvidia — абсолютный лидер GPU-рынка, рыночная капитализация выросла с конца 2022 года с примерно 300 миллиардов долларов до более 4 триллионов, рост в 14 раз. За этим стоит лидерство в передовых технологических процессах. В то же время закрытые модели Claude, GPT и другие считаются самыми мощными на сегодня, с ценой выше 5 долларов за миллион Token. Такая цена отражает технологическое превосходство США и их доминирование на высоком рынке.
Однако, американское превосходство сталкивается с структурными вызовами. Во-первых, ограничения электросетей сдерживают расширение вычислительных мощностей, высокие цены на электроэнергию. Во-вторых, стратегия плотных моделей (Dense Models) ведет к низкой эффективности использования ресурсов, что мешает быстрому снижению себестоимости производства Token.
В отличие от США, Китай обладает преимуществами в стоимости и открытой экосистеме. Модели, такие как DeepSeek, стоят всего 0,028 долларов за миллион Token — в 180 раз дешевле GPT. Такой ценовой уровень привлекает разработчиков по всему миру: за неделю с 16 по 22 февраля 2026 года на платформе OpenRouter китайские модели использовали 5,16 триллионов Token, что на 127% больше, чем за три недели ранее, а американские модели — всего 2,7 триллиона и продолжают снижаться. В топ-5 моделей четыре — китайские, их суммарная доля превышает 85,7%. В феврале 2026 года китайские модели впервые обошли США по недельному вызову и удерживают лидерство, такие как MiniMax, DeepSeek, Kimi — долгое время лидеры, а доля китайских моделей в глобальном потреблении Token достигла более 60%.
Важно подчеркнуть, что преимущество Китая по объему вызовов произошло преимущественно в области inference (вывода), а не обучения. Для inference требования к одному графическому процессору (GPU) ниже, отечественные чипы и глубокая оптимизация позволяют обеспечивать огромные объемы запросов. Обучение же всё ещё требует небольшого числа высокопроизводительных карт, и реализуется через распределённые архитектуры и MoE. Эта структурная особенность означает, что в сфере практического применения и монетизации AI Китай уже обладает значительными преимуществами, но в фундаментальных моделях и базовой инновационной базе ещё есть пространство для догоняющего развития.
Преимущество Китая обусловлено несколькими факторами. Во-первых, стоимость электроэнергии — ключевой компонент себестоимости Token — превышает 30%. Благодаря проекту «Восток-Запад» и развитию единой электросети, в западных регионах цена зелёной электроэнергии может опускаться до 0,2 юаня за кВт·ч (около 0,028 долларов), тогда как в Европе и США — в диапазоне 0,08–0,12 долларов. Во-вторых, стоимость чипов — включает закупочную цену, амортизацию и обслуживание. США, благодаря Nvidia, имеют преимущество в поставках высокопроизводительных чипов, но это ведет к более высоким затратам. Китайская стратегия — в обучении использовать немного дорогих чипов, а в inference — массово применять отечественные, оптимизируя их для минимальных затрат. В целом, интеграция моделей, облачных сервисов и чипов внутри страны позволяет максимально повысить эффективность использования ресурсов, тогда как американские компании чаще используют сторонние облака и сторонние чипы, что повышает издержки.
Эффективность инженерных решений — ключевой фактор, определяющий себестоимость Token. В Китае широко применяют архитектуру MoE (смесь экспертов), разбивая большие модели на несколько специализированных подсистем, активируя только необходимые части. При одинаковых инвестициях в 1000 долларов, разные подходы дают разницу в объеме произведённых Token в десятки раз. MoE позволяет в разы повысить производительность на единицу ресурсов по сравнению с плотными моделями. Важна также глубокая интеграция всей цепочки — когда разработчики моделей, облачные платформы и чипмейкеры работают в тесной связке, эффективность использования ресурсов растёт значительно.
Международная конкуренция в области ИИ уже перешла от простого сравнения моделей по характеристикам к комплексной борьбе за «эффективность производства Token» и «затраты на единицу Token». Китай, благодаря дешёвой и стабильной энергии, масштабному рынку и высокой инженерной эффективности, создал огромные преимущества в масштабном и недорогом производстве Token, становясь «ценообразующим центром» и «массовым заводом» для глобальных вычислительных мощностей. США — за счёт технологического оригиналитета, развитой экосистемы и финансовых инвестиций — занимает более высокие сегменты цепочки стоимости. В основе этой борьбы — борьба за контроль над ценами на энергию, организацию промышленного производства и влияние на цифровую экосистему. В ближайшем будущем Китай, помимо традиционных промышленных товаров и электроники, сможет превратить свои внутренние энергетические преимущества в международную торговую выгоду, создав новый конкурентный товар — AI Token. В этой быстрорастущей сфере Китай демонстрирует положительный торговый баланс со всеми странами, кроме США, что может привести к кардинальному изменению глобальной экономики и стратегического баланса.
Чтобы AI Token стал глобальной валютой, необходимо понять её основные свойства. Экономика выделяет три ключевые функции валюты: мерило стоимости, средство обмена и средство накопления. Также важны универсальность, стабильность и суверенное доверие. В соответствии с этими критериями, в обозримом будущем AI Token вряд ли сможет стать полноценной валютой.
Главный барьер — нестабильность стоимости. За два года цена за один Token упала более чем на 99%. Такие колебания делают невозможным принятие его в качестве платежного средства: никто не захочет принимать валюту, которая может за неделю обесцениться вдвое. Даже при стабилизации цены, её высокая привязка к стоимости вычислительных ресурсов — а она зависит от технологий чипов, цен на энергию, геополитических факторов — делает долгосрочную стабильность недостижимой.
Недостаточная распространенность — ещё один важный фактор. Сейчас AI Token принимается только при вызове API и использовании AI-приложений, но не используется для покупки товаров и услуг. Валюта — это универсальный эквивалент, а сеть AI Token пока ограничена сферой AI-сервисов. Для расширения принятия потребуется создание глобальной торговой инфраструктуры, что требует значительных инвестиций и времени.
В сравнении с полноценной валютой, AI Token скорее превратится в новый класс товарных активов, аналогичных нефти, золоту или медным рудникам. Обоснование — по нескольким признакам:
Первое — AI Token обладает характеристиками товарных активов: стандартизация, возможность торговли, широкий спрос. Как отметил Хуанг, «будущее дата-центров — это непрерывно работающие фабрики, производящие не обычные товары, а самый ценный в цифровом мире товар — Token». Как в индустриальную эпоху нефть служила топливом, так и в эпоху интеллекта Token станет «топливом» для цифровых систем.
Второе — механизм ценообразования Token приближается к рынкам товарных активов. Сейчас цены на API моделей формируются по рыночным законам: при дефиците предложение растет, цена — повышается; при избытке спроса — падает. В будущем, при масштабировании торгов и стандартизации, могут появиться деривативы — фьючерсы и опционы на Token, что даст участникам рынка инструменты для хеджирования рисков. Это усилит финансовую природу Token.
Третье — структура спроса и предложения напоминает товарные рынки. Предложение ограничено мощностями чипов, электросетями, что создает жесткие циклы расширения. Спрос растет с ростом AI-приложений, что вызывает циклические колебания цен. В 2026 году уже наблюдался рост цен на Token, несмотря на долгосрочный тренд снижения. Это подтверждает, что рынок Token — это товарный рынок с волатильностью, а не стабильная валюта.
Четвертое — Token может стать стратегическим резервом государств. В связи с проникновением AI в оборону, финансы, энергетику, безопасность вычислительных мощностей становится важной задачей национальной безопасности. Некоторые страны могут начать стратегические запасы вычислительных ресурсов, а Token — это мера их объема. В перспективе может появиться «базисная система» — новая резервная система, основанная на измерении вычислительной мощности.
Если AI Token в ближайшее время не станет валютой, то растущая роль занимают стабильные монеты (стейблкоины), которые могут стать инновационной валютой для AI-агентов. В условиях автономных решений традиционная финансовая инфраструктура сталкивается с проблемами: банки не открывают счета AI, кредитные системы не рассчитаны на алгоритмы, а доверие к ним — для людей. Для AI деньги — это интерфейс, а не богатство; это не средство хранения ценности, а путь к выполнению логики. В этом контексте стейблкоины на блокчейне показывают преимущества: без разрешений, мгновенное урегулирование, низкие издержки — всё, что нужно для AI-экономики.
Данные показывают, что использование стейблкоинов в AI-агентской экономике растет. К марту 2026 года в экосистеме x402 зарегистрировано более 1,63 миллиона транзакций, общий объем — свыше 45 миллионов долларов, число активных AI-агентов — более 435 тысяч, продавцов — более 90 тысяч. В основном доминирует USDC, который занимает 98,6% объема на EVM-базированных цепочках и 99,7% — на Solana.
Обобщая, можно выделить три сценария развития AI Token:
Первый — сохранение измерения как единицы оценки, без превращения в самостоятельный актив. В этом случае Token — это просто инструмент ценообразования AI-сервисов, не обладающий собственной ценностью. Пользователь платит за AI-услугу, а Token — лишь способ учета. Такой сценарий — самый консервативный и соответствует текущему состоянию.
Второй — превращение в товарный актив, формирование рынка фьючерсов и опционов на Token. При росте объема торгов и стандартизации Token могут стать полноценным товаром, как нефть или медь. Тогда появятся биржи, предлагающие деривативы, что усилит финансовую составляющую и волатильность.
Третий — создание новой системы денежного обращения, основанной на вычислительной мощности. В этом случае, как золото в золотом стандарте, вычислительная мощность станет базой для национальных валют или цифровых валют центральных банков (CBDC). В такой системе единица валюты — это стандартизированный Token, привязанный к объему вычислительных ресурсов. Это революционный сценарий, требующий новых технологий и регуляторных решений, но способный полностью изменить глобальную валютную систему.
В условиях роста Token-экономики государство должно включить вычислительные ресурсы в стратегическую инфраструктуру, предвидя вопросы регулирования. В частности, необходимо:
Создать инфраструктурную сеть вычислительных мощностей. Использовать опыт проекта «Восток-Запад», планируя национальную сеть, обеспечивающую эффективное распределение ресурсов. В западных регионах — крупные центры с зелёной энергией, в восточных — узлы на периферии для низкой задержки. Создать единую платформу управления ресурсами.
Стандартизировать измерение Token. Сейчас разные платформы используют разные подходы, что мешает развитию рынка. Важно разработать единые стандарты, определить правила пересчёта для разных модальностей (текст, изображение, аудио), обеспечить прозрачность и справедливость учета. Это повысит эффективность внутреннего рынка и усилит позиции Китая на глобальной арене.
Разработать нормативную базу и механизмы регулирования Token-экономики. Вопросы правового статуса Token, трансграничных транзакций, рисков волатильности, защиты прав потребителей требуют совместных усилий экспертов, бизнеса и власти.
Активно участвовать в международных правилах. В условиях формирования глобальных стандартов AI и Token необходимо участвовать в их разработке: продвигать международные стандарты, включать вопросы сотрудничества в рамках двусторонних соглашений, предлагать модели налогового регулирования для Token-транзакций, учитывать интересы развивающихся стран.
Компании должны рассматривать Token не только как технологический инструмент, а как стратегический ресурс. В условиях роста Token-экономики важно:
Формировать мышление эффективности Token. При выборе моделей и архитектур важно учитывать соотношение затрат и производительности Token. В каждом этапе — от проектирования подсказок до оптимизации результатов — нужно стремиться к минимизации издержек и максимизации ценности. Например, точное формулирование подсказок уменьшает бессмысленные Token, а оптимизация вызовов — повышает эффективность. Вдохновляясь концепцией «good-put» в коммуникациях, компании должны ориентироваться на «сколько Token реально продвинуло достижение целей», а не только на их количество. Такой подход переводит фокус с «затраченного ресурса» на «созданную ценность».
Переосмысление бизнес-моделей и ценообразования. В индустрии больших моделей происходит переход от «трафиковых» стратегий к ценностной дифференциации. Вначале низкие цены привлекали массовых пользователей, но приводили к низкой эффективности использования ресурсов — до 40% бесплатных вызовов не имели практической ценности. Постепенно вводя платные тарифы, компании смогут фильтровать нецелевые запросы и обеспечивать стабильность для серьёзных клиентов. Это — сдвиг от интернет-модели к модели ценового ценообразования в софтверной индустрии.
Формирование новых стандартов и мотивационных схем для специалистов. На GTC 2026 Хуанг предложил уникальную идею: выдавать инженерам Token-бюджет, равный половине их годовой зарплаты, чтобы привлечь талантов. Он подчеркнул: «Если вы нанимаете инженера за 50 тысяч долларов, и он не расходует минимум 25 тысяч Token, я буду очень обеспокоен». Это показывает, что в будущем эффективность использования Token станет важнейшим фактором оценки профессионалов.
Для человека развитие Token-экономики — это вызов и возможность одновременно. Чтобы успешно адаптироваться, необходимо:
Развивать грамотность в области Token. Большинство пользователей не понимают, как расходуются Token, как работают модели и как формируется цена. Это приводит к ошибкам: кто-то торгует акциями через AI и теряет всё за ночь; кто-то даёт команду AI «продать всё» и лишается средств. Поэтому базовые знания о Token — это фундамент цифровой компетентности.
Создавать новые формы взаимодействия с AI. В будущем компьютеры будут работать круглосуточно, постоянно генерируя Token, потому что AI-агенты будут непрерывно выполнять задачи. Это требует смены подхода: от «самостоятельной работы» к «управлению AI», от «исполнителя» к «контролёру».
Обучаться и обновлять навыки. Скорость развития Token-экономики означает, что навыки быстро устаревают. Сегодняшние модели и технологии могут быть заменены новыми, более эффективными. Поэтому важно постоянно учиться, следить за трендами, экспериментировать с новыми инструментами и расширять междисциплинарные знания, чтобы оставаться конкурентоспособным в эпоху интеллектуальных токенов. Только так можно успешно использовать возможности новой экономики и сохранять лидерство.