23 березня, директор Національного бюро даних Лю Ліехонг оголосив на Форумі високого рівня з розвитку Китаю шокуючі дані: середньодобове використання AI Token у Китаї зросло з 100 мільярдів у початку 2024 року до 100 трильйонів наприкінці 2025 року, а в березні 2026 року перевищило 140 трильйонів — за два роки зростання більш ніж у тисячу разів. Одночасно дані глобальної платформи OpenRouter, яка агрегує API великих моделей штучного інтелекту, показують, що щотижневе викликань великих моделей у Китаї вже кілька тижнів перевищує США, а три перші за обсягом глобальні платформи викликів належать китайським моделям. Революція індустрії, рухома Token, швидко перебудовує глобальний технологічний конкурентний ландшафт, бізнес-моделі та навіть національні конкурентні переваги.
На початку 2026 року з’явилися кілька важливих новин із Кремнієвої долини, що привернули увагу світової технологічної спільноти. Внутрішньо компанія OpenAI поступово відмовляється від використання майже 20 років основного інтернет-індикатора DAU (щоденна активна кількість користувачів), натомість робить TPD (Token Per Day, кількість токенів, спожитих за добу) ключовим показником діяльності. Ця зміна не випадкова. Генеральний директор NVIDIA Дженсен Хуанг на конференції GTC 2026 переосмислив дата-центри як «Token фабрики», зазначивши, що майбутня конкуренція зосереджена на «кількості токенів, що обробляються на ват». Це не ізольоване явище, а ознака того, що новий парадигмальний формат «інтелектуальної економіки», де Token є основною мірою та одиницею обміну, вже повністю запроваджено.
З точки зору комп’ютерної науки, Token — це базова одиниця обробки інформації моделлю штучного інтелекту. Коли текст вводиться у модель, він розбивається на слова або підслова; зображення — на піксельні блоки; аудіо — на часові сегменти. Ці незмінні елементи, що не підлягають подальшому розбиттю, називають Token.
У практичних застосуваннях вимір Token регулюється певними правилами. Для англійського тексту коротке слово може коштувати один Token, довше — розбиватися на кілька. Орієнтовно один Token — це близько 4 англійських символів. Для китайського тексту один ієрогліф зазвичай відповідає 1–2 Token. В процесі тренування моделей, обробки даних або викликів API, кожна ключова дія AI базується на вимірюванні Token. Обсяг спожитих Token безпосередньо відображає обсяг роботи моделі та її цінність, що відповідає марксистській теорії трудової вартості.
Важливість Token полягає в тому, що він надає кількісну та порівняльну міру розвитку інтелектуальної економіки. У міру еволюції AI від текстових до мультимодальних моделей, застосувань у програмуванні, відео та науці, Token стає стратегічною одиницею вимірювання «єдиного стандарту». Це не випадковий вибір, а закономірний результат розвитку галузі: у промислову епоху для вимірювання електроенергії використовували «кіловат-години», в епоху інтернету — «GB» для даних, а в епоху AI природно потрібен Token для вимірювання інтелектуальної продуктивності. На рівні економіки та бізнесу Token вже є ключовим елементом, що дозволяє оцінювати, ціноутворювати та торгувати інтелектуальним продуктом. Він з’єднує базову енергетику, обчислювальні ресурси, дані та високорівневі інтелектуальні послуги, виступаючи універсальним стандартом для оцінки AI-потужності, підрахунку витрат та обліку сервісів.
Цінність Token охоплює п’ять ланцюгів: виробництво апаратного забезпечення, інфраструктуру, обчислювальні ресурси, платформену діяльність і розробку додатків. У структурі витрат основними є електроенергія та амортизація обчислювальної техніки, що становлять 70–80%, і визначають міжнародну конкурентоспроможність Token. «Tokens per Watt» — це ключовий показник конкурентоспроможності AI-компаній, що відображає кількість Token, які можна обробити на один ват енергії. Це означає, що компанії, здатні виробляти більше Token за менший енергетичний ресурс, мають найнижчі витрати та найсильнішу позицію на ринку.
З ускладненням застосувань вимір Token став багатовимірним і динамічним. Основні чинники:
(1) Двоєдина структура входу та виходу. Базове вимірювання базується на «вхідних Token» і «вихідних Token». Вхідні Token — це інформація, яку користувач подає моделі (промпти, документи, історія діалогів), а вихідні — відповіді моделі. У комерційних сценаріях вартість генерації зростає через споживання пам’яті та обчислювальних циклів, тому вихідні Token зазвичай коштують у 3–5 разів дорожче за вхідні. Це відображає різницю між «творчою працею» та «читанням інформації» у споживанні ресурсів.
(2) Вимірювання контексту та пам’яті. У 2024–2025 роках розмір контекстного вікна великих моделей зріс з 8K і 32K до 128K і навіть 1M (мільйонів Token). У 2026 році обробка дуже довгого контексту стала нормою. Однак довгий контекст — не безкоштовний. Архітектура Transformer з механізмом уваги має квадратичну або лінійну складність, тому введено коефіцієнт «ваги контексту». Наприклад, у сесії з 1 мільйоном Token, навіть якщо відповідь складає лише 10 Token, система має повторно переглянути або пошукати історію, що спричиняє приховані витрати, які враховуються у «активних» Token. Це дозволяє точніше оцінювати ресурси, необхідні для збереження довготривалої пам’яті.
(3) Tokenізація мультимодальних даних. З розвитком мультимодальних моделей (LMM) зображення, відео та аудіо також стали частиною системи вимірювання Token. Високороздільне зображення розбивається на сотні візуальних патчів, кожен з яких кодується у один або кілька візуальних Token. Одномінутне відео може містити десятки тисяч часових Token. Такий єдиний підхід руйнує бар’єри між модальностями, дозволяючи одночасно виконувати опис зображень, розуміння відео та голосову взаємодію у рамках однієї економічної моделі. Наприклад, створення 10-секундного відео високої якості може вимагати кілька тисяч Token, що еквівалентно написанню статті на тисячу слів, що ілюструє різницю у щільності інформації.
(4) Невидимість цінності Token. З поширенням AI-агентів (інтелектуальних агентів) модель вже не обмежується однією відповіддю, а виконує складне автономне планування, запуск коду, саморефлексію та багатократний пошук. У цьому процесі генерується багато проміжних Token, які не видно користувачу, але є основою високоякісного результату. Нові стандарти вимірювання починають розрізняти «зовнішні» Token і «внутрішні» — для логічних висновків, складних обчислень. Наприклад, у наукових обчисленнях кількість внутрішніх Token може бути у десятки разів більшою за кінцевий результат. Деякі платформи вже експериментують із диференційованою оплатою за кількість кроків мислення або глибину логічної ланцюжка, що означає перехід від «рахунку слів» до «рахунку інтелекту».
За останні роки AI Token демонструє три ключові тренди: експоненційне зростання обсягів, максимальне стиснення одиниць вимірювання та ієрархізацію цінностей.
Тренд 1: Вибухове зростання споживання. За даними, у 2024 році глобальне щоденне споживання Token становило близько 100 мільярдів, а в першому кварталі 2026 — вже 180 трильйонів, зростання майже у 1800 разів. Це не лінійне зростання, а результат якісних змін у застосуванні. Спочатку Token використовували переважно у чатботах — низькочастотних, поверхневих взаємодіях. У 2026 році домінують автономні агенти, які самостійно розбивають цілі, викликають інструменти, пишуть і налагоджують код, перевіряють результати. Цей цикл може спричинити витрати у десятки або сотні тисяч Token. Зі впровадженням тілесного AI (Embodied AI) та робототехніки, що перетворює сенсорні дані та рішення у потоки Token у реальному часі, очікується, що у 2030 році щоденне споживання Token у світі досягне рівня у квадрильйони (10^16).
Тренд 2: Зниження вартості одиниці за законом Мура. Завдяки розвитку апаратних архітектур (наприклад, NVIDIA Blackwell і Rubin), алгоритмів (мішані експерти MoE, кількісні методи, спекулятивне семплювання) та підвищенню ефективності кластерного управління, у 2026 році вартість генерації одного високоякісного Token знизилася приблизно у 100 разів порівняно з 2023 роком. Це явище — «парадокс Джевонса» — проявляється у тому, що підвищення ефективності не зменшує загальні ресурси, а стимулює зростання попиту. У майбутньому, з появою фотонних обчислень і нейроморфних чипів, енергоспоживання на один Token може знизитися ще більше, роблячи «безмежний інтелект» теоретично можливим.
Тренд 3: Ієрархізація та спеціалізація цінностей. У майбутньому ринок Token буде мати чіткий «ціновий шаруватий» поділ. «Стандартні» Token від універсальних моделей стануть дешевими і масовими, використовуваними для повсякденних запитів, базового перекладу та простих класифікацій. «Високорівневі» Token, отримані шляхом тонкої настройки (Fine-tuning), з приватними даними та глибоким логічним мисленням, будуть дорогими і дефіцитними. Наприклад, Token для діагностики від топ-медичних моделей матиме значну цінність порівняно з чат-ботами для розваг. Це сприятиме створенню «ф’ючерсних ринків Token» і систем сертифікації якості, де користувачі платитимуть преміальні ціни за Token високої якості.
1. Обсяги виробництва і споживання: Китай наздоганяє за сумою
Переваги США у сфері AI зосереджені у двох напрямках: проектування чипів і можливості моделей. NVIDIA, абсолютний лідер світового ринку GPU, зросла з капіталізацією близько 300 мільярдів доларів у 2022 році до понад 4 трильйонів доларів сьогодні — у 14 разів. Це результат лідерства у передових технологіях виробництва. Водночас, закриті моделі Claude, GPT і подібні залишаються найпотужнішими, з високою ціною понад 5 доларів за мільйон Token. Це відображає технічну перевагу та цінову політику США.
Однак, структура американської переваги зазнає викликів. По-перше, обмеження електромережі стримує розширення обчислювальних потужностей через високі ціни на електроенергію. По-друге, технологія щільних моделей (Dense Models) має низьку ефективність використання ресурсів, що ускладнює швидке зниження собівартості виробництва Token.
На відміну від США, Китай має конкурентні переваги у двох сферах: контролі витрат і відкритій екосистемі. Моделі, наприклад DeepSeek, коштують всього 0.028 долара за мільйон Token — у 180 разів дешевше GPT. Це приваблює розробників по всьому світу, які «голосують ногами»: у тиждень з 16 по 22 лютого 2026 року на платформі OpenRouter китайські моделі спожили 5,16 трильйонів Token, що на 127% більше, ніж три тижні тому, тоді як американські — лише 2,7 трильйона і зменшуються. У топ-5 моделей світу чотири — китайські, що становить 85,7%. У лютому 2026 року китайські моделі вперше обігнали США за щотижневим викликом і тримають лідерство, а моделі MiniMax, DeepSeek, Kimi довго посідають перші місця, а частка китайських Token у глобальному споживанні сягала понад 60%.
Важливо підкреслити, що перевага Китаю за обсягами споживання Token зосереджена переважно на inference (виведенні), а не на тренуванні. Для inference потрібно менше потужності на один GPU, тому китайські чипи та оптимізація дозволяють підтримувати масовий попит. Для тренування ж потрібні кілька високопродуктивних GPU, і тут Китай поки що поступається США, використовуючи розподілені архітектури та MoE (мішаних експертів). Це означає, що в застосуванні та комерціалізації AI Китай має явну перевагу, але у фундаментальних моделях ще є простір для зростання.
Переваги Китаю у витратах базуються на кількох факторах. По-перше, електроенергія — найважливіший компонент витрат на виробництво Token, що може становити понад 30%. Оскільки тренування і inference — це енергомісткі процеси, стабільність електромережі та ціни на «зелену» електроенергію визначають конкурентоспроможність. Завдяки проекту «Східний чисельний захід» і єдиній великій електромережі західні регіони мають ціну зеленої електроенергії близько 0,2 юаня/кВт-год (близько 0,028 долара), тоді як у Європі та США — від 0,08 до 0,12 долара.
По-друге, вартість чипів — це закупівельна ціна, амортизація і обслуговування. США, завдяки NVIDIA, мають перевагу у високих цінах на високопродуктивні чипи, але це підвищує їхні витрати. Китай же використовує кілька високопродуктивних чипів для тренування і масове застосування власних чипів для inference, оптимізуючи їхню ціну. Всі компоненти — моделі, хмарні сервіси і чипи — тісно інтегровані, що підвищує ефективність використання ресурсів. США ж здебільшого залежать від сторонніх хмар і чипів, що підвищує вартість.
Ефективність інженерії — ключовий фактор. Китайські компанії широко застосовують архітектуру MoE (мішаних експертів), яка розбиває модель на кілька експертів і активує лише потрібних. За однаковий бюджет у 1000 доларів, різні підходи дають різний обсяг Token у 10 і більше разів. MoE дозволяє у кілька разів підвищити продуктивність на один ресурс. Взаємодія всього ланцюжка — від моделі до хмари і чипів — дає додатковий приріст.
Глобальна конкуренція у AI вже не зводиться до «показників моделі», а зосереджена на «ефективності виробництва Token» і «вартості за Token». Китай, завдяки дешевій і стабільній енергетиці, масштабному ринку і високій інженерній ефективності, створює величезну перевагу у масштабному та дешевому виробництві Token, перетворюючись на «цінову» і «масову фабрику» AI. США ж — на високотехнологічному рівні, з оригінальними технологіями і високою доданою вартістю. Це змагання — боротьба за цінову політику, організацію виробництва і цифрову екосистему. У найближчому майбутньому Китай перетворить внутрішню енергетичну перевагу у глобальну торгову перевагу, створивши новий конкурентний товар — AI Token. У цій швидкозростаючій галузі Китай вже має позитивний торговий баланс із усіма країнами, окрім США, і це може змінити глобальний економічний і стратегічний ландшафт.
Щоб AI Token став глобальною валютою, потрібно врахувати її основні функції: міру цінності, засіб обміну і сховище вартості. Крім того, потрібна універсальна прийнятність, стабільність і кредитна підтримка. За цими критеріями, у найближчій перспективі AI Token навряд чи зможе стати справжньою валютою.
Найбільша перешкода — нестабільність цін. За два роки ціна 1 Token знизилася більш ніж на 99%. Така різка волатильність ускладнює прийняття її як платіжного засобу, оскільки бізнес не хоче приймати валюту, яка може за тиждень втратити більшу частину вартості. Навіть якщо ціна стабілізується, її цінність буде тісно пов’язана з вартістю обчислювальних ресурсів, яка залежить від технологічних новинок, цін на енергію і геополітичних факторів, і довгостроково залишатиметься нестабільною.
Ще один фактор — недостатня прийнятність. Зараз AI Token використовують лише для API-запитів і AI-додатків, але не для купівлі товарів і послуг. Валюта має бути універсальним засобом обміну, а поки що AI Token обмежений сферою AI. Щоб вона стала глобальною валютою, потрібно створити мережу торгівлі товарами і послугами, що вимагає значних інвестицій і тривалого розвитку.
Замість того, щоб стати валютою, AI Token швидше перетворюється на новий тип товару — аналог дорогоцінних металів або енергоресурсів. Це підтверджується кількома ознаками:
По-перше, AI Token має характеристики товару: стандартизація, торгівельна придатність і високий попит. Як зазначив Хуанг, «майбутні дата-центри — це цілодобові фабрики, що виробляють не традиційний продукт, а найцінніший товар цифрового світу: Token». Так само, як у промислову епоху нафту використовували як «пальне», у цифрову — Token стане «інтелектуальним пальним».
По-друге, механізм ціноутворення Token вже нагадує товарний ринок: при дефіциті ціна зростає, при надлишку — падає. З часом, зросте масштаб і стандартизація торгівлі Token, з’являться ф’ючерси і деривативи, що дозволять учасникам ринку управляти ризиками і цінами.
По-третє, структура попиту і пропозиції схожа на товарну: обмежена виробнича потужність через технологічні і енергетичні обмеження, довгі цикли розширення і низька гнучкість. Попит зростає швидко, і ціни можуть різко коливатися. Це вже видно на прикладі 2026 року, коли ціни Token різко зросли, незважаючи на довгостроковий тренд зниження.
По-четверте, Token може стати стратегічним резервом держав. Оскільки AI стає важливою частиною оборони, фінансів і енергетики, країни можуть почати стратегічно накопичувати обчислювальні ресурси у вигляді Token. Це може призвести до створення «валюти, прив’язаної до обчислювальної потужності», — так званої «валюти, прив’язаної до обчислювальної бази».
Якщо AI Token не може стати валютою, то альтернативою є стейблкоїни — стабільні криптовалюти, що забезпечують стабільність цін. Вони вже стають новою формою валюти для AI-агентів. Оскільки AI-агенти виконують автономні операції, традиційна фінансова система не пристосована до них: банки не відкривають рахунки, кредитки не підходять, кредитна система — для людей. Для AI гроші — це не багатство, а інтерфейс, шлях до виконання логіки. У цьому контексті, стейблкоїни на блокчейні мають переваги: безліцензійна торгівля, миттєве розрахунки, низькі витрати.
Дані показують, що використання стейблкоїнів у AI-екосистемах швидко зростає. Наприклад, у березні 2026 року у системі x402 було понад 1,63 мільярдів транзакцій, обсяг — понад 45 мільйонів доларів, кількість користувацьких AI-агентів — понад 435 тисяч, продавців — понад 90 тисяч. USDC домінує у цій системі, займаючи понад 98,6% обсягу на EVM-ланцюгах і 99,7% на Solana.
Загалом, майбутнє AI Token може розвиватися за трьома сценаріями:
Сценарій 1: збереження статусу одиниці виміру, без перетворення у самостійний актив. У цьому випадку Token залишиться засобом ціноутворення AI-послуг, але не стане активом. Користувачі купують AI-можливості, а Token — лише засіб оплати. Це найконсервативніший сценарій, що відповідає нинішньому стану.
Сценарій 2: перетворення у товарний актив, формування ринку ф’ючерсів на обчислювальну потужність. З розширенням масштабів торгівлі та стандартизації, Token стане аналогом нафти або міді, з ф’ючерсами і деривативами. Це підвищить волатильність цін, але й додасть фінансових інструментів.
Сценарій 3: створення нової валютної системи, прив’язаної до обчислювальної потужності. Це найреволюційніший сценарій: обчислювальна потужність стане «якорем» цінності валюти, подібно до золота за золотого стандарту. У такій системі, центральні банки випускатимуть цифрові валюти, прив’язані до кількості Token. Це вимагатиме нових технологій і регулювання, але може радикально змінити глобальну валютну систему.
Щоб відповідати зростаючій Token-економіці, країни мають інтегрувати обчислювальні ресурси у стратегічну інфраструктуру. Це включає:
Створення системи обчислювальної інфраструктури. За прикладом «Східний чисельний захід», потрібно планувати і будувати мережу обчислювальних центрів по всій країні, з урахуванням енергетичних ресурсів. Важливо розміщувати великі центри у регіонах з дешевою зеленою енергією, створювати граничні обчислювальні вузли у високонавантажених регіонах, а також розробляти єдину платформу управління ресурсами.
Уніфікація стандартів вимірювання Token. Зараз різні платформи використовують різні підходи, що ускладнює інтеграцію і масштабування. Необхідно розробити державні стандарти, що визначають правила перерахунку Token для різних модальностей (текст, зображення, аудіо), створити прозорі і справедливі механізми обліку.
Розробка нормативної бази управління Token-економікою. Питання правового статусу Token, регулювання трансграничних операцій, управління ціновими коливаннями, захист прав користувачів — все це потребує міжвідомчої координації і нових законодавчих ініціатив.
Активна участь у формуванні міжнародних правил. Китай має активно впливати на створення глобальних стандартів у Token-економіці, сприяти міжнародним домовленостям щодо вимірювання, торгівлі і оподаткування Token, щоб зберегти стратегічний вплив.
Компанії мають переосмислити Token-стратегію як ключовий елемент конкурентної переваги:
Фокус на Token-ефективності. Вибір моделей, оптимізація промптів, стратегій викликів — все має базуватися на мінімізації витрат Token і максимізації цінності. Важливо враховувати «ефективність» — скільки Token реально сприяє досягненню цілей користувача.
Перебудова цінової політики і бізнес-моделей. Замість безкоштовних або низькоцінних пропозицій, потрібно вводити диференційовані ціни, що відфільтровують непотрібний трафік і залучають цінних клієнтів. Це перехід від «масового розповсюдження» до цінової сегментації.
Нові стандарти підбору кадрів і мотивації. Як запропонував Хуанг, можна видавати Token-бюджети інженерам, що становитимуть половину їхньої зарплати, щоб залучити і мотивувати таланти. «Якщо ви наймаєте інженера з зарплатою 50 тисяч доларів і він не споживає токенів на суму щонайменше 25 тисяч — це тривожний сигнал», — сказав він.
Користувачам потрібно освоїти Token-літературу і нові навички:
Розуміння Token. Більшість користувачів не знають, скільки Token вони витрачають, як працює модель і як ціноутворення. Це призводить до марнотратства або неправильного використання. Важливо вивчати, як формувати промпти, щоб мінімізувати витрати і підвищити якість.
Новий стиль роботи з AI. Хуанг передбачає, що майбутні AI-агенти працюватимуть цілодобово і генеруватимуть мільйони Token. Це означає, що люди мають перейти від «самостійної роботи» до «керівництва AI», від «виконавця» до «наглядача».
Постійне навчання і адаптація. Швидкий розвиток Token-економіки означає, що навички швидко застарівають. Тому потрібно постійно оновлювати знання, експериментувати з новими інструментами і технологіями, формувати міждисциплінарне мислення, щоб залишатися конкурентоспроможним у новій епосі.