«The Wall Street Journal» 最新не дослідження розкриває: криза з доступністю обчислювальних потужностей для індустрії ШІ вже повністю вибухнула. Спотова оренда GPU Blackwell за два місяці підскочила з $2.75 за годину до $4.08 за годину, зростання на 48%; показник нормального виконання Claude API у Anthropic за 90 днів становить лише 98.95%, що далеко нижче корпоративного стандарту 99.99%, і це вже призвело до того, що корпоративні клієнти на кшталт Retool відмовляються та переходять до OpenAI.
(Попередні події: великий сейл-ауттрейдер Майк Бейбері кинув заяву: Palantir — це лише зовнішній аутсорсинг компанії з низькою маржинальністю SaaS! Anthropic його «з’їдає»)
(Додаткова довідка: Claude — за розхід удвічі більше в подарунок! Anthropic запустила обмежену за часом знижку, тож користувачі на Тайвані майже весь день користувалися перевагами)
Зміст статті
Перемикач
Увесь світ уже вичерпав обчислювальні потужності: спотова оренда GPU Blackwell зросла на 48% за два місяці, а ще є люди, які дивляться на зображення Claude Code, де екран зависає на thinking… — усі відчувають гострий дефіцит.
Індекс цін на обчислювальні потужності «Ornn Compute Price Index» (OCPI, Ornn Compute Price Index) нещодавно включили до терміналу Bloomberg Terminal, тож інституційні інвестори тепер можуть, як відстежувати ціну на нафту, напряму бачити в реальному часі динаміку спотової оренди GPU.
Головний фактор, що розганяє зростання цін, — вибухоподібний попит на Agentic AI (агентний ШІ). ШІ більше не зводиться лише до запитань-відповідей у фронтенді вебсайтів: йому потрібні тривалі, безперервні самостійні завдання, і апетит до обчислювальних потужностей — зовсім іншого масштабу. Пропозиція обчислювальних потужностей ще не встигає, а попит уже різко «злетів».
CEO Vultr J.J. Kardwell сказав це прямо: «Це найсерйозніший дефіцит обчислювальних потужностей, який я бачив за понад п’ять років ведення цієї компанії. Цикли будівництва дата-центрів занадто довгі, і вся електроенергія, доступна в 2026 році, уже зарезервована». Зверніть увагу: він говорить про «електроенергію», а не про «чіпи».
Вузьке місце з обчислювальними потужностями на 2026 рік уже не в виробничих лініях GPU, а в електромережі: дата-центри чекають на електроенергію.
Claude API у Anthropic за 90 днів станом на 8 квітня має показник нормального виконання 98.95%; промисловий загальноприйнятий корпоративний стандарт — 99.99%. Різниця в 1.04 відсоткового пункту звучить мало, але на практиці це означає приблизно на 8 годин більше простоїв щомісяця.
Підприємства, які під’єднують ШІ до ключового робочого процесу, не можуть із цим миритися (виходить, звичайним користувачам це, начебто, доведеться прийняти).
Засновник і CEO Retool Девід Хсу дав одну фразу, яка, ймовірно, змусила б Anthropic почервоніти: «Я вважаю, що Opus 4.6 — найкраща корпоративна модель, але врешті-решт ми перейшли на OpenAI, тому що Anthropic постійно зависає».
Retool — платформа для розробки корпоративного програмного забезпечення, і це клієнт, у якого Anthropic найбільше потребує замовлень, але угода все одно зірвалася через брак обчислювальних потужностей.
Починаючи з кінця березня Anthropic запровадила заходи з обмеження трафіку: з понеділка по п’ятницю за тихоокеанським часом з 5:00 до 11:00 вона обмежувала обсяг токенів, які можуть витрачати користувачі. А ще трохи раніше, в середині березня, Anthropic також запустила промоцію «подвоєне використання у відпливні години», щоб заохотити користувачів на Тайвані уникати пікових годин. Якщо подивитися тепер, то це «подарунком» не було — це було перенаправленням потоку в години спаду, щоб звільнити потужності для піку.
Ми бачимо вражаючий темп зростання річної виручки (ARR) Anthropic: наприкінці 2025 року це було $90 млрд, у лютому цього року стрибнуло до $140 млрд, а вже у квітні сягнуло $300 млрд. Чим більше заробляєш — тим більше, але тим гірше, бо за новими доходами стоїть більше потреби в обчислювальних потужностях, і розрив у пропозиції тільки збільшується.
Оброблюваний обсяг API-токенів OpenAI: у жовтні 2025 року — 6 млрд за хвилину, а станом на кінець березня цього року — вже 15 млрд за хвилину. За п’ять місяців зростання склало двічі з половиною. Це не тому, що модель стала сильнішою: просто використання вибухово прискорилося в рази.
Фінансовий директор Сара Фріар сказала: «Я витрачаю дуже багато часу на те, щоб дістати останні крихти доступних обчислювальних потужностей. Ми робимо дуже болісний вибір: деякі проєкти, бо не вистачає обчислювальних потужностей, доводиться відкладати».
Тому ми знаємо, що Sora вимкнули: OpenAI прибрала з полиці застосунок для генерації відео на основі Sora. Частково причина — перекинути вивільнені ресурси чипів на інструменти для програмування та корпоративні продукти.
Наприкінці минулого року CoreWeave підняла орендні ставки більш ніж на 20% і водночас вимагала, щоб середні та малі клієнти підписували контракт щонайменше на три роки — раніше було на один рік. Для стартапів і середніх компаній, яким потрібна гнучкість, це рівносильно тому, щоб «виштовхувати» людей.
Але для великих клієнтів CoreWeave має інший підхід. Цього року 10 квітня CoreWeave щойно оголосила, що підписала багаторічний контракт з Anthropic. Це дає Anthropic доступ до обчислювальної потужності Nvidia GPU у дата-центрах у США. Anthropic пообіцяла інвестувати в найбільший обсяг — до 1 GW (1 гігават) обчислювальних потужностей; буде використано Nvidia Grace Blackwell та апаратне забезпечення наступного покоління Vera Rubin.