A capacidade de computação está a faltar a ponto de fazer chorar! WSJ: A renda dos Blackwell subiu 48% em dois meses, a Anthropic está tão lenta que as empresas estão a saltar fora

O mais recente inquérito do The Wall Street Journal revela que a crise na oferta de capacidade computacional para a indústria de IA já foi totalmente despoletada. As rendas à vista de GPUs Blackwell dispararam, em apenas dois meses, de 2,75 USD por hora para 4,08 USD por hora, um aumento de 48%; a taxa de execução normal da API Claude da Anthropic nos 90 dias foi apenas 98,95%, muito abaixo do padrão empresarial de 99,99%, o que levou clientes empresariais como a Retool a abandonarem o serviço e a migrarem para a OpenAI.
(Antecedentes: o grande short-seller Michael Burry lança declarações: Palantir é apenas uma empresa de terceirização SaaS de baixa margem! A Anthropic está a consumi-la)
(Nota de contexto: utilização de Claude a duplicar em oferta! A Anthropic disponibilizou promoções por tempo limitado, beneficiando quase todo o dia os utilizadores de Taiwan)

Índice do artigo

Alternar

  • A Anthropic é a mais azarada
  • A OpenAI anda à procura de capacidade computacional por todo o lado, por isso teve de encerrar o Sora
  • A CoreWeave precisa de assinar grandes clientes com números astronómicos, enquanto afasta clientes pequenos e médios

A capacidade computacional de todo o mundo já foi completamente espremida. Incluindo o aumento de 48% nas rendas à vista dos GPUs Blackwell em dois meses, e também as pessoas que ficam a olhar para o ecrã do Claude Code parado em thinking…, todos estão muito escassos.

O índice de preços de capacidade computacional da Ornn (“Ornn Compute Price Index”, OCPI) já foi recentemente incluído no Bloomberg Terminal. Agora, os investidores institucionais podem acompanhar diretamente a dinâmica em tempo real das rendas de GPUs à vista, tal como acompanham o preço do petróleo.

O fator central que está a impulsionar esta subida de preços é o boom da procura por Agentic AI (IA baseada em agentes). A IA já não é apenas uma funcionalidade de perguntas e respostas na camada de front-end da web; exige tarefas autónomas, longas e em funcionamento contínuo, e a sua fome de capacidade computacional está noutro nível. A oferta de capacidade computacional ainda não subiu, mas a procura já explodiu.

O CEO da Vultr, J.J. Kardwell, foi direto: “É a escassez de capacidade computacional mais grave que já vi em mais de cinco anos a gerir esta empresa. Os ciclos de construção dos centros de dados são demasiado longos e toda a eletricidade disponível para 2026 já foi reservada.” Nota-se que ele está a falar de “eletricidade”, não de “chips”.

O gargalo de capacidade computacional de 2026 já não está nas linhas de produção de GPUs; está na rede elétrica. Os centros de dados estão à espera de eletricidade.

A Anthropic é a mais azarada

Nos 90 dias até 8 de abril, a taxa de execução normal da Claude API foi de 98,95%. O padrão empresarial amplamente aceite na indústria é de 99,99%. Faltam 1,04 pontos percentuais; parece pouco, mas na prática significa quase mais 8 horas de tempo de indisponibilidade por mês.

As empresas que ligam a IA aos seus fluxos de trabalho centrais não podem aceitar isso (parece que ao utilizador comum, dito assim, também tinha de aceitar).

O fundador e CEO da Retool, David Hsu, deu uma frase que, presumivelmente, faria corar de vergonha quem está na Anthropic: “Acredito que o Opus 4.6 é o melhor modelo empresarial, mas no final mudámos para a OpenAI porque a Anthropic tem estado sempre a falhar.”

A Retool é uma plataforma de desenvolvimento de software empresarial e é o cliente de que a Anthropic mais precisa, mas os negócios acabaram por falhar ainda assim, porque a capacidade computacional não era suficiente.

A Anthropic começou a adotar medidas de limitação de tráfego em finais de março. De segunda a sexta, das 5h às 11h (horário do Pacífico), restringia a quantidade de tokens consumidos pelos utilizadores. E ainda antes, a meio de março, a Anthropic lançou a promoção “duplicar o uso fora das horas de ponta”, incentivando os utilizadores de Taiwan a evitarem os horários de pico. Agora, ao olhar para trás, percebe-se que essa oferta não era um presente: era para desviar o tráfego para os períodos fora de ponta, deixando capacidade livre para o pico.

Vemos uma taxa de crescimento anualizada impressionante nas receitas da Anthropic (ARR). No final de 2025 era $90 milhões; este ano, em fevereiro, subiu para $140 milhões; e em abril já atingiu $300 milhões. Quanto mais ganha, mais ganha — mas quanto mais ganha, mais azarada fica — porque por trás de cada nova receita há uma necessidade acrescida de capacidade computacional, e a brecha de oferta está a aumentar.

A OpenAI anda à procura de capacidade computacional por todo o lado, por isso teve de encerrar o Sora

O volume de tokens da API da OpenAI em outubro de 2025 era de 6 mil milhões por minuto. No fim de março deste ano já era de 15 mil milhões por minuto; em cinco meses, subiu duas vezes e meio. Não é que o modelo tenha ficado mais forte — é que o uso explodiu a uma velocidade exagerada.

A diretora financeira Sarah Friar disse: “Tenho passado muito tempo a procurar aquele último bocadinho de capacidade computacional disponível por todo o lado. Estamos a fazer escolhas extremamente dolorosas; alguns projetos foram abandonados por falta de capacidade computacional.”

Por isso, sabemos que o Sora foi encerrado: a OpenAI retirou esta aplicação de geração de vídeo. Parte da razão é transformar os recursos de chips libertados para ferramentas de programação e produtos empresariais.

A CoreWeave precisa de encontrar grandes clientes com números astronómicos, enquanto afasta clientes pequenos e médios

A CoreWeave aumentou as rendas em mais de 20% no fim do ano passado e, em simultâneo, passou a exigir que os clientes pequenos e médios assinassem contratos com, no mínimo, três anos — antes era um ano. Para startups e empresas de média dimensão que precisam de flexibilidade, equivale a estar a expulsar pessoas.

Mas para os grandes clientes, a CoreWeave tem outra abordagem: este ano, a 10 de abril, a CoreWeave acabou de anunciar que assinou um contrato de vários anos com a Anthropic, permitindo que a Anthropic aceda à capacidade computacional de GPUs Nvidia nos centros de dados nos EUA. A Anthropic comprometeu-se a investir no máximo 1 GW (1 gigawatt) de escala de capacidade computacional, utilizando o hardware Nvidia Grace Blackwell e a próxima geração de Vera Rubin.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário