O CEO da Coinbase, Brian Armstrong, afirmou em 26 de junho que a Coinbase definiu o GLM 5.2, lançado recentemente pela Zhipu AI, e o Kimi 2.7, da Beijing Moonshot AI (Moonshot AI), como os modelos de linguagem grandes padrão para os engenheiros internos da empresa; os gastos da Coinbase com IA foram reduzidos quase pela metade, enquanto o uso de tokens no mesmo período continuou crescendo exponencialmente.
Armstrong explicou que o GLM 5.2 e o Kimi 2.7 são implantados principalmente em cenários de tarefas rotineiras, como fluxos de trabalho gerais de engenharia, incluindo auxílio padrão em código; para tarefas que exigem planejamento complexo, os engenheiros ainda podem optar por modelos de ponta. Na etapa de revisão de código, a Coinbase adota uma estratégia de modelos múltiplos em paralelo, permitindo que diferentes modelos verifiquem os resultados uns dos outros para manter os padrões de qualidade.
Armstrong atribuiu a redução de quase metade dos gastos da Coinbase com IA à seguinte reestruturação da infraestrutura em três camadas:
Roteamento inteligente: o sistema pré-processa os prompts, combinando a taxa de acerto do cache com a precificação dos modelos, e distribui automaticamente as tarefas para o modelo mais adequado e econômico.
Cache agressivo: exige que todas as solicitações tenham consciência de cache; a taxa de acerto do cache do LibreChat saltou de 5% para 60%.
Contexto simplificado: recomenda que os engenheiros abram novas sessões ao alternar tarefas e reduzam o escopo dos arquivos para diminuir tokens desperdiçados.
Armstrong enfatizou que o objetivo dessa otimização de custos não é suprimir o uso, mas sim expandir a adoção da IA. Ele afirmou que a meta é permitir que os engenheiros usem livremente qualquer quantidade de tokens e modelos, sem um teto de custos, ao mesmo tempo em que vinculam o uso ao impacto nos negócios. Armstrong acredita que esse modelo pode ser adotado por qualquer empresa, e as declarações acima são de sua autoria pública.
O GLM 5.2 é o modelo mais recente lançado pela empresa chinesa de IA Zhipu AI; o Kimi 2.7 é o modelo de linguagem grande da Beijing Moonshot AI Technology Co., Ltd. (Moonshot AI). Ambos os modelos foram lançados como código aberto. Armstrong explicou que a Coinbase os implantou em cenários de tarefas rotineiras de engenharia, enquanto tarefas complexas ainda utilizam modelos de ponta.
De acordo com Armstrong, o núcleo da redução de custos é a reestruturação da infraestrutura em três camadas: roteamento inteligente (distribuição automática de tarefas para o modelo mais econômico), cache agressivo (taxa de acerto do cache do LibreChat subiu de 5% para 60%) e contexto simplificado (redução de tokens desperdiçados). Com base nisso, a substituição de parte do uso de tarefas rotineiras de modelos de ponta dos EUA por modelos chineses de código aberto de menor custo comprimiu ainda mais os gastos totais.
De acordo com a declaração pública de Armstrong em 26 de junho de 2026, ele não mencionou os detalhes da revisão de segurança de dados ou os arranjos de conformidade envolvidos na adoção do GLM 5.2 e do Kimi 2.7. A Coinbase é uma bolsa de criptoativos regulamentada pelos EUA, e o conteúdo específico da estrutura de conformidade relevante não foi divulgado nesta declaração.
CZ em entrevista exclusiva analisa as três principais causas do mercado de baixa e anuncia que não irá mais comandar a exchange de criptomoedas.
Cronograma de desbloqueio de tokens coloca $241M Supply em foco
Cronograma de desbloqueio de tokens coloca $241M Supply em foco
Modelo de IA chinês GLM 5.2 atrai usuários empresariais em busca de alternativas abertas