Le PDG de Coinbase, Brian Armstrong, a déclaré le 26 juin que Coinbase avait défini les modèles GLM 5.2 de Zhipu AI et Kimi 2.7 de Beijing Moonshot AI comme modèles de langage par défaut pour ses ingénieurs en interne. Les dépenses AI de Coinbase ont été réduites de près de moitié, tandis que l'utilisation de tokens continue de croître de façon exponentielle.
Armstrong a expliqué que GLM 5.2 et Kimi 2.7 sont principalement déployés pour les tâches courantes, comme l'assistance standard au codage dans les workflows d'ingénierie générale. Pour les tâches nécessitant une planification complexe, les ingénieurs peuvent toujours choisir des modèles de pointe. Lors des revues de code, Coinbase adopte une stratégie multi-modèles parallèle, où différents modèles se vérifient mutuellement les résultats pour maintenir les normes de qualité.
Armstrong attribue la réduction de près de moitié des dépenses AI de Coinbase à la restructuration suivante en trois couches :
Routage intelligent : Le système prétraite les prompts, combine le taux de hit du cache et la tarification des modèles, et distribue automatiquement les tâches au modèle le plus adapté et le plus économique.
Cache agressif : Toutes les requêtes doivent être conscientes du cache. Le taux de hit du cache de LibreChat est passé de 5 % à 60 %.
Contexte simplifié : Les ingénieurs sont invités à ouvrir une nouvelle session lors du changement de tâche et à réduire la portée des fichiers pour diminuer les tokens gaspillés.
Armstrong a souligné que l'objectif de cette optimisation des coûts n'est pas de freiner l'utilisation, mais d'élargir l'adoption de l'IA. Il a déclaré que le but est de permettre aux ingénieurs d'utiliser librement n'importe quel nombre de tokens et de modèles, sans plafond de coûts, tout en liant l'utilisation à l'impact commercial. Armstrong estime que ce modèle peut être adopté par toute entreprise, ces déclarations étant publiques et personnelles.
GLM 5.2 est le dernier modèle publié par l'entreprise chinoise d'IA Zhipu AI ; Kimi 2.7 est un modèle de langage de Beijing Moonshot AI. Les deux modèles sont publiés en open source. Armstrong a expliqué que Coinbase les déploie pour les tâches d'ingénierie courantes, tandis que les tâches complexes utilisent toujours des modèles de pointe.
Selon Armstrong, le cœur de la réduction des coûts est la restructuration en trois couches : routage intelligent (distribution automatique des tâches au modèle le plus économique), cache agressif (taux de hit du cache de LibreChat passant de 5 % à 60 %), et contexte simplifié (réduction des tokens gaspillés). Sur cette base, l'utilisation de modèles open source chinois moins chers pour remplacer une partie des tâches courantes des modèles américains de pointe permet de réduire davantage les dépenses globales.
Selon la déclaration publique d'Armstrong du 26 juin 2026, il n'a pas mentionné les détails de la vérification de sécurité des données ou les arrangements de conformité liés à l'adoption de GLM 5.2 et Kimi 2.7. Coinbase étant une plateforme d'échange de crypto-actifs régulée aux États-Unis, le contenu spécifique du cadre de conformité n'a pas été divulgué dans cette déclaration.
CZ en interview analyse trois grandes raisons du marché baissier, annonce qu'il ne dirigera plus l'échange de cryptomonnaies
Le calendrier de déblocage des tokens met $241M Supply en lumière
Le calendrier de déverrouillage des jetons met $241M Supply en avant
Le modèle d'IA chinois GLM 5.2 attire les entreprises cherchant des alternatives ouvertes.