Microsoft a annulé la plupart de ses licences Claude Code le mois dernier pour réduire les coûts liés à l'IA, selon The Verge. Cette décision reflète un changement plus large dans le secteur, alors que les entreprises commencent à gérer les dépenses liées à l'IA comme des budgets informatiques traditionnels, plutôt que d'encourager une adoption sans restriction. Le PDG Satya Nadella a remis en question cette semaine la viabilité d'un avenir dominé par une poignée de fournisseurs de modèles de pointe, plaidant plutôt pour un écosystème d'IA plus concurrentiel. Ce changement survient alors que les modèles open source réduisent l'écart de performance avec les systèmes propriétaires, tandis que les coûts d'inférence diminuent, créant ce que les observateurs du secteur décrivent comme la première phase déflationniste de l'IA depuis le lancement par ChatGPT du boom de l'IA générative fin 2022.
Microsoft a commencé à annuler la plupart de ses licences Claude Code le mois dernier pour réduire les coûts, a rapporté The Verge. La décision reflète un changement dans la manière dont les entreprises abordent les dépenses liées à l'IA. Au lieu d'encourager une adoption sans restriction de l'IA, les entreprises gèrent désormais les dépenses liées à l'IA comme toute autre dépense opérationnelle, en suivant la consommation de tokens, en imposant des limites d'utilisation et en acheminant les charges de travail vers des modèles moins coûteux chaque fois que possible.
Le PDG Satya Nadella a déclaré cette semaine qu'un avenir dominé par une poignée de fournisseurs de modèles de pointe n'est peut-être pas inévitable. Il a plaidé pour un écosystème d'IA plus concurrentiel où les clients peuvent choisir parmi plusieurs modèles plutôt que de compter sur quelques fournisseurs premium.
Alors que de plus en plus de fournisseurs d'IA facturent les clients en fonction de l'utilisation des tokens plutôt que par abonnements forfaitaires, chaque prompt, complétion et appel API est devenu une dépense opérationnelle mesurable. Ce changement affecte l'économie naissante des tokens du secteur. Les entreprises commencent à suivre et à gérer les dépenses liées à l'IA avec la même rigueur appliquée aux autres budgets informatiques.
Ce changement présente des défis pour les entreprises d'IA de pointe comme OpenAI et Anthropic. Leur avantage concurrentiel n'est plus défini uniquement par la construction du modèle le plus performant. Elles doivent également préserver leur pouvoir de fixation des prix dans un marché où les modèles ouverts très performants prolifèrent et où les entreprises deviennent plus soucieuses des coûts.
OpenAI et Anthropic ont toutes deux déposé confidentiellement leurs introductions en bourse auprès de la Securities and Exchange Commission (SEC) des États-Unis. Cela pourrait attirer l'attention des investisseurs non seulement sur leur avance technologique, mais aussi sur leur capacité à maintenir des prix premium dans un marché de plus en plus concurrentiel.
Z.ai a publié son modèle GLM-5.2 ce mois-ci. Les développeurs de la Silicon Valley ont salué le modèle pour ses capacités de codage et d'agents. Le modèle figure parmi les meilleurs sur les benchmarks publics d'IA et offre des performances de codage comparables aux principaux modèles propriétaires d'OpenAI et d'Anthropic pour environ un sixième du coût, selon un rapport de Reuters citant l'entreprise et des trackers de benchmarks.
De nombreux modèles open-weight les plus compétitifs émergent de Chine, réduisant rapidement l'écart avec les offres propriétaires tout en les sous-cotant sur les prix. Des entreprises chinoises, dont Z.ai, DeepSeek et Alibaba, adoptent de plus en plus des versions open-weight qui permettent aux entreprises d'héberger et de personnaliser elles-mêmes les modèles plutôt que de compter exclusivement sur des API premium.
Des chercheurs de l'Université de Chicago et de l'Université Chapman soutiennent que les contrôles à l'exportation américains sur les puces d'IA avancées ont involontairement encouragé la Chine à investir dans des écosystèmes d'IA ouverts et dans l'innovation efficace en calcul. Les chercheurs ont constaté qu'après les principales mesures de contrôle à l'exportation américaines, les développeurs chinois ont augmenté leur engagement avec les dépôts de LLM open source bien plus que leurs homologues américains.
La recherche chinoise s'est orientée vers l'optimisation de l'inférence, la compression des modèles et le fine-tuning efficace des paramètres après les restrictions. Les conclusions des chercheurs suggèrent que les contrôles à l'exportation ont peut-être accéléré plutôt qu'entravé le développement par la Chine de modèles d'IA ouverts économes en coûts.
Le Global X Artificial Intelligence & Technology ETF (AIQ) a augmenté de 47 % au cours des 12 derniers mois. L'iShares U.S. Technology ETF (IYW) a augmenté de 44 % sur la même période.
Pourquoi Microsoft a-t-il annulé les licences Claude Code ? Microsoft a annulé la plupart de ses licences Claude Code le mois dernier pour réduire les coûts liés à l'IA, comme l'a rapporté The Verge. Cette décision reflète une tendance plus large du secteur où les entreprises gèrent les dépenses liées à l'IA comme des budgets informatiques traditionnels plutôt que d'encourager une adoption sans restriction.
Quelle est la différence de coût entre le GLM-5.2 de Z.ai et les modèles propriétaires ? Le modèle GLM-5.2 de Z.ai offre des performances de codage comparables aux principaux modèles propriétaires d'OpenAI et d'Anthropic pour environ un sixième du coût, selon un rapport de Reuters citant l'entreprise et des trackers de benchmarks. Le modèle a été publié ce mois-ci et figure parmi les meilleurs sur les benchmarks publics d'IA.
Actualités associées
L'action Microsoft enregistre son pire premier semestre depuis 2000 avec une baisse de 24 %.
Mastercard vise 2030 pour le virage vers les paiements par jeton et biométriques
AnthropicaccuseAlibabademenerlaplusgrandecampagneconnuepourcopierClaudeAI
MSTR, PLTR, NFLX atteignent leurs plus bas niveaux en 52 semaines dans un contexte de rotation du marché.
Une fuite du code de Claude d'Anthropic suggère le retour de Fable 5 avec des limites d'utilisation hebdomadaires