L’analyste Zeitgeist a déclaré que la demande de puces mémoire utilisées dans l’intelligence artificielle dépasse de plusieurs ordres de grandeur la capacité de production mondiale actuelle, suggérant que les stocks des fabricants de mémoire pourraient être multipliés par dix si leur valeur était calculée selon les besoins réels en calcul plutôt que par rapport aux plus hauts historiques. Zeitgeist a fourni un exemple d’investissement : 50 000 dollars placés dans des actions Micron en septembre de l’année dernière vaudraient aujourd’hui environ 489 000 dollars. L’analyste a attribué le déséquilibre offre-demande aux limites fixes de mémoire à bande passante élevée (HBM) dans les accélérateurs d’IA, et à l’adoption rapide d’agents d’IA qui consomment bien plus de mémoire par session que les chatbots traditionnels, un changement qui survient pendant que la production de mémoire évolue plus lentement que la croissance de l’usage.
Les accélérateurs d’IA font face à des limites de mémoire fixes
Chaque accélérateur d’IA est livré avec une quantité fixe de mémoire haute vitesse qui ne peut pas être étendue après déploiement. D’après Zeitgeist, une puce H100 standard contient 80 Go de HBM, les générations plus récentes offrent jusqu’à 192 Go, et le futur B300 aura 288 Go. Ce plafond détermine combien de requêtes un seul accélérateur peut traiter simultanément.
L’analyste a expliqué que la principale charge mémoire ne provient pas des poids du modèle, mais du cache KV : une mémoire de session qui augmente à chaque token généré. Zeitgeist a calculé qu’une session avec un contexte de 128 000 tokens nécessite environ 20 Go de mémoire, ce qui signifie que seulement quatre sessions de ce type épuiseraient entièrement les ressources d’un seul H100. Des modèles avancés comme Claude Opus 4,8 ou GPT-5,5 nécessitent 40 Go à 100 Go pour une seule longue requête, selon l’analyste.
L’analyste calcule un déficit de mémoire de 60x lié à l’adoption des agents
Zeitgeist a identifié le passage des chatbots simples aux agents d’IA comme le principal moteur de la demande en mémoire. Tandis qu’une question normale impose une charge minimale sur la mémoire, un agent qui appelle indépendamment des outils et accumule du contexte peut facilement atteindre 100 000 tokens ou plus. L’analyste a calculé qu’un seul travailleur du savoir lançant en parallèle dix de ces agents exigerait environ 152 Go de mémoire.
Zeitgeist a noté qu’il existe environ 250 millions de travailleurs du savoir dans le monde. L’analyste a estimé qu’avec 100 sessions agent par personne et par jour, le monde aurait besoin d’environ 60 fois plus de mémoire que celle qui sera produite en 2026. Zeitgeist a reconnu que de nouvelles méthodes d’attention peuvent réduire l’utilisation mémoire de 4 à 8 fois, mais a déclaré que la demande augmente plus vite, car les agents remplacent les discussions simples, les fenêtres de contexte passent de 128 000 à 10 millions de tokens, et l’usage de l’IA par chaque travailleur passe de zéro à des centaines de sessions.
SK Hynix dépasse Samsung alors que la demande en mémoire IA explose
Le fabricant sud-coréen de mémoire SK Hynix a dépassé Samsung comme la société cotée la plus précieuse du pays, porté par sa position sur les puces de mémoire à bande passante élevée utilisées pour les charges de travail d’intelligence artificielle. Zeitgeist a déclaré que ce changement soutient la thèse selon laquelle les producteurs de mémoire deviennent de grands bénéficiaires de la course à l’infrastructure d’IA, les entreprises capables de produire des puces mémoire avancées étant bien placées pour voir leurs revenus et valorisations augmenter fortement à mesure que la demande en HBM croît plus vite que l’offre.
FAQ
Que a dit l’analyste Zeitgeist au sujet des valorisations boursières des puces mémoire ?
Zeitgeist a déclaré que les actions des fabricants de mémoire pourraient augmenter jusqu’à dix fois par rapport aux niveaux actuels si elles étaient évaluées selon les besoins réels en calcul plutôt que par rapport aux plus hauts historiques, citant une demande en mémoire IA qui dépasse de plusieurs ordres de grandeur la capacité de production mondiale.
De quelle quantité de mémoire une session d’agent IA a-t-elle besoin selon Zeitgeist ?
Zeitgeist a calculé qu’une session avec un contexte de 128 000 tokens nécessite environ 20 Go de mémoire, tandis que des modèles avancés comme Claude Opus 4,8 ou GPT-5,5 exigent 40 Go à 100 Go pour une seule longue requête. L’analyste a estimé qu’un travailleur du savoir exécutant dix sessions d’agents en parallèle aurait besoin d’environ 152 Go de mémoire.