Аналитик: спрос на AI-память может поднять акции чипов в 10 раз выше

Аналитик Zeitgeist заявил, что спрос на чипы памяти, используемые в искусственном интеллекте, на порядки превышает текущую глобальную производственную мощность, предполагая, что запасы производителей памяти могут вырасти в десять раз, если оценивать их не по историческим максимумам, а по реальным потребностям в вычислениях. Zeitgeist привел инвестиционный пример: 50 000 долларов, вложенные в акции Micron в сентябре прошлого года, сегодня стоили бы примерно 489 000 долларов. Аналитик связал дисбаланс спроса и предложения с фиксированными ограничениями высокоскоростной памяти (HBM) в AI-ускорителях и с быстрым внедрением AI-агентов, которые потребляют гораздо больше памяти за сессию, чем традиционные чатботы; этот сдвиг происходит на фоне более медленного масштабирования производства памяти по сравнению с ростом спроса.

AI-ускорители сталкиваются с фиксированными ограничениями по памяти

Каждый AI-ускоритель поставляется с фиксированным объемом высокоскоростной памяти, который нельзя расширить после развертывания. По словам Zeitgeist, стандартный чип H100 несет 80 ГБ HBM, более новые поколения предлагают до 192 ГБ, а будущий B300 будет иметь 288 ГБ. Именно этот потолок определяет, сколько запросов один ускоритель может обрабатывать одновременно.

Аналитик пояснил, что основная нагрузка по памяти идет не от весов модели, а от KV cache — сессионной памяти, которая растет с каждым сгенерированным токеном. Zeitgeist рассчитал, что одна сессия с контекстом на 128 000 токенов требует примерно 20 ГБ памяти, то есть всего четыре таких сессии полностью исчерпают ресурсы одного H100. Продвинутые модели, такие как Claude Opus 4.8 или GPT-5.5, по оценке аналитика, требуют от 40 ГБ до 100 ГБ для одного длительного запроса.

Аналитик оценивает 60-кратный дефицит памяти из-за внедрения агентов

Zeitgeist определил переход от простых чатботов к AI-агентам как ключевой драйвер спроса на память. Если обычный вопрос ложится на память с минимальной нагрузкой, то агент, который независимо вызывает инструменты и накапливает контекст, легко может достичь 100 000 токенов или даже больше. Аналитик рассчитал, что один сотрудник, который параллельно запускает десять таких агентов, потребует примерно 152 ГБ памяти.

Zeitgeist отметил, что в мире насчитывается примерно 250 миллионов сотрудников, занятых знаниями. Аналитик оценил, что при 100 агентных сессиях на человека в день миру потребуется примерно в 60 раз больше памяти, чем будет произведено в 2026 году. Zeitgeist признал, что новые методы внимания могут сократить расход памяти в 4–8 раз, но указал, что спрос растет быстрее, поскольку агенты вытесняют простые чаты, контекстные окна расширяются с 128 000 до 10 миллионов токенов, а AI-использование каждым работником смещается от нуля к сотням сессий.

SK Hynix обошла Samsung, когда спрос на AI-память резко вырос

Южнокорейский производитель памяти SK Hynix обогнал Samsung, став самой ценной котируемой компанией в стране, благодаря своей позиции в высокоскоростных чипах памяти, используемых для задач искусственного интеллекта. Zeitgeist заявил, что этот сдвиг поддерживает тезис о том, что производители памяти становятся крупными бенефициарами гонки за AI-инфраструктуру: компании, способные выпускать продвинутые чипы памяти, оказываются в положении, чтобы увидеть резкий рост выручки и оценок по мере того, как спрос на HBM растет быстрее предложения.

FAQ

Что аналитик Zeitgeist сказал о оценках акций производителей чипов памяти?

Zeitgeist заявил, что акции производителей памяти могут вырасти в десять раз относительно текущих уровней, если оценивать их по реальным потребностям в вычислениях, а не по историческим максимумам; он сослался на то, что спрос на AI-память на порядки превышает глобальную производственную мощность.

Сколько памяти требуется для сессии AI-агента по версии Zeitgeist?

Zeitgeist рассчитал, что одна сессия с контекстом на 128 000 токенов требует примерно 20 ГБ памяти, тогда как продвинутые модели, такие как Claude Opus 4.8 или GPT-5.5, требуют от 40 ГБ до 100 ГБ для одного длительного запроса. Аналитик оценил, что сотрудник, который запускает десять параллельных сессий агента, будет нуждаться примерно в 152 ГБ памяти.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев