2026-03-17 03:20:46

Nvidia GTC 2026: Jensen Huang представляє $1 трильйонну дорожну карту AI від Землі до космосу

Конференція Nvidia GTC 2026 офіційно стартувала 16 березня в центрі SAP в Сан-Хосе, Каліфорнія, коли співзасновник і генеральний директор Jensen Huang виголосив ефектну доповідь, яка тривала понад дві години. Одягнений у свою характерну шкіряну куртку, Huang представив широкомасштабне бачення майбутнього AI, представивши нові архітектури обладнання, революційні оновлення програмного забезпечення та амбітивне розширення у космос.

Економіка "розумних токенів" і $1 трильйонна перспектива

Huang розпочав з переосмислення траєкторії AI, заявивши, що індустрія переходить від "ери навчання моделей" до "ери висновків". Він представив концепцію "розумних токенів" як фундаментальної одиниці економіки AI — кожна згенерована AI відповідь, зображення чи рішення представляють токен, створений тим, що він називав "AI фабриками" або "фабриками токенів". Цей концептуальний зрушок переповнює центри обробки даних від центрів витрат до установок, що генерують дохід.

Фінансовий масштаб цього бачення вражаючий. Huang оголосив, що Nvidia бачить замовлення на закупівлю своїх поточних і наступних поколінь систем — Blackwell та Vera Rubin — на суму **$1 трильйонів до 2027 року**. Це подвоює можливість $500 мільярдів, яку компанія прогнозувала торік, сигналізуючи про те, що попит на AI від підприємств залишається ненаситним, незважаючи на ширші економічні невизначеності.

Апаратні інновації: платформа Vera Rubin та далі

Платформа AI Factory Vera Rubin

Центральною частиною оголошень про обладнання було повне представлення платформи Vera Rubin, наступника Blackwell від Nvidia. На відміну від одного чипа, Vera Rubin позиціонується як повна "платформа AI фабрики", яка складається з:

· Vera CPU: новий спеціально розроблений центральний процесор Nvidia, створений спеціально для навантажень AI. Він забезпечує удвічі більшу ефективність і на 50% швидший за традиційні CPU.
· Rubin GPU: графічний процесор наступного покоління, розроблений для обробки багатомодальних моделей з трильйонами параметрів.
· NVLink шостого покоління: передова технологія інтерконекту, яка дозволяє сотням Rubin GPU функціонувати як один величезний віртуальний GPU.
· CPO комутатори: інтегрована технологія (CPO) з упакованою оптикою замінює традиційне мідне кабелювання оптичним зв'язком, драматично зменшуючи споживання енергії та збільшуючи пропускну здатність.

Вся платформа охолоджується рідиною й розроблена для розгортання "AI фабрики", де клієнти можуть просто підключити живлення та дані, щоб розпочати виробництво AI.

Rubin Ultra та архітектура Feynman

Дивлячись далі в майбутнього, Huang показав попередній перегляд платформи Rubin Ultra з архітектурою Kyber — революційним дизайном, де обчислювальні лотки розташовуються вертикально для підвищення щільності та зменшення затримки. Kyber інтегруватиме 144 GPU в системі масштабу одної стійки, очікується поставка у 2027 році.

Навіть у більш далекому майбутньому Huang підтвердив, що Nvidia вже розробляє архітектуру наступного покоління під кодовою назвою Feynman, названу на честь фізика Richard Feynman. Ця архітектура буде використовувати 3D-складені чипи та спеціалізовану пам'ять HBM, просуваючи межі продуктивності до 2030 року.

Стратегічна інтеграція Groq: механізм висновків LPU

Одне з найбільш значущих оголошень включало інтеграцію технології від Groq, стартапу AI висновків, технологію якого Nvidia ліцензувала приблизно за $20 мільярдів у грудні. Співпраця дала результат у вигляді мовного блоку обробки Nvidia Groq 3 (LPU), тепер просто брендований як чип висновків LPX.

Прискорення висновків у 35 разів

Groq 3 LPX розроблений спеціально для низьколатентних висновків — критичної фази, де моделі AI генерують відповіді в реальному часі. Huang продемонстрував, як архітектура LPX працює разом з Rubin GPU через техніку, яку називають "розкриття висновків":

· GPU обробляють етап "заповнення" (обробка введення користувача паралельно)
· LPU обробляють етап "декодування" (генерування токенів послідовно з мінімальною затримкою)

Цей розподіл праці дає заявлене поліпшення в 35 разів у продуктивності токенів на ват при додаванні Groq LPU до систем Rubin. Стійка Groq 3 LPX містить 256 LPU і розроблена таким чином, щоб розташовуватися поряд зі стійками Vera Rubin у центрах обробки даних.

Huang був прагматичним щодо розгортання, припускаючи, що для навантажень, що вимагають максимальної пропускної здатності, чиста Vera Rubin залишається оптимальною. Однак для "генерування токенів високої цінності" та застосувань кодування додавання Groq LPU приблизно до 25% центру обробки даних забезпечує оптимальну продуктивність.

Чипи LPX вже знаходяться в масовому виробництві в Samsung і очікується поставка у третьому кварталі 2026 року.

Програмне забезпечення та AI агенти: NemoClaw та відкриті моделі

NemoClaw для AI агентів підприємства

Спираючись на явище відкритого джерела OpenClaw — яке Huang зазначив став найшвидше зростаючим проектом відкритого коду в історії — Nvidia представила NemoClaw, платформу, готову до підприємства, для розгортання AI агентів.

Платформа забезпечує повний "еталонний стек", який автоматично завантажує OpenClaw та будує готові до виробництва AI агенти з безпекою, конфіденційністю та функціями управління на рівні підприємства. Це позиціонує Nvidia для конкуренції з пропозиціями від OpenAI та інших хмарних провайдерів на швидко зростаючому ринку агентного AI.

Співпраця в галузі відкритих моделей

Huang оголосив про "Nemotron Alliance", співпрацю з провідними лабораторіями AI, включаючи Mistral AI, Ai2 та інших, для розробки відкритих моделей першопроходців. Цю ініціативу слід розглядати як відображення прихильності Nvidia до інноваційного відкритого коду, який Huang характеризував як необхідний для поширення AI у всіх галузях.

Ігри та графіка: DLSS 5

Ігри залишаються частиною спадщини Nvidia, і Huang подав значне оновлення для геймерів з DLSS 5. Описаний як "найбільш значущий прорив в комп'ютерній графіці після дебюту рендерингу промінів у реальному часі в 2018 році", DLSS 5 використовує генеративний AI для рендерингу цілих ігрових сцен у реальному часі.

Технологія використовує моделі AI для генерування фотореалістичного освітлення та матеріалів, ефективно перетворюючи ігровий рендеринг на проблему висновку AI. Huang порівняв це з "GPT моментом" графіки. Великі видавці ігор, включаючи Capcom, Tencent та NetEase, зробили зобов'язання щодо підтримки DLSS 5, який очікується запуститися восени 2026 року з аборигенною підтримкою 4K.

Фізичний AI: автономні транспортні засоби та робототехніка

Розширення автономного транспорту

Доповідь містила значні оновлення в автономному транспорті. Uber оголосив плани розгорнути флот, живлений програмним забезпеченням Nvidia Drive AV, у 28 містах на чотирьох континентах до 2028 року, починаючи з Лос-Анджелеса та Сан-Франциско у 2027 році.

Декілька основних автовиробників зобов'язались будувати транспортні засоби автономного рівня 4 на платформі Nvidia Drive Hyperion, включаючи:

· Nissan
· BYD
· Geely
· Hyundai
· Isuzu (автономні автобуси, у партнерстві з Tier IV)

Huang характеризував автономні транспортні засоби як "потенційно першу мультитрильйонну дорогу робототехнічної індустрії", де Nvidia забезпечує повну інфраструктуру від навчання до розгортання.

Співпраця з Disney: робот "Олаф"

У чарівний момент Huang був приєднаний на сцені робот, розроблений у спільноті з Disney — робоцька версія Олафа з "Крижане серце". Робот продемонстрував природну ходу, жести та розмовну взаємодію, демонструючи платформу симуляції Nvidia Isaac Sim та модулі робототехніки Jetson Thor.

Ця демонстрація втілила бачення Nvidia про "фізичний AI" — системи AI, які не просто обробляють інформацію, а взаємодіють з фізичним світом та працюють в ньому.

Дослідження космосу: Space-1 Vera Rubin

Можливо, найбільш футуристичне оголошення було Space-1 Vera Rubin, модуль обчислювального AI, розроблений для розгортання у космосі. Побудований для протистояння екстремальній радіації та умовам температури, ці модулі можуть бути встановлені на супутниках або космічних станціях.

Наслідки є глибокими: супутники, оснащені Space-1, можуть обробляти зображення та дані датчиків на орбіті, а не передавати необроблені дані на Землю. Погодний супутник міг би ідентифікувати ураган, який формується, і видавати попередження безпосередньо без очікування наземної обробки. Huang описав це як "побудову повної архітектури обчислень від Землі до космосу".

CUDA на 20: святкування спадщини

Протягом всієї доповіді Huang міркував про 20-річне інвестування Nvidia в CUDA, платформу паралельних обчислень, представлену у 2006 році. Те, що розпочалося як ризикована ставка на обчислення GPU, стало фундаментальним програмним шаром для всієї індустрії AI.

"Двадцять років ми займаємось цією архітектурою — цим революційним винаходом", - сказав Huang аудиторії. 20-річниця CUDA послужила нагадуванням про довгострокову прихильність Nvidia до прискорених обчислень, задовго до того, як AI став мейнстрімом.

Реакція ринку та перспектива аналітиків

Акції Nvidia виросли приблизно на 2% під час доповіді, хоча прибутки помірилися до закриття на 1,65% коли інвестори засвоїли масштаб прогнозу замовлення $1 трильйонів. Аналітики припустили, що, хоча цифра виглядала драматично, вона може вирівнюватися з очікуваннями консенсусу при повному моделюванні.

Wedbush Securities охарактеризував вихід Nvidia як "дуже бичачий", зазначивши, що компанія ефективно рамує адресний ринок $3 трильйонів до $4 трильйонів в інфраструктурі AI до 2030 року. Аналітики Morgan Stanley спостерігали, що явне керівництво Huang до 2027 року повинно допомогти інвесторам побудувати комфорт з тривалістю циклу інвестицій AI.

Загальна картина: промислова революція AI

Huang завершив широкомасштабним баченням: те, що розпочалося як "момент iPhone" для AI три роки тому, перетворилося на повномасштабну промислову революцію. AI фабрики, що виробляють розумні токени, стануть таким же фундаментальними для глобальної економіки, як електростанції, що генерують електроенергію.

"Вартість обчислень різко знижується, а інновації прискорюються експоненціально", - сказав Huang. "Зараз найкращий час почати будувати майбутнього".

GTC 2026 продовжується до 19 березня в Сан-Хосе з більш ніж 1000 сесіями, практичним навчанням та спеціальною панеллю з відкритих моделей першопроходців, модерованою Huang 18 березня. Для тих, хто не може відвідати особисто, сесії залишаються доступними для віртуальної участі через платформу подій Nvidia.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

2 лайків