Всего за несколько месяцев до собственной конференции GTC NVIDIA использовала CES не только для анонсов для аудитории GeForce (включая DLSS 4.5 и Dynamic Multi Frame Generation), но и для новых деталей о платформе Vera Rubin. Во второй половине 2026 года она сменит нынешнее поколение Blackwell и кратно ускорит ИИ-вычисления в задачах обучения и инференса.
Сначала NVIDIA неожиданно вернулась к подсчету GPU-корпусов в стоечных решениях, а не отдельных кристаллов. Поэтому Vera Rubin NVL144 снова превращается в Vera Rubin NVL72 — и компания пока продолжает логику наименований, знакомую по Blackwell.
Далее NVIDIA раскрыла параметры отдельных компонентов. Начнем с CPU Vera.
| Grace | Vera | |
| Число ядер | 72 | 88 |
| Число потоков | 72 | 176 |
| Кэш L2 | 1 МБ | 2 МБ |
| Кэш L3 | 114 МБ | 162 МБ |
| Пропускная способность памяти | 512 ГБ/с | 1,2 ТБ/с |
| Емкость памяти | 480 ГБ LPDDR5X | 1,5 ТБ LPDDR5X |
| SIMD | 4× 128-бит SVE2 | 6× 128-бит SVE2 FP8 |
| NVLink‑C2C | 900 ГБ/с | 1,8 ТБ/с |
| PCIe/CXL | PCIe 5.0 | PCIe 6.0 / CXL 3.1 |
Vera использует 88 фирменных ядер Olympus на базе ARM. Теперь каждое ядро обрабатывает по два потока, а объем L2-кэша на ядро вырос до 2 МБ. L3-кэш увеличился до 162 МБ, но рост здесь скромнее — быстрая LPDDR5X частично компенсирует это.
Память LPDDR5X ускорилась более чем вдвое: с 512 ГБ/с до 1,2 ТБ/с, а общая емкость выросла втрое — до 1,5 ТБ. NVLink-C2C тоже удвоил пропускную способность: Vera связывается с GPU Rubin на скорости до 1,8 ТБ/с. Для роли хоста важны и PCIe 6.0 вместе с CXL 3.1 — Vera их поддерживает.
Конфигурация системы VR200 предусматривает один Vera CPU на два GPU Rubin. По PCIe 6.0 к этой связке подключают сетевые компоненты, и здесь NVIDIA тоже заметно обновила железо.
Для стоек NVIDIA планирует DPU BlueField-4. По сравнению с BlueField-3 они удваивают сетевую пропускную способность: 800 против 400 Гбит/с. Число ядер выросло с 16× ARM-A78 до 64× ARM Neoverse V2, а объем памяти — с 32 до 128 ГБ.
Ставку на быструю сеть видно и в решениях scale-out/scale-across: Ethernet-коммутаторы Spectrum-6 через оптику внутри стойки достигают 32× 1,6 Тбит/с, а наружу отдают 512× 200 Гбит/с. На следующем этапе NVIDIA обещает 409,6 Тбит/с для оптического подключения и 512× 800 Гбит/с на внешних портах.
Rubin GPU — ключевой элемент платформы
Все описанное выше обслуживает главное: GPU Rubin, которые берут на себя обучение и инференс. В одном GPU-корпусе размещаются два GPU Rubin и восемь стеков HBM4. Каждый GPU Rubin оснащается до 288 ГБ HBM4 с пропускной способностью до 22 ТБ/с; GPU-корпус с двумя ускорителями, соответственно, удваивает эти значения.
| Hopper | Blackwell | Rubin | |
| Число транзисторов (корпус) | 80 млрд | 208 млрд | 336 млрд |
| Вычислительные кристаллы | 1 | 2 | 2 |
| Техпроцесс | TSMC N4 | TSMC N4P | - |
| TDP | 700 Вт | 1 400 Вт | 2 300 Вт |
| Емкость памяти | 80 ГБ HBM3 | 288 ГБ HBM3E | 288 ГБ HBM4 |
| Пропускная способность памяти | 3 ТБ/с | 8 ТБ/с | 22 ТБ/с |
| Производительность NVFP4 при инференсе | - | 10 ПФЛОПС | 50 ПФЛОПС |
| Производительность FP8 при обучении | 2 ПФЛОПС | 5 ПФЛОПС | 17,5 ПФЛОПС |
| Производительность FP32 (вектор/матрица) | 67 / 495 ТФЛОПС | 80 / 227 ТФЛОПС | 130 / 400 ТФЛОПС |
| Производительность FP64 (вектор/матрица) | 34 / 67 ТФЛОПС | 40 / 150 ТФЛОПС | 33 / 200 ТФЛОПС |
По емкости памяти Vera Rubin относительно Blackwell не прибавляет — а AMD в Instinct MI455X поднимается до 432 ГБ. Зато NVIDIA заметно нарастила пропускную способность: 22 ТБ/с.
Также хорошо видно, что NVIDIA смещает акцент в сторону низкой точности: NVFP4 и FP8 растут резко, а FP32/FP64 демонстрируют скорее стагнацию, местами — спад.
С платформой Vera Rubin NVIDIA нацелилась на новые рекорды по метрикам вроде tokens per megawatt и другим показателям эффективности. При этом сложность стойки давно вышла за рамки «CPU+GPU»: NVIDIA теперь проектирует почти все сама, включая сетевую часть.
Еще больше подробностей о Vera Rubin NVIDIA опубликовала вотдельном посте в своем блоге.
Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).
