> > > > NVIDIA представила Tesla V100 в формате карты PCI Express

NVIDIA представила Tesla V100 в формате карты PCI Express

Опубликовано:

nvidiaНа GPU Technology Conference 2017 компания NVIDIA объявила, что Tesla V100 на базе GV100 GPU на архитектуре Volta появится в трех разных вариантах, два из которых будут с интерфейсом PCI Express. Теперь производитель официально представил более крупную версию PCIe, а также опубликовал некоторые ранее неизвестные технические данные.

Но сначала о ситуации с тремя моделями: в первую очередь, видеокарта будет представлена в формате модуля SXM2 с поддержкой NVLink для серверов. Также есть вариант карты PCI Express для тренировки сетей глубокого обучения. Наконец, карта расширения Tesla V100 с тепловым пакетом 150 Вт в формате FHHL ориентирована на обработку запросов в сети глубокого обучения.

Большую карту PCI Express будет удобно использовать в серверах со стандартизированными условиями, такими как потребление энергии и требования к окружающему пространству. Именно поэтому NVIDIA придерживается стандартных значений в этой области. TDP видеокарты снижается с 300 Вт в случе с модулем SMX2 до привычных 250 Вт. Вместе с этим снижается частота и теоретическая производительность. Версия PCI Express должна быть примерно на 6% медленнее.

Обзор характеристик Tesla V100
Модель Tesla P100 (SMX2) Tesla V100 (SMX2) Tesla V100 (PCIe)
Технические данные
GPU GP100 GV100 GV100
Техпроцесс 16 нм 12 нм 12 нм
Транзисторы 15,3 млрд. 21 млрд. 21 млрд.
Площадь чипа 610 мм² 815 мм² 815 mm
Базовая частота GPU 1.328 МГц - -
Частота GPU (Boost) 1.480 МГц 1.455 МГц 1.370 МГц
Чатсота памяти 737 МГц 878 МГц 878 МГц
Тип памяти HBM2 HBM2 HBM2
Ёмкость памяти 16 GB 16 GB 16 GB
Ширина шины памяти 4.096 бит 4.096 бит бит 4.096 бит
Пропускная способность 720 GB/s 900 GB/s 900 GB/s
Потоковые процессоры 3.584 5.120 5.120
Ядра Tensor - 640 640
Производительность FP16 21,2 TFLOPS 30 TFLOPS 28 TFLOPS
Производительность FP32 10,6 TFLOPS 15 TFLOPS 14 TFLOPS
Производительность FP64 5,3 TFLOPS 7,5 TFLOPS 7 TFLOPPS
Производительность Int8 - 120 TFLOPS 112 TFLOPS
TDP 300 Вт 300 Вт  250 Вт

В отличие от поколения Tesla P100, здесь не будет варианта с меньшим числом потоковых процессоров и с урезанной памятью. Напомним, что Tesla P100 существует в вариантах с 16 и 12 Гбайт HBM2. Отсутствие такой страгеии в случае с Tesla V100 может означать улучшения на этапе производства, поскольку теперь не остается отбракованных чипов, которые необходимо тоже как-то использовать.

Tesla V100 в варианте карты PCI Express появится ближе к концу года. Цена должна остаться, как минимум, на уровне видеокарты предыдущего поколения, которая стоит около 7.000 евро.