На GPU Technology Conference 2017 компания NVIDIA объявила, что Tesla V100 на базе GV100 GPU на архитектуре Volta появится в трех разных вариантах, два из которых будут с интерфейсом PCI Express. Теперь производитель официально представил более крупную версию PCIe, а также опубликовал некоторые ранее неизвестные технические данные.
Но сначала о ситуации с тремя моделями: в первую очередь, видеокарта будет представлена в формате модуля SXM2 с поддержкой NVLink для серверов. Также есть вариант карты PCI Express для тренировки сетей глубокого обучения. Наконец, карта расширения Tesla V100 с тепловым пакетом 150 Вт в формате FHHL ориентирована на обработку запросов в сети глубокого обучения.
Большую карту PCI Express будет удобно использовать в серверах со стандартизированными условиями, такими как потребление энергии и требования к окружающему пространству. Именно поэтому NVIDIA придерживается стандартных значений в этой области. TDP видеокарты снижается с 300 Вт в случе с модулем SMX2 до привычных 250 Вт. Вместе с этим снижается частота и теоретическая производительность. Версия PCI Express должна быть примерно на 6% медленнее.
Обзор характеристик Tesla V100 | |||
---|---|---|---|
Модель | Tesla P100 (SMX2) | Tesla V100 (SMX2) | Tesla V100 (PCIe) |
Технические данные | |||
GPU | GP100 | GV100 | GV100 |
Техпроцесс | 16 нм | 12 нм | 12 нм |
Транзисторы | 15,3 млрд. | 21 млрд. | 21 млрд. |
Площадь чипа | 610 мм² | 815 мм² | 815 mm |
Базовая частота GPU | 1.328 МГц | - | - |
Частота GPU (Boost) | 1.480 МГц | 1.455 МГц | 1.370 МГц |
Чатсота памяти | 737 МГц | 878 МГц | 878 МГц |
Тип памяти | HBM2 | HBM2 | HBM2 |
Ёмкость памяти | 16 GB | 16 GB | 16 GB |
Ширина шины памяти | 4.096 бит | 4.096 бит бит | 4.096 бит |
Пропускная способность | 720 GB/s | 900 GB/s | 900 GB/s |
Потоковые процессоры | 3.584 | 5.120 | 5.120 |
Ядра Tensor | - | 640 | 640 |
Производительность FP16 | 21,2 TFLOPS | 30 TFLOPS | 28 TFLOPS |
Производительность FP32 | 10,6 TFLOPS | 15 TFLOPS | 14 TFLOPS |
Производительность FP64 | 5,3 TFLOPS | 7,5 TFLOPS | 7 TFLOPPS |
Производительность Int8 | - | 120 TFLOPS | 112 TFLOPS |
TDP | 300 Вт | 300 Вт | 250 Вт |
В отличие от поколения Tesla P100, здесь не будет варианта с меньшим числом потоковых процессоров и с урезанной памятью. Напомним, что Tesla P100 существует в вариантах с 16 и 12 Гбайт HBM2. Отсутствие такой страгеии в случае с Tesla V100 может означать улучшения на этапе производства, поскольку теперь не остается отбракованных чипов, которые необходимо тоже как-то использовать.
Tesla V100 в варианте карты PCI Express появится ближе к концу года. Цена должна остаться, как минимум, на уровне видеокарты предыдущего поколения, которая стоит около 7.000 евро.