Страница 1: Тест и обзор: NVIDIA Titan V – приложения для рабочих станций и вычисления

С представлением видеокарты Titan V на основе GPU GV100 и архитектуры Volta, линейка NVIDIA Titan сделала шаг в сторону профессиональных сценариев, на время позабыв об игровом сегменте. Что видно не только по цене, но и по результатам наших игровых тестов – архитектура Volta не ориентирована на игры, поскольку многие функции чипа игровыми движками просто не используются. Теперь настало время оценить возможности Titan V в классических приложениях для рабочих станцией, в сценариях машинного и глубокого обучения.

Подобный поворот с линейкой NVIDIA Titan вряд ли удивляет. Линейка все больше заходила на профессиональный сегмент – не только из-за высокой цены более 1.000 евро, но и по причине соответствующих библиотек CUDA, которые позволяют задействовать аппаратные возможности чипа. NVIDIA решила предложить разработчикам и специалистам решение начального уровня, а когда им потребуется более мощное "железо", NVIDIA сможет предложить им более мощные варианты. Все же если разработчики начали создавать свои проекты на основе аппаратного обеспечения NVIDIA, то и в будущем, скорее всего, они продолжат его придерживаться. В целом, движущей силой архитектуры Volta является огромный прирост производительности в сценариях глубокого обучения.

В рамках данной статьи мы проведем сравнение с другими видеокартами для рабочих станций, результаты тестов которых мы получили несколько недель назад. В обзоре видеокарт AMD и NVIDIA для рабочих станций мы протестировали Radeon WX 4100,5100 и 7100, а также NVIDIA Quadro P2000, P6000 и GP100.

Но перед тем, как мы перейдем к результатам тестов, позвольте напомнить технические спецификации NVIDIA Titan V.

Обзор технических спецификаций NVIDIA Titan V
Модель: NVIDIA Titan V
Цена: 3.100 евро
Сайт производителя: NVIDIA
Техническая информация
GPU: GV100
Техпроцесс: 12 нм
Число транзисторов: 21,1 млрд.
Тактовая частота GPU (базовая): 1.200 МГц
Тактовая частота GPU (Boost) 1.455 МГц
Частота памяти 1.850 МГц
Тип памяти HBM2
Объём памяти 12 GB
Ширина шины памяти 3.072 бит
Пропускная способность памяти 652,8 Гбайт/с
Версия DirectX: 12
Потоковые процессоры: 5.120
Текстурные блоки: 320
Конвейеры растровых операций (ROP): 96
Типичное энергопотребление: 250 Вт
SLI/CrossFire -

NVIDIA Titan V опирается на GPU GV100 с архитектурой Volta. Ее NVIDIA официально представила весной. До сих пор чип существует только в одной версии с 5.120 потоковыми процессорами – он используется на всех видеокартах и вычислительных ускорителях. Отметим 320 текстурных блоков и 640 ядер Tensor, которые выполняют вычисления INT8. Для процесса тренировки сетей глубокого обучения наиболее важны операции матричного умножения (BLAS GEMM), именно на них ориентированы ядра Tensor. У ядер Tensor в SM имеются собственные пути передачи данных, их также можно полностью выключать с помощью стробирования частоты, если ядра не требуются. Каждое ядро Tensor может обрабатывать матрицу 4 x 4 x 4 в виде D = A x B + C. Входные матрицы A и B относятся к типу FP16, для сложения может использоваться матрица FP16 или FP32. Каждое ядро Tensor выполняет 64 операции FMA со смешанной точностью за такт – каждая такая операция может содержать умножение и сложение. В итоге восемь ядер Tensor на SM обеспечивают производительность 1.024 операций с плавающей запятой за такт.

GPU работает на базовой частоте 1.200 МГц, благодаря технологии GPU Boost частота может увеличиваться до 1.455 МГц и выше. Но если задействовать ядра Tensor, что в нашем случае происходило в тестах глубокого обучения, частота GPU не поднималась выше 1.335 МГц. Ограничивающим фактором, похоже, был 250-Вт тепловой пакет. Система охлаждения под стрессовой нагрузкой тоже ограничивает производительность, в результате частоты GPU находились в диапазоне от 1.200 до 1.400 МГц.

Отличительной особенностью Titan V стала подсистема памяти, вместо привычных 16 Гбайт HBM2 с 4.096-битной шиной NVIDIA установила 12 Гбайт с 3.072-битным интерфейсом. С частотой памяти 850 МГц мы получаем пропускную способность 652,8 Гбайт/с. Конечно, разница между 12 и 16 Гбайт HBM2 весьма существенна. Но мы пока не нашли приложение, которое бы ограничивалось 12 Гбайт. Конечно, монтаж видео 8K возможен только на видеокартах Quadro P6000 с 24 Гбайт GDDR5X. Но A Titan V для данного сценария вряд ли можно рекомендовать. Карта все же нацелена на приложения, чувствительные к высокой пропускной способности памяти.