Страница 1: Тест и обзор: NVIDIA Titan V – приложения для рабочих станций и вычисления
С представлением видеокарты Titan V на основе GPU GV100 и архитектуры Volta, линейка NVIDIA Titan сделала шаг в сторону профессиональных сценариев, на время позабыв об игровом сегменте. Что видно не только по цене, но и по результатам наших игровых тестов – архитектура Volta не ориентирована на игры, поскольку многие функции чипа игровыми движками просто не используются. Теперь настало время оценить возможности Titan V в классических приложениях для рабочих станцией, в сценариях машинного и глубокого обучения.
Подобный поворот с линейкой NVIDIA Titan вряд ли удивляет. Линейка все больше заходила на профессиональный сегмент – не только из-за высокой цены более 1.000 евро, но и по причине соответствующих библиотек CUDA, которые позволяют задействовать аппаратные возможности чипа. NVIDIA решила предложить разработчикам и специалистам решение начального уровня, а когда им потребуется более мощное "железо", NVIDIA сможет предложить им более мощные варианты. Все же если разработчики начали создавать свои проекты на основе аппаратного обеспечения NVIDIA, то и в будущем, скорее всего, они продолжат его придерживаться. В целом, движущей силой архитектуры Volta является огромный прирост производительности в сценариях глубокого обучения.
В рамках данной статьи мы проведем сравнение с другими видеокартами для рабочих станций, результаты тестов которых мы получили несколько недель назад. В обзоре видеокарт AMD и NVIDIA для рабочих станций мы протестировали Radeon WX 4100,5100 и 7100, а также NVIDIA Quadro P2000, P6000 и GP100.
Но перед тем, как мы перейдем к результатам тестов, позвольте напомнить технические спецификации NVIDIA Titan V.
Модель: | NVIDIA Titan V | |||
Цена: | 3.100 евро | |||
Сайт производителя: | NVIDIA | |||
Техническая информация | ||||
---|---|---|---|---|
GPU: | GV100 | |||
Техпроцесс: | 12 нм | |||
Число транзисторов: | 21,1 млрд. | |||
Тактовая частота GPU (базовая): | 1.200 МГц | |||
Тактовая частота GPU (Boost) | 1.455 МГц | |||
Частота памяти | 1.850 МГц | |||
Тип памяти | HBM2 | |||
Объём памяти | 12 GB | |||
Ширина шины памяти | 3.072 бит | |||
Пропускная способность памяти | 652,8 Гбайт/с | |||
Версия DirectX: | 12 | |||
Потоковые процессоры: | 5.120 | |||
Текстурные блоки: | 320 | |||
Конвейеры растровых операций (ROP): | 96 | |||
Типичное энергопотребление: | 250 Вт | |||
SLI/CrossFire | - |
NVIDIA Titan V опирается на GPU GV100 с архитектурой Volta. Ее NVIDIA официально представила весной. До сих пор чип существует только в одной версии с 5.120 потоковыми процессорами – он используется на всех видеокартах и вычислительных ускорителях. Отметим 320 текстурных блоков и 640 ядер Tensor, которые выполняют вычисления INT8. Для процесса тренировки сетей глубокого обучения наиболее важны операции матричного умножения (BLAS GEMM), именно на них ориентированы ядра Tensor. У ядер Tensor в SM имеются собственные пути передачи данных, их также можно полностью выключать с помощью стробирования частоты, если ядра не требуются. Каждое ядро Tensor может обрабатывать матрицу 4 x 4 x 4 в виде D = A x B + C. Входные матрицы A и B относятся к типу FP16, для сложения может использоваться матрица FP16 или FP32. Каждое ядро Tensor выполняет 64 операции FMA со смешанной точностью за такт – каждая такая операция может содержать умножение и сложение. В итоге восемь ядер Tensor на SM обеспечивают производительность 1.024 операций с плавающей запятой за такт.
GPU работает на базовой частоте 1.200 МГц, благодаря технологии GPU Boost частота может увеличиваться до 1.455 МГц и выше. Но если задействовать ядра Tensor, что в нашем случае происходило в тестах глубокого обучения, частота GPU не поднималась выше 1.335 МГц. Ограничивающим фактором, похоже, был 250-Вт тепловой пакет. Система охлаждения под стрессовой нагрузкой тоже ограничивает производительность, в результате частоты GPU находились в диапазоне от 1.200 до 1.400 МГц.
Отличительной особенностью Titan V стала подсистема памяти, вместо привычных 16 Гбайт HBM2 с 4.096-битной шиной NVIDIA установила 12 Гбайт с 3.072-битным интерфейсом. С частотой памяти 850 МГц мы получаем пропускную способность 652,8 Гбайт/с. Конечно, разница между 12 и 16 Гбайт HBM2 весьма существенна. Но мы пока не нашли приложение, которое бы ограничивалось 12 Гбайт. Конечно, монтаж видео 8K возможен только на видеокартах Quadro P6000 с 24 Гбайт GDDR5X. Но A Titan V для данного сценария вряд ли можно рекомендовать. Карта все же нацелена на приложения, чувствительные к высокой пропускной способности памяти.