Тест и обзор: видеокарты AMD и NVIDIA для рабочих станций

Опубликовано:

Как правило, мы тестируем игровые видеокарты для потребительского сегмента рынка. Поэтому мы фокусируемся на игровых тестах, хотя и добавляем несколько вычислительных бенчмарков. Впрочем, они не столько демонстрируют производительность видеокарт в профессиональной среде, сколько показывают, что игровые видеокарты можно использовать и для других задач. За минувшие недели мы протестировали несколько профессиональных видеокарт от AMD и NVIDIA. Мы фокусировались на профессиональных сферах применения: 3D-рендеринг, монтаж видео и эффекты, машинное обучение.

Видеокарты для рабочих станций по аппаратной начинке идентичны настольным моделям, основные отличия связаны с программным обеспечением и драйвером. Последние обеспечивают дополнительные функции или интерфейсы, недоступные с обычными игровыми видеокартами. В некоторых приложениях драйвер обеспечивает фоновые вычисления.

Среди других преимуществ отметим расширенную гарантию производителя и поддержку на совсем другом уровне, чем в случае потребительских видеокарт. Часто видеокарты для рабочих станций позволяют подключать шесть, двенадцать или даже больше дисплеев, что требует дополнительной аппаратной поддержки, отсутствующей у игровых видеокарт.

SDK и программное обеспечение

AMD и NVIDIA предлагают программные пакеты и SDK для своих видеокарт. AMD недавно выбрала пусть с открытым исходным кодом, NVIDIA открывает свои библиотеки лишь частично. У AMD соответствующие интерфейсы называются Radeon Rays и Radeon ProRender, а также LiquidVR для создания соответствующего контента.

NVIDIA тоже предлагает помощь разработчикам, в том числе в сфере виртуализации. Здесь можно назвать Iray или Mental Ray.

AMD Radeon Pro WX

На данный момент линейка AMD Radeon Pro WX опирается на GPU, вышедшие до поколения Vega. Мы получили в тестовую лабораторию три видеокарты на GPU Polaris и Fiji. Видеокарты Radeon Pro WX 9100 и Radeon Pro SSG на Vega были объявлены летом, но появятся они лишь в ближайшие месяцы.

Обзор технических спецификаций AMD Radeon Pro WX
Модель: Radeon Pro WX 4100 Radeon Pro WX 5100 Radeon Pro WX 7100
Цена: от 11,9 тыс. рублей
290 евро
от 25,0 тыс. рублей
410 евро
от 48,1 тыс. рублей
640 евро
Техническая информация
GPU: Baffin Ellesmere Ellesmere
Техпроцесс: 14 нм 14 нм 14 нм
Число транзисторов: 3 млрд. 5,7 млрд. 5,7 млрд.
Тактовая частота GPU (базовая): 1.201 МГц 1.086 МГц 1.243 МГц
Тактовая частота GPU (Boost): 1.201 МГц 1.086 МГц 1.243 МГц
Частота памяти 1.500 МГц 1.250 МГц 1.750 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти: 4 GB 8 GB 8 GB
Ширина шины памяти: 128 бит 256 бит 256 бит
Пропускная способность памяти: 96 Гбайт/с 160 Гбайт/с 224 Гбайт/с
Потоковые процессоры: 1.024 1.792 2.304
Текстурные блоки: 64 112 144
Конвейеры растровых операций (ROP): 16 32 32
Производительность с одинарной точностью: 2,56 TFLOPS 3,9 TFLOPS 5,73 TFLOPS
Производительность с двойной точностью: 160 GFLOPS 243 GFLOPS 358 GFLOPS
Типичное энергопотребление: 50 Вт 75 Вт 130 Вт

AMD выслала нам видеокарты для рабочих станций, которые относятся к начальном и среднему уровню. Цена составляет от 300 до 650 евро. Производительность видеокарт не рекордная, но в данном случае важнее качество программной поддержки и эффективность.

В частности, AMD подчеркивает преимущества "младших" моделей в линейке WX, поскольку они выполнены в однослотовом формате. Видеокарты поддерживают HDR, рендеринг с 10-битным цветом и современные видеокодеки. К видеокартам можно подключать два дисплея 5K с разрешением 5.120 x 2.880 пикселей на 60 Гц, а также четыре дисплея 4K. Кроме того, видеокарты Radeon Pro могут подавать поток видео напрямую на GPU через DirectGMA и SDI. Что позволяет избежать задержек и возможных "узких мест".

NVIDIA Quadro на GPU Pascal

NVIDIA получает весьма существенную долю прибыли на профессиональном сегменте. Сегодня он разделен на видеокарты Quadro для рабочих станций и ускорители Tesla для вычислений. Мы протестируем три модели Quadro на GPU Pascal. NVIDIA уже использует GPU Volta для ускорителей Tesla, но в сегменте рабочих станций переход не произойдет раньше 2018.

Обзор спецификаций NVIDIA Quadro
Модель: Quadro P2000 Quadro P6000 Quadro GP100
Цена: от 31,2 тыс. рублей
420 евро
от 323 тыс. рублей
2.885 евро
от 460 тыс. рублей
7.635 евро
Техническая информация
GPU: GP106 GP102 GP100
Техпроцесс: 16 нм 16 нм 16 нм
Число транзисторов: 4,4 млрд. 12 млрд. 15,3 млрд.
Тактовая частота GPU (базовая): 1.076 МГц 1.506 МГц 1.304 МГц
Тактовая частота GPU (Boost): 1.481 МГц 1.645 МГц 1443 МГц
Частота памяти 1.750 МГц 1.128 МГц 715 МГц
Тип памяти GDDR5 GDDR5X HBM2
Объём памяти: 5 GB 24 GB 16 GB
Ширина шины памяти: 160 бит 384 бит 4.096 бит
Пропускная способность памяти: 140,2 Гбайт/с 433,2 Гбайт/с 732,16 Гбайт/с
Потоковые процессоры: 1.024 3.840 3.584
Текстурные блоки: 64 240 298
Конвейеры растровых операций (ROP): 40 96 128
Производительность с одинарной точностью: 3 TFLOPS 12 TFLOPS 10,3 TFLOPS
Производительность с двойной точностью: 93,7 GFLOPS 375 GFLOPS 5,15 TFLOPS
Производительность с половинной точностью: 46,8 GFLOPS 187,5 GFLOPS 20,6 TFLOPS
Типичное энергопотребление: 75 Вт 250 Вт 235 Вт

Как по цене, так и по техническим спецификациям видно, что поступившие к нам видеокарты Quadro больше ориентированы на high-end сегмент. За ту же Quadro GP100 придется отдать 7.500 евро или 460 тыс. рублей. В тестах мы посмотрим, насколько разница по производительности сможет оправдать разницу по цене.

NVIDIA позиционирует видеокарты Quadro на сферы дизайна и рендеринга, обработки мультимедиа и научных вычислений. Все видеокарты оснащены четырьмя выходами DisplayPort и позволяют подключать до четырех дисплеев 5K с разрешением 5.120 x 2.880 пикселей на 60 Гц. Также возможно подключение четырех дисплеев 4K с частотой обновления 120 Гц.

Видеокарты Quadro поддерживают вывод картинки с 10- или 12-битным цветом. Впрочем, для видеокарт AMD и NVIDIA передача цвета с подобной глубиной уже давно проблемой не является, GPU с ней справляются, но все упирается в мониторы – лишь немногие из них поддерживают соответствующие режимы. Но все должно измениться в ближайшие месяцы.


Но перейдем к тестам. Мы начнем с обычных синтетических тестов, после чего протестируем ряд сценариев, отражающих реальную нагрузку. В частности, рендеринг и глубокое обучение. Ниже мы подробно опишем каждый тест.

Для тестовой системы мы использовали компоненты, приведенные ниже:

Мы использовали драйверы NVIDIA Quadro R384 U4 и AMD Radeon Pro Software 17.Q3.1. Мы установили соответствующие программные пакеты, в том числе Radeon ProRenderer для тестов рендеринга, чтобы полностью раскрыть потенциал видеокарт. То же самое касается и программных пакетов NVIDIA.

Luxmark 3.0

Первый тест - Luxmark 3.0, с помощью которого мы оценивали производительность OpenCL. Мы протестировали три пресета, результат выражен в семплах в секунду.

Luxmark 3.0

Hotel Lobby

семплы/с
Больше - лучше

Luxmark 3.0

Neuman

семплы/с
Больше - лучше

Luxmark 3.0

LuxBall

семплы/с
Больше - лучше

Blender

Второй тест - Blender. Мы использовали популярный бенчмарк Blender, а именно 3D-сцену, предложенную разработчиком. Чтобы Blender использовал для рендеринга GPU, необходимо выбрать в настройках соответствующий пункт. Там же следует выбрать GPU и для вычислений. Кроме того, мы увеличили размер Batch, то есть тайла на поток, с 16 до 256 пикселей. Все это позволит лучше нагружать GPU с несколькими сотнями или даже тысячами потоковых процессоров. Результат выводится в виде времени рендеринга сцены в секундах.

Blender

тест Blender

время в секундах
Меньше - лучше

Adobe After Effects

Мы использовали Adobe After Effects для рендеринга заставки 4K с альфа-каналом. Как правило, мы готовим подобную заставку к каждой выставке, после чего используем ее для дальнейших роликов. И шести видеокартам для рабочих станций предстояло выполнить рендеринг заставки. Результат оценивался в виде времени, которое ушло на рендеринг.

Adobe After Effects

Рендеринг 4K заставки

время в секундах
Меньше - лучше

V-Ray Benchmark

Продолжим с тестом V-Ray Benchmark. Он представляет собой синтетический бенчмарк Chaosgroup, создателя плагина V-Ray для различных пакетов 3D-рендеринга. Здесь мы вновь оценивали время рендеринга сцены.

V-Ray

Тест V-Ray

время в секундах
Меньше - лучше

Unreal Engine Infiltrator Rendering

Еще один интересный бенчмарк – рендеринг демо Infiltrator на Unreal Engine 4, которое NVIDIA часто использует на своих презентациях. До сих пор рендеринг в реальном времени не представляется возможным. Чтобы собрать все данные и 3D-модели для рендеринга демо в Unreal Engine Editor требуется приличная вычислительная производительность. Мы оценили время выполнения рендеринга.

Unreal Engine

Infiltrator Rendering

время в секундах
Меньше - лучше

Deep Learning Benchmark

В качестве последнего теста мы взяли тренировку небольшой сети глубокого обучения. Но сразу же отметим, что подобная тренировка не является целевым сценарием для видеокарт, ориентированных на рабочие станции. Однако многие пользователи подобных сетей все равно используют видеокарты. NVIDIA как раз ориентирует на данный сегмент модели Tesla, а AMD – ускорители Radeon Instinct.

Мы использовали библиотеку семплов для тренировки, а именно фото библиотеку TensorFlow. Тесты проводились под Ubuntu 14.04 вместе с соответствующими интерфейсами глубокого обучения для AMD и NVIDIA. Библиотека семплов содержит порядка 40.000 фотографий (200 Гбайт). Во время обработки фотографий каждый снимок разделяется на плитки 32 x 32 пикселя, при этом обрабатывается метаинформация, связанная с отображаемыми объектами. К последним относятся самолеты, машины, кошки, лица, корабли и т.д.

Из-за небольшого размера библиотеки семплов мы не стали фиксировать общее время выполнения задачи, а представили результат в кадрах в секунду. Его можно использовать и для оценки обработки значительных массивов данных.

Deep Learning

скорость обработки изображений TensorFlow

снимков/с
Больше - лучше


Тестировать видеокарты для рабочих станций сложнее потребительских моделей. Приходится тщательно планировать методику тестирования, подбирать приложения и утилиты. Мы постарались отобрать практические сценарии использования видеокарт, хотя не обошлось и без синтетических тестов.

Если вы решите приобрести видеокарту для рабочих станций, то причина наверняка будет заключаться в драйвере и соответствующей программной поддержке. Конечно, программное и аппаратное обеспечение должны работать как можно более стабильно, без "вылетов". Мы тестировали видеокарты AMD и NVIDIA для рабочих станций на протяжении длительного периода времени, но все же не в режиме 24/7, чтобы сделать выводы о стабильности.

Видеокарты для рабочих станций ориентированы на сферу создания контента. Сравнивать видеокарты AMD и NVIDIA нелегко, поскольку они ориентированы на разные сегменты производительности. Но даже "младшая" видеокарта может хорошо показать себя в рабочих сценариях. Например, рендеринг Blender только на CPU отнимает несколько часов, добавление к нему GPU позволяет справиться с той же задачей за гораздо меньшее время. Теоретически задачу можно разделить между CPU и GPU, что даст дополнительное ускорение. Схожим примером является и Adobe After Effects, хотя аппаратное ускорение реализовано здесь не на том уровне, на котором нам хотелось бы его получить.

В целом, видеокарты AMD и NVIDIA показали ожидаемую производительность в пределах своих линеек. Quadro P2000, Radeon Pro WX 4100 и WX 5100 уступают более скоростным вариантам, поэтому их можно ориентировать на сценарии начального уровня. Конечно, производительность Quadro P6000 и GP100 впечатляет, но видеокарты опираются на самые быстрые GPU, выпускаемые сегодня NVIDIA. Radeon Pro WX 7100 находится где-то посередине.

Здесь хотелось бы подчеркнуть отличия между Quadro P6000 и GP100. Оба GPU относятся к топовой категории, но в случае Quadro P6000 на видеокарту установлены 24 Гбайт памяти GDDR5, ускоритель Quadro GP100 оснащается 16 Гбайт HBM2. Разница видна, например, в тесте Luxmark, где у Quadro GP100 наблюдается преимущество. Но в тесте Adobe After Effects Quadro P6000 оказывается быстрее.

Результаты теста глубокого обучения говорят сами за себя. Данный тест оказался одним из самых сложных на нашей памяти. Мы потратили несколько дней на подготовку программного обеспечения со всеми библиотеками и утилитами, пока не получили повторяемый и стабильный результат. Мы впервые занялись темой глубокого обучения применительно к бенчмаркам. До сих пор мы могли использовать лишь результаты, предоставляемые производителями. По итогам теста видно, что видеокарты для рабочих станций не так хорошо подходят для сценариев глубокого обучения, здесь все же стоит использовать ускорители Tesla от NVIDIA или Instinct от AMD. В любом случае, наш опыт знакомства с темой глубокого обучения оказался весьма продуктивным, по результатам хорошо видна зависимость от скорости работы подсистемы памяти и производительности вычислений с половинной точностью.

Интересно, что видеокарты для рабочих станций в ряде случаев можно заменить обычными игровыми моделями. Конечно, драйвер будет другой, что дает свои недостатки, но теоретически можно получить аппаратное ускорение и на менее дорогих видеокартах. Скажем, весьма популярны модели Radeon Vega Frontier Edition или NVIDIA Titan Xp, которые занимают промежуточное положение между потребительскими и профессиональными видеокартами. Здесь все зависит от сценариев использования, в некоторых случаях подобные видеокарты станут весьма мощной и доступной альтернативой.

Сделать однозначный вывод по видеокартам сложно, поскольку оценить их по соотношению цена/производительность проблематично. Здесь все больше зависит от требуемых сценариев, в рамках которых и следует рассматривать производительность видеокарт. Другие привычные характеристики, подобные энергопотреблению или уровню шума, имеют не такое большое значение.

Если ваш заработок зависит от вычислительной производительности системы, в которой весомую долю составляет видеокарта, то вряд ли стоит лишний раз пояснять преимущества протестированных решений. Конечно, с первого взгляда сложно понять, почему за подобную видеокарту приходится выкладывать круглую сумму. Но все же следует принимать во внимание программное обеспечение и драйвер. Оптимизации драйвера под профессиональные приложения быстро окупают себя.