Как правило, мы тестируем игровые видеокарты для потребительского сегмента рынка. Поэтому мы фокусируемся на игровых тестах, хотя и добавляем несколько вычислительных бенчмарков. Впрочем, они не столько демонстрируют производительность видеокарт в профессиональной среде, сколько показывают, что игровые видеокарты можно использовать и для других задач. За минувшие недели мы протестировали несколько профессиональных видеокарт от AMD и NVIDIA. Мы фокусировались на профессиональных сферах применения: 3D-рендеринг, монтаж видео и эффекты, машинное обучение.
Видеокарты для рабочих станций по аппаратной начинке идентичны настольным моделям, основные отличия связаны с программным обеспечением и драйвером. Последние обеспечивают дополнительные функции или интерфейсы, недоступные с обычными игровыми видеокартами. В некоторых приложениях драйвер обеспечивает фоновые вычисления.
Среди других преимуществ отметим расширенную гарантию производителя и поддержку на совсем другом уровне, чем в случае потребительских видеокарт. Часто видеокарты для рабочих станций позволяют подключать шесть, двенадцать или даже больше дисплеев, что требует дополнительной аппаратной поддержки, отсутствующей у игровых видеокарт.
SDK и программное обеспечение
AMD и NVIDIA предлагают программные пакеты и SDK для своих видеокарт. AMD недавно выбрала пусть с открытым исходным кодом, NVIDIA открывает свои библиотеки лишь частично. У AMD соответствующие интерфейсы называются Radeon Rays и Radeon ProRender, а также LiquidVR для создания соответствующего контента.
NVIDIA тоже предлагает помощь разработчикам, в том числе в сфере виртуализации. Здесь можно назвать Iray или Mental Ray.
AMD Radeon Pro WX
На данный момент линейка AMD Radeon Pro WX опирается на GPU, вышедшие до поколения Vega. Мы получили в тестовую лабораторию три видеокарты на GPU Polaris и Fiji. Видеокарты Radeon Pro WX 9100 и Radeon Pro SSG на Vega были объявлены летом, но появятся они лишь в ближайшие месяцы.
Модель: | Radeon Pro WX 4100 | Radeon Pro WX 5100 | Radeon Pro WX 7100 |
Цена: | от 11,9 тыс. рублей 290 евро |
от 25,0 тыс. рублей 410 евро |
от 48,1 тыс. рублей 640 евро |
Техническая информация | |||
---|---|---|---|
GPU: | Baffin | Ellesmere | Ellesmere |
Техпроцесс: | 14 нм | 14 нм | 14 нм |
Число транзисторов: | 3 млрд. | 5,7 млрд. | 5,7 млрд. |
Тактовая частота GPU (базовая): | 1.201 МГц | 1.086 МГц | 1.243 МГц |
Тактовая частота GPU (Boost): | 1.201 МГц | 1.086 МГц | 1.243 МГц |
Частота памяти | 1.500 МГц | 1.250 МГц | 1.750 МГц |
Тип памяти | GDDR5 | GDDR5 | GDDR5 |
Объём памяти: | 4 GB | 8 GB | 8 GB |
Ширина шины памяти: | 128 бит | 256 бит | 256 бит |
Пропускная способность памяти: | 96 Гбайт/с | 160 Гбайт/с | 224 Гбайт/с |
Потоковые процессоры: | 1.024 | 1.792 | 2.304 |
Текстурные блоки: | 64 | 112 | 144 |
Конвейеры растровых операций (ROP): | 16 | 32 | 32 |
Производительность с одинарной точностью: | 2,56 TFLOPS | 3,9 TFLOPS | 5,73 TFLOPS |
Производительность с двойной точностью: | 160 GFLOPS | 243 GFLOPS | 358 GFLOPS |
Типичное энергопотребление: | 50 Вт | 75 Вт | 130 Вт |
AMD выслала нам видеокарты для рабочих станций, которые относятся к начальном и среднему уровню. Цена составляет от 300 до 650 евро. Производительность видеокарт не рекордная, но в данном случае важнее качество программной поддержки и эффективность.
В частности, AMD подчеркивает преимущества "младших" моделей в линейке WX, поскольку они выполнены в однослотовом формате. Видеокарты поддерживают HDR, рендеринг с 10-битным цветом и современные видеокодеки. К видеокартам можно подключать два дисплея 5K с разрешением 5.120 x 2.880 пикселей на 60 Гц, а также четыре дисплея 4K. Кроме того, видеокарты Radeon Pro могут подавать поток видео напрямую на GPU через DirectGMA и SDI. Что позволяет избежать задержек и возможных "узких мест".
NVIDIA Quadro на GPU Pascal
NVIDIA получает весьма существенную долю прибыли на профессиональном сегменте. Сегодня он разделен на видеокарты Quadro для рабочих станций и ускорители Tesla для вычислений. Мы протестируем три модели Quadro на GPU Pascal. NVIDIA уже использует GPU Volta для ускорителей Tesla, но в сегменте рабочих станций переход не произойдет раньше 2018.
Модель: | Quadro P2000 | Quadro P6000 | Quadro GP100 |
Цена: | от 31,2 тыс. рублей 420 евро |
от 323 тыс. рублей 2.885 евро |
от 460 тыс. рублей 7.635 евро |
Техническая информация | |||
---|---|---|---|
GPU: | GP106 | GP102 | GP100 |
Техпроцесс: | 16 нм | 16 нм | 16 нм |
Число транзисторов: | 4,4 млрд. | 12 млрд. | 15,3 млрд. |
Тактовая частота GPU (базовая): | 1.076 МГц | 1.506 МГц | 1.304 МГц |
Тактовая частота GPU (Boost): | 1.481 МГц | 1.645 МГц | 1443 МГц |
Частота памяти | 1.750 МГц | 1.128 МГц | 715 МГц |
Тип памяти | GDDR5 | GDDR5X | HBM2 |
Объём памяти: | 5 GB | 24 GB | 16 GB |
Ширина шины памяти: | 160 бит | 384 бит | 4.096 бит |
Пропускная способность памяти: | 140,2 Гбайт/с | 433,2 Гбайт/с | 732,16 Гбайт/с |
Потоковые процессоры: | 1.024 | 3.840 | 3.584 |
Текстурные блоки: | 64 | 240 | 298 |
Конвейеры растровых операций (ROP): | 40 | 96 | 128 |
Производительность с одинарной точностью: | 3 TFLOPS | 12 TFLOPS | 10,3 TFLOPS |
Производительность с двойной точностью: | 93,7 GFLOPS | 375 GFLOPS | 5,15 TFLOPS |
Производительность с половинной точностью: | 46,8 GFLOPS | 187,5 GFLOPS | 20,6 TFLOPS |
Типичное энергопотребление: | 75 Вт | 250 Вт | 235 Вт |
Как по цене, так и по техническим спецификациям видно, что поступившие к нам видеокарты Quadro больше ориентированы на high-end сегмент. За ту же Quadro GP100 придется отдать 7.500 евро или 460 тыс. рублей. В тестах мы посмотрим, насколько разница по производительности сможет оправдать разницу по цене.
NVIDIA позиционирует видеокарты Quadro на сферы дизайна и рендеринга, обработки мультимедиа и научных вычислений. Все видеокарты оснащены четырьмя выходами DisplayPort и позволяют подключать до четырех дисплеев 5K с разрешением 5.120 x 2.880 пикселей на 60 Гц. Также возможно подключение четырех дисплеев 4K с частотой обновления 120 Гц.
Видеокарты Quadro поддерживают вывод картинки с 10- или 12-битным цветом. Впрочем, для видеокарт AMD и NVIDIA передача цвета с подобной глубиной уже давно проблемой не является, GPU с ней справляются, но все упирается в мониторы – лишь немногие из них поддерживают соответствующие режимы. Но все должно измениться в ближайшие месяцы.
Но перейдем к тестам. Мы начнем с обычных синтетических тестов, после чего протестируем ряд сценариев, отражающих реальную нагрузку. В частности, рендеринг и глубокое обучение. Ниже мы подробно опишем каждый тест.
Для тестовой системы мы использовали компоненты, приведенные ниже:
- Intel Core i7-3960X 3,3 @ 3,9 ГГц
- Corsair H110i GT СВО с замкнутым контуром
- ASUS P9X79 Deluxe
- 16 GB DDR3
- OCZ Arc 100 240 GB
- Seasonic Platinum Series 1.000 Вт
- Windows 10 64 бит
Мы использовали драйверы NVIDIA Quadro R384 U4 и AMD Radeon Pro Software 17.Q3.1. Мы установили соответствующие программные пакеты, в том числе Radeon ProRenderer для тестов рендеринга, чтобы полностью раскрыть потенциал видеокарт. То же самое касается и программных пакетов NVIDIA.
Luxmark 3.0
Первый тест - Luxmark 3.0, с помощью которого мы оценивали производительность OpenCL. Мы протестировали три пресета, результат выражен в семплах в секунду.
Blender
Второй тест - Blender. Мы использовали популярный бенчмарк Blender, а именно 3D-сцену, предложенную разработчиком. Чтобы Blender использовал для рендеринга GPU, необходимо выбрать в настройках соответствующий пункт. Там же следует выбрать GPU и для вычислений. Кроме того, мы увеличили размер Batch, то есть тайла на поток, с 16 до 256 пикселей. Все это позволит лучше нагружать GPU с несколькими сотнями или даже тысячами потоковых процессоров. Результат выводится в виде времени рендеринга сцены в секундах.
Adobe After Effects
Мы использовали Adobe After Effects для рендеринга заставки 4K с альфа-каналом. Как правило, мы готовим подобную заставку к каждой выставке, после чего используем ее для дальнейших роликов. И шести видеокартам для рабочих станций предстояло выполнить рендеринг заставки. Результат оценивался в виде времени, которое ушло на рендеринг.
V-Ray Benchmark
Продолжим с тестом V-Ray Benchmark. Он представляет собой синтетический бенчмарк Chaosgroup, создателя плагина V-Ray для различных пакетов 3D-рендеринга. Здесь мы вновь оценивали время рендеринга сцены.
Unreal Engine Infiltrator Rendering
Еще один интересный бенчмарк – рендеринг демо Infiltrator на Unreal Engine 4, которое NVIDIA часто использует на своих презентациях. До сих пор рендеринг в реальном времени не представляется возможным. Чтобы собрать все данные и 3D-модели для рендеринга демо в Unreal Engine Editor требуется приличная вычислительная производительность. Мы оценили время выполнения рендеринга.
Deep Learning Benchmark
В качестве последнего теста мы взяли тренировку небольшой сети глубокого обучения. Но сразу же отметим, что подобная тренировка не является целевым сценарием для видеокарт, ориентированных на рабочие станции. Однако многие пользователи подобных сетей все равно используют видеокарты. NVIDIA как раз ориентирует на данный сегмент модели Tesla, а AMD – ускорители Radeon Instinct.
Мы использовали библиотеку семплов для тренировки, а именно фото библиотеку TensorFlow. Тесты проводились под Ubuntu 14.04 вместе с соответствующими интерфейсами глубокого обучения для AMD и NVIDIA. Библиотека семплов содержит порядка 40.000 фотографий (200 Гбайт). Во время обработки фотографий каждый снимок разделяется на плитки 32 x 32 пикселя, при этом обрабатывается метаинформация, связанная с отображаемыми объектами. К последним относятся самолеты, машины, кошки, лица, корабли и т.д.
Из-за небольшого размера библиотеки семплов мы не стали фиксировать общее время выполнения задачи, а представили результат в кадрах в секунду. Его можно использовать и для оценки обработки значительных массивов данных.
Тестировать видеокарты для рабочих станций сложнее потребительских моделей. Приходится тщательно планировать методику тестирования, подбирать приложения и утилиты. Мы постарались отобрать практические сценарии использования видеокарт, хотя не обошлось и без синтетических тестов.
Если вы решите приобрести видеокарту для рабочих станций, то причина наверняка будет заключаться в драйвере и соответствующей программной поддержке. Конечно, программное и аппаратное обеспечение должны работать как можно более стабильно, без "вылетов". Мы тестировали видеокарты AMD и NVIDIA для рабочих станций на протяжении длительного периода времени, но все же не в режиме 24/7, чтобы сделать выводы о стабильности.
Видеокарты для рабочих станций ориентированы на сферу создания контента. Сравнивать видеокарты AMD и NVIDIA нелегко, поскольку они ориентированы на разные сегменты производительности. Но даже "младшая" видеокарта может хорошо показать себя в рабочих сценариях. Например, рендеринг Blender только на CPU отнимает несколько часов, добавление к нему GPU позволяет справиться с той же задачей за гораздо меньшее время. Теоретически задачу можно разделить между CPU и GPU, что даст дополнительное ускорение. Схожим примером является и Adobe After Effects, хотя аппаратное ускорение реализовано здесь не на том уровне, на котором нам хотелось бы его получить.
В целом, видеокарты AMD и NVIDIA показали ожидаемую производительность в пределах своих линеек. Quadro P2000, Radeon Pro WX 4100 и WX 5100 уступают более скоростным вариантам, поэтому их можно ориентировать на сценарии начального уровня. Конечно, производительность Quadro P6000 и GP100 впечатляет, но видеокарты опираются на самые быстрые GPU, выпускаемые сегодня NVIDIA. Radeon Pro WX 7100 находится где-то посередине.
Здесь хотелось бы подчеркнуть отличия между Quadro P6000 и GP100. Оба GPU относятся к топовой категории, но в случае Quadro P6000 на видеокарту установлены 24 Гбайт памяти GDDR5, ускоритель Quadro GP100 оснащается 16 Гбайт HBM2. Разница видна, например, в тесте Luxmark, где у Quadro GP100 наблюдается преимущество. Но в тесте Adobe After Effects Quadro P6000 оказывается быстрее.
Результаты теста глубокого обучения говорят сами за себя. Данный тест оказался одним из самых сложных на нашей памяти. Мы потратили несколько дней на подготовку программного обеспечения со всеми библиотеками и утилитами, пока не получили повторяемый и стабильный результат. Мы впервые занялись темой глубокого обучения применительно к бенчмаркам. До сих пор мы могли использовать лишь результаты, предоставляемые производителями. По итогам теста видно, что видеокарты для рабочих станций не так хорошо подходят для сценариев глубокого обучения, здесь все же стоит использовать ускорители Tesla от NVIDIA или Instinct от AMD. В любом случае, наш опыт знакомства с темой глубокого обучения оказался весьма продуктивным, по результатам хорошо видна зависимость от скорости работы подсистемы памяти и производительности вычислений с половинной точностью.
Интересно, что видеокарты для рабочих станций в ряде случаев можно заменить обычными игровыми моделями. Конечно, драйвер будет другой, что дает свои недостатки, но теоретически можно получить аппаратное ускорение и на менее дорогих видеокартах. Скажем, весьма популярны модели Radeon Vega Frontier Edition или NVIDIA Titan Xp, которые занимают промежуточное положение между потребительскими и профессиональными видеокартами. Здесь все зависит от сценариев использования, в некоторых случаях подобные видеокарты станут весьма мощной и доступной альтернативой.
Сделать однозначный вывод по видеокартам сложно, поскольку оценить их по соотношению цена/производительность проблематично. Здесь все больше зависит от требуемых сценариев, в рамках которых и следует рассматривать производительность видеокарт. Другие привычные характеристики, подобные энергопотреблению или уровню шума, имеют не такое большое значение.
Если ваш заработок зависит от вычислительной производительности системы, в которой весомую долю составляет видеокарта, то вряд ли стоит лишний раз пояснять преимущества протестированных решений. Конечно, с первого взгляда сложно понять, почему за подобную видеокарту приходится выкладывать круглую сумму. Но все же следует принимать во внимание программное обеспечение и драйвер. Оптимизации драйвера под профессиональные приложения быстро окупают себя.