Тест и обзор: Intel Xeon W-3275 в рабочей станции с DL-Boost

Опубликовано:

intel-xeon-3275В сегменте серверов и рабочих станций у Intel нелегкие времена. AMD с процессорами EPYC и Ryzen Threadripper предлагает больше ядер, лучшую поддержку памяти, скоростные интерфейсы и многое другое. Как Intel отреагирует на усилившегося конкурента - пока сказать сложно. В любом случае, в нашу тестовую лабораторию поступил флагманский Intel Xeon W-3275, который мы сравним с другими процессорами класса рабочих станций и HEDT в различных сценариях.

Xeon W-3275 базируется на современной архитектуре Intel Cascade Lake. Она применяется в процессорах Xeon Scalable (Cascade Lake-SP и Cascade Lake-AP), содержащих до 52 ядра, а также в моделях HEDT (Cascade Lake-X). Мы уже протестировали данные модели в виде двух Xeon Platinum 8280 и Core i9-10980XE.

28 ядер, 56 потоков, базовая частота 2,5 ГГц и режим Boost до 4,4 ГГц при тепловом пакете 205 Вт - именно такие технические спецификации мы получаем у Xeon W-3275.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору лучшего процессора Intel и AMD на зиму 2020. Оно поможет выбрать оптимальный CPU за свои деньги и не запутаться в ассортименте моделей на рынке.

Сравнение процессоров
МодельCore i9-10980XE Xeon W-3175XXeon W-3275Ryzen Threadripper 3970X
Цена 1.129 евро (81.700 ₽) 3.215 Euro(220.700 ₽)4.945 евро (339.600 ₽) 2.050 евро (140.700 ₽)
Архитектура Cascade Lake-X Skylake-SPCascade Lake-SP Zen 2
Техпроцесс 14 нм 14 нм14 нм 7 нм
Сокет LGA2066 LGA3647LGA3647 TR4
Ядра/ потоки 18 / 36 28 / 5628 / 56 32 / 64
Базовая частота 3,0 ГГц 3,1 ГГц2,5 ГГц 3,7 ГГц
Частота Boost 4,6 ГГц 3,8 ГГц4,6 ГГц 4,5 ГГц
Кэш L2 1 MB на ядро 1 MB на ядро1 MB на ядро 512 kB на ядро
Кэш L3 24,75 MB 38,5 MB38,5 MB 128 MB
Линии PCIe 48 4864 72
Интерфейс памяти 4 канала
DDR4-2933
Макс. 256 GB
6 каналов
DDR4-2666
Макс. 512 GB
6 каналов
DDR4-2933
Макс. 1 TB
4 канала
DDR4-3200
Макс. 256 GB
TDP 165 Вт 255 Вт205 Вт 280 Вт

Xeon W-3275 является преемником Xeon W-3175X по номенклатуре, но Intel несколько изменила позиционирование. Будучи моделью X, процессор Xeon W-3175X является high-end CPU для тех пользователей, кому требуется максимум. Но Intel внесла изменения при переходе со Skylake-SP на Cascade Lake-SP. Процессоры устанавливаются в одинаковый сокет LGA3647, процессоры Cascade Lake также производятся по 14-нм техпроцессу. Подробности архитектуры мы обсуждали в деталях еще весной 2019.

Базовая частота Xeon W-3275 меньше - 2,5 ГГц, но частота Boost выше. Для процессора Xeon W-3275 заявлен TDP 205 Вт. По тестам Core i9-10980XE хорошо известно, что Intel может выставлять частоту Boost на большее число ядер благодаря Turbo Boost Max Technology 3.0. Кроме того, процессор теперь поддерживает в два раза больше памяти (до 1 Тбайт) и DDR4-2933 вместо DDR4-2666. Число линий PCI Express увеличилось с 48 до 64, хотя Intel могла бы сделать то же самое и для Skylake-SP, так как чип имеет достаточное число интерфейсов PCI Express. Но придется довольствоваться PCI Express 3.0.

Как обычно, заявленная частота Turbo соответствует нагрузке не на все ядра. Но так как речь идет о процессоре для рабочих станций, который должен использовать максимальное число ядер под полной нагрузкой, мы рассмотрим частоты Turbo подробнее.

Сравнение частот Turbo
Ядра под нагрузкой Xeon Platinum 8280Xeon W-3275 Xeon W-3175X
1 4,0 ГГц4,6 ГГц 4,3 ГГц
2 4,0 ГГц4,6 ГГц 4,3 ГГц
3 3,8 ГГц4,2 ГГц 4,1 ГГц
4 3,8 ГГц4,2 ГГц 4,1 ГГц
5 3,7 ГГц4,1 ГГц 4,0 ГГц
6 3,7 ГГц4,1 ГГц 4,0 ГГц
7 3,7 ГГц4,1 ГГц 4,0 ГГц
8 3,7 ГГц4,1 ГГц 4,0 ГГц
9 3,7 ГГц4,1 ГГц 4,0 ГГц
10 3,7 ГГц4,1 ГГц 4,0 ГГц
11 3,7 ГГц4,1 ГГц 4,0 ГГц
12 3,7 ГГц4,1 ГГц 4,0 ГГц
13 3,7 ГГц3,9 ГГц 4,0 ГГц
14 3,7 ГГц3,9 ГГц 4,0 ГГц
15 3,7 ГГц3,9 ГГц 4,0 ГГц
16 3,7 ГГц3,9 ГГц 4,0 ГГц
17 3,7 ГГц3,6 ГГц 4,0 ГГц
18 3,7 ГГц3,6 ГГц 4,0 ГГц
19 3,7 ГГц3,6 ГГц 4,0 ГГц
20 3,7 ГГц3,6 ГГц 4,0 ГГц
21 3,5 ГГц3,3 ГГц 4,0 ГГц
22 3,5 ГГц3,3 ГГц 4,0 ГГц
23 3,5 ГГц3,3 ГГц 4,0 ГГц
24 3,5 ГГц3,3 ГГц 4,0 ГГц
25 3,3 ГГц3,2 ГГц 3,8 ГГц
26 3,3 ГГц3,2 ГГц 3,8 ГГц
27 3,3 ГГц3,2 ГГц 3,8 ГГц
28 3,3 ГГц3,2 ГГц 3,8 ГГц

Легко видеть, что чем больше ядер используются, тем выше тактовая частота Xeon W-3175X по сравнению с Xeon W-3275. Что это означает на практике? В тесте Core i9-9900KS при сравнении с процессорами HEDT (неважно, Core-X или Ryzen Threadripper) мы подчеркивали, что при выборе процессора следует учитывать сценарии использования. Что верно и для Xeon W-3275, поскольку не все приложения выигрывают от более чем восьми ядер. Например, большинству игр вполне достаточно шести ядер, и на небольшом числе скоростных ядер они работают лучше, чем на большом количестве медленных ядер.

В сегменте рабочих станций большое число ядер тоже не всегда полезно. Многие задачи 3D-рендеринга или симуляции жидкости работают только на одном или нескольких ядрах. Да и задачи компиляции сильнее выигрывают от частоты ядер, а не от их количества. Именно по этой причине на рынке есть специальные модели, которые оснащены меньшим количеством ядер по сравнению с флагманскими CPU, зато ядра работают на существенно более высоких тактовых частотах. В качестве примера можно привести скоростные Xeon (Xeon Scalable второго поколения с технологией Speed Select Technology) и процессоры EPYC (EPYC 7H12 с 64 ядрами на базовой частоте 2,6 ГГц вместо 2,0 ГГц). Количество ядер может составлять 2/3 от максимума для платформы, но тактовые частоты будут намного выше. Например, у того же Core i9-9990XE мы получаем только 14 ядер, зато тактовые частоты составляют до 5 ГГц.

В случае Xeon W-3275 интересно оценить производительность приложений DL Boost, которые выигрывают от наличия ускорения AVX512. Об этом мы как раз поговорим в обзоре.


Собирать рабочую станцию на основе Intel Xeon W-3275 не так просто. Следует уделить внимание правильному выбору компонентов. Довольно быстро становится понятно, что задача подбора компонентов для серверов и рабочих станций отнюдь не тривиальна. Причем это касается процессоров AMD и Intel.

Материнская плата

Начнем с платформы. Поскольку мы выбрали процессоры Skylake-SP, то необходима модель на сокете LGA3647. Кроме ASUS ROG Dominus Extreme, данный процессор можно запустить на C621 AORUS Extreme от Gigabyte или SR-3 Dark от EVGA. Мы использовали раннюю модель от Gigabyte под старым названием A1X-C621.

С первого взгляда видно, что перед нами нечто среднее между потребительскими компонентами и "железом" класса рабочих станций. PCB полностью черная, но структура, расстояния и расположение компонентов нехарактерное для потребительских комплектующих.

Под крупным радиатором спрятан чипсет C621, известный под кодовым названием Lewisburg. Он обеспечивает порты USB 2.0, USB 3.0 и многочисленные SATA. Чипсет подключается к процессору через четыре линии PCI Express 3.0 (DMI 3.0). При этом чипсет сам предлагает линии PCI Express, на материнской плате имеется довольно большое число слотов расширения. Процессор Xeon W-3275 теперь обеспечивает 64 линии PCI Express. У предшественника Xeon W-3175X мы получали только 48 линий, причем следует вычесть четыре линии подключения к чипсету (QPI).

Конечно, питание подобной системы - вопрос непростой. За питание процессора и слотов DIMM отвечают 32 фазы. Для обычной работы достаточно одного блока питания, который будет обеспечивать один 24-контактный разъем ATX из двух. Но для разгона потребуется второй блок питания. На плате расположены четыре 8-контактных гнезда дополнительного питания, из которых в обычном режиме следует подключать два. Наконец, есть еще два 4-контактных гнезда питания, которые тоже рекомендуется подключать во время разгона. В обычных тестах мы их не подключали.

Конечно, от 32 фаз питания необходимо отводить тепло. Gigabyte установила крупный алюминиевый радиатор с тепловой трубкой. На нем установлены четыре 40-мм вентилятора, которые довольно громко шумят. Причем при увеличении нагрузки на процессор вентиляторы начинают работать еще громче. Вместе с водяным и воздушным охлаждением корпуса подобная система может превратиться по уровню шума в пылесос, так что конфигурацию следует продумывать.

Розничная цена Intel Xeon W-3275 составляет порядка €5.000 (343.000 ₽), за материнскую плату C621 AORUS Extreme придется отдать еще от 119.000 ₽. SR-3 Dark от EVGA пока доступна только на рынке США по цене $1.999 (124.500 ₽). ASUS ROG Dominus Extreme время от времени появляется в продаже, но на момент публикации ее не было (узнать цену).

Оперативная память

Для тестов мы использовали память Corsair. Три 16-Гбайт комплекта (CMT16GX4M2C3600C18) обеспечивают суммарную емкость 48 Гбайт с заявленной частотой DDR4-3600 и задержками CL18. Один такой комплект обойдется от 11.200 ₽. Впрочем, в зависимости от числа каналов памяти, доступны и другие комплекты емкостью до 128 Гбайт. В ассортименте Corsair есть сегодня комплекты и с частотой до 4.800 МГц, но и стоят они существенно дороже.

Таким образом, в нашей системе емкость памяти составляла 48 Гбайт - уровня, которого некоторые пользователи устанавливают в high-end сборки. Впрочем, никто не мешает увеличить объем памяти при необходимости.

Преимуществом памяти Corsair являются Capellix RGB LED. Каждым LED можно управлять по-отдельности, утилита iCue от Corsair обеспечивает соответствующие возможности персонализации. Можно выбирать оттенки и различные эффекты. В утилите можно посмотреть конфигурацию памяти и технические характеристики.

Конечно, для рабочей станции память с RGB-подсветкой может показаться излишеством, однако она придавала свой шарм.

Охлаждение

Тепловым пакетом 205 Вт сегодня никого не удивишь. Даже без разгона Xeon W-3175X под полной нагрузкой может потреблять до 350 Вт. В случае Xeon W-3275 энергопотребление превышает 250 Вт. Так что системе охлаждения придется нелегко.

Для тестов Xeon W-3275 мы опробовали две системы охлаждения. Первая - 690LX-PN 360 mm от Asetek. Данная СВО может отводить до 500 Вт тепла. К водоблоку прикреплена крупное медное основание, внутрь интегрирована помпа Gen6. Жидкость поступает в радиатор по одной трубке и выходит по другой. Длина теплообменника составляет 360 мм. Скорость вращения трех 120-мм вентиляторов зависит от температуры, они продувают свежий воздух через довольно толстый радиатор. 690LX-PN 360 mm от Asetek не появился в рознице, но цена будет составлять порядка €400 (27.500 ₽).

Вторая система охлаждения, которую мы опробовали с Xeon W-3175X в прошлом году, комбинация EK-MLC Phoenix 360 Radiator Core Module и EK-Annihilator Pro. EK-MLC Phoenix 360 Radiator Core Module представляет собой 360-мм теплообменник с интегрированным насосом. На конце двух трубок прикреплен водоблок. Последний можно приобрести для креплений Square ILM и Narrow ILM. В случае Xeon W-3275 мы выбрали Narrow ILM. Водоблок полностью накрывает распределитель тепла крупного процессора LGA3647. Водоблок специально сделан максимально тонким, чтобы его можно было использовать в серверах 1U - при этом контур СВО можно подключать через боковые терминалы.

На теплообменник установлены три вентилятора Vardar EVO 12ER, обеспечивающие достаточный воздушный поток. Их скорость вращения тоже может регулироваться в зависимости от температуры. Водоблок EK-Annihilator Pro обойдется в €140 (9.700 ₽), вариант EK-MLC Phoenix 360 Radiator Core Module пока недоступен в рознице. 240-мм радиатор стоит €160 (11.000 ₽).

Установка в сокет

Установка процессора в сокет выполняется довольно легко. Если у обычных процессоров Ryzen снизу упаковки расположены чувствительные ножки, то в случае TR4 и сокетов процессоров Intel они перешли на сам сокет. Поэтому лишний раз сокет лучше не задевать. Что должны как раз предотвратить защитные заглушки.

Но для LGA3647 есть еще некоторые моменты, которые стоит учитывать. Рычага с креплением Independent Loading Mechanism (ILM) здесь не используется. Конечно, Intel продолжает говорить об ILM для LGA3647, но механизм отличается от обычных розничных материнских плат.

Вставлять процессор в сокет довольно просто. Контакт 1 промаркирован треугольником, он должен совпадать с соответствующим треугольником сокета. Также на упаковке CPU и сокете имеются вырезы и выступы, поэтому процессор в неправильной ориентации вставить не получится.

Два штырька нужны для выравнивания кулера с распределителем тепла процессора. После установки кулера необходимо затягивать четыре винта в определенной последовательности. Потребуется динамометрическая отвертка T30 с выставляемым крутящим моментом, который должен быть в точности 1,4 Н·м. При снятии кулера следует соблюдать порядок откручивания винтов.

На процессор должно оказываться правильное давление, поскольку только в таком случае все 3.746 контакта будут работать надежно. Если не повезет, то могут возникать различные проблемы. В случае плохого контакта "земли" последствия вряд ли будут, но другие проблемные контакты могут привести к отказу загрузки или некорректной работе каналов памяти. Подобные проблемы могут встречаться у всех больших сокетов LGA, в том числе AMD TR4 и SP3 для процессоров Ryzen Threadripper и EPYC.


Ниже приведены тестовые конфигурации используемых систем:

Линейка AMD Ryzen 3000:

Линейки AMD Ryzen 2000 и Ryzen 1000:

Процессоры AMD Ryzen Threadripper:

Процессоры AMD Ryzen Threadripper 3-го поколения:

Intel LGA1151:

Intel LGA2066

Intel LGA3647 (Xeon Platinum 8180 и 8280)

Intel LGA3647 (Xeon W-Serie)

Все системы тестировались под Windows 10 в версии 1903 со всеми установленными патчами. Мы устанавливали последние драйверы чипсетов под AMD и Intel. В случае AMD использовался драйвер чипсета 1.07.07.0725 с поддержкой CPPC2 (Collaborative Processor Performance Control).

Тактовые частоты DDR для разных процессоров
Процессор Базовая частота
Intel LGA1151 (современные поколения Core) DDR4-2666
Intel LGA2066 (до 9-го поколения) DDR4-2666
Intel LGA2066 (10-е поколение) DDR4-2933
Intel LGA3647 (Skylake-SP) DDR4-2666
Intel LGA3647 (Cascade Lake-SP) DDR4-2933
AMD Ryzen 1 и 2 поколение DDR4-2933
AMD Ryzen 3-е поколение DDR4-3200
AMD Ryzen Threadripper 1 и 2 поколение DDR4-2933
AMD Ryzen Threadripper 3-е поколение DDR4-3200
Линейка AMD Ryzen 3000G DDR4-2933
Линейка AMD Athlon DDR4-2666

Мы использовали модули памяти Corsair Vengeance, которые могут работать на частоте до DDR4-3600, но мы тестировали процессоры на частотах DDR, которые официально поддерживаются контроллерами памяти. В таблице приведены соответствующие значения. В тестах масштабирования памяти мы увеличивали данные частоты. У систем LGA3647 использовалась другая сборка.


Тест Cinebench можно назвать классикой для оценки много- и однопоточной производительности процессоров. Он хорошо масштабируется даже на несколько десятков ядер, а однопоточную производительность процессора можно оценить через соответствующий тест.

Cinebench R20

Однопоточный

Баллы
Больше - лучше

Cinebench R20

Многопоточный

Баллы
Больше - лучше


С помощью AIDA64 мы оценивали производительность чтения и записи памяти. Также мы тестировали производительность копирования данных и определяли задержки.

AIDA64

Пропускная способность чтения и записи

95743 XX


114951 XX
87960 XX


85613 XX
87502 XX


85901 XX
86169 XX


103360 XX
84455 XX


68817 XX
77821 XX


62900 XX
77508 XX


62796 XX
73179 XX


84455 XX
71067 XX


67759 XX
68080 XX


78476 XX
67993 XX


78229 XX
67224 XX


78025 XX
47119 XX


48801 XX
47050 XX


48617 XX
43479 XX


44190 XX
43389 XX


44360 XX
40930 XX


38820 XX
40891 XX


38775 XX
40777 XX


37858 XX
40774 XX


37452 XX
40772 XX


37887 XX
40137 XX


37968 XX
32931 XX


30798 XX
25575 XX


45993 XX
25566 XX


45984 XX
25547 XX


45755 XX
25547 XX


45752 XX
MB/s
Больше - лучше

AIDA64

Копирование данных

MB/s
Больше - лучше

AIDA64

Задержки памяти

в нс
Меньше - лучше


Тест Y-Cruncher рассчитывает число Пи с необходимым количеством знаков после запятой на всех доступных ядрах. Он хорошо масштабируется в зависимости от числа ядер. DigiCortex симулирует активность синапсов мозга морского огурца. Здесь оценивается скорость симуляции как фактор от реального времени.

Y-Cruncher

500M

Секунды
Меньше - лучше

DigiCortex

Small 64 Bit

x real-time avg
Больше - лучше


Blender, Corona и V-Ray - тесты рендеринга на основе соответствующих приложений для рабочих станций. Как правило, они хорошо масштабируются в зависимости от числа доступных ядер.

Blender

bmw27

Секунды
Меньше - лучше

Blender

classroom

Секунды
Меньше - лучше

V-Ray

Benchmark

Секунды
Меньше - лучше

Corona

Benchmark

Секунды
Меньше - лучше


В Handbrake мы кодировали видео 4K в разрешении 1080p 60 Гц H.264 и фиксировали время, которое ушло на данную задачу. С помощью VeraCrypt мы оценивали производительность AES процессоров, а в случае 7-Zip мы получаем оценку скорости сжатия файлов.

Handbrake

UHD Demo Nature

Секунды
Меньше - лучше

VeraCrypt

AES

Гбайт/с
Больше - лучше

7-Zip

32M - Распаковка/Архивация

330399 XX


157982 XX
231285 XX


147269 XX
228522 XX


159564 XX
199095 XX


139016 XX
174980 XX


78494 XX
174906 XX


40111 XX
149543 XX


114248 XX
148907 XX


110724 XX
132728 XX


78656 XX
132475 XX


107701 XX
131210 XX


7558 XX
127279 XX


101024 XX
115042 XX


68229 XX
105806 XX


65430 XX
97951 XX


68344 XX
91749 XX


63338 XX
88484 XX


57296 XX
82603 XX


55960 XX
76693 XX


46697 XX
68815 XX


51409 XX
65966 XX


49981 XX
61276 XX


47048 XX
57826 XX


46136 XX
57541 XX


46432 XX
56667 XX


37486 XX
43159 XX


35110 XX
39357 XX


32420 XX
MIPS
Больше - лучше

7-Zip

32M - Общий результат

MIPS
Больше - лучше


Для тестов компиляции мы компилировали свежую версию Mozilla Firefox для настольных ПК в 64-битном формате. Здесь важна и одно-, и многопоточная производительность, процессоры с большим числом ядер обычно получают преимущества.

Компиляция

браузер Firefox

Секунды
Меньше - лучше


энергопотребление

на CPU

в Вт
Меньше - лучше

Xeon W-3275 потреблял чуть больше 250 Вт на протяжении 28 секунд. По определению PL2 = PL1 * 1,25 позволяет выставить подобный уровень как раз на 28 секунд. Затем энергопотребление снижается до уровня чуть больше 200 Вт, соответствующего PL1 или TDP.

энергопотребление

Система целиком

в Вт
Меньше - лучше

Под пиковой нагрузкой новые процессоры Ryzen Threadripper потребляют больше Xeon W-3275, то же самое касается и Xeon W-3175X. Но, в отличие от Xeon W-3175X, процессор Xeon W-3275 не нацелен на энтузиастов и оверклокеров, он лучше вписывается в обычное окружение рабочей станции.


PyTorch Landmark Points

PyTorch - время анализа

Время в секундах
Меньше - лучше

PyTorch - платформа глубокого обучения на открытом исходном коде. Мы выбрали пример обработки и анализа данных, используя базу с фотографиями нескольких лиц. Для каждого лица определяется 68 меток, которые позволяют его характеризовать. Мы оценивали среднее время анализа каждого лица из базы данных.

Анализ данных опирается на вычисления INT8, поэтому Xeon W-3275 выигрывает от поддержки DL Boost. Интересно, что один Xeon W-3275 оказывается даже быстрее двух Xeon Platinum 8180.

Инференс изображений < 7 мс

Open Images Dataset V5 - INT8-Data

Кадры в секунду
Больше - лучше

Инференс изображений

Open Images Dataset V5 - INT8-Data

Кадры в секунду
Больше - лучше

Следующее приложение тоже относится к глубокому обучению. Мы выбрали базу Open Images Dataset V5 размером 500 Гбайт, содержащую десятки тысяч изображений. На тренировку сети глубокого обучения по данной базе уходит несколько дней. В результате мы получаем сеть Residual Neural Network (ResNet) с 50 слоями, по которым классифицируются изображения. Чем больше слоев, тем более точно классифицируются изображения для последующей обработки запросов.

Однако непосредственно сам тест не базируется исключительно на инференсе, то есть запросах данных в сеть глубокого обучения с использованием INT8. Он является смесью высокой и низкой точности. Ускорение DL Boost вносит свой вклад, но не решающий. Но процессоры Cascade Lake все равно дают прирост производительности между 40% и 50%

Инференс изображений < 7 мс

Open Images Dataset V5 - FP32 через INT8

Кадры в секунду
Больше - лучше

Инференс изображений

Open Images Dataset V5- FP32 через INT8

Кадры в секунду
Больше - лучше

Во втором тесте мы оценивали производительность при работе с более крупным массивом данных FP32. Точности FP32 здесь не требуется, поэтому приложение конвертирует данные в INT8. У двух Xeon Platinum 8180 и Xeon W-3175X нет ускорения INT8, поэтому им приходится обрабатывать данные FP32, скорость получается существенно ниже новых CPU. Речь идет о почти четырехкратном приросте производительности, что можно назвать весьма существенным шагом вперед.

OSPRay и Open Image Denoise

Трассировка лучей

Секунды
Меньше - лучше

Для трассировки лучей сцены Moana Island в Walt Disney Animation Studios требуется классическая вычислительная производительность. Перед нами как раз типичная вычислительная задача рендеринга. Сначала мы измеряли время, которое требуется для трассировки лучей.

Разрешение кадра составляло 2.048 x 858 пикселей, трассировка лучей выполнялась с 64 семплами на пиксель (SPP). Для примера: если удвоить разрешение и увеличить SPP до 256, то на расчет кадра уходит уже несколько часов. Конечно, у двухсокетных процессоров Xeon здесь имеется преимущество, поскольку число ядер в два раза больше. У Xeon W-3175X тактовые частоты под полной нагрузкой чуть выше, поэтому данная система немного быстрее Xeon W-3275.

OSPRay и Open Image Denoise

Подавление шумов

Секунды
Меньше - лучше

Следующим шагом мы применили фильтр Open Image Denoiser, который убирает шумы, появившиеся из-за отсутствующих семплов. Чем меньше семплов рассчитывается на пиксель, тем больше получается шумов. Фильтр Open Image Denoiser убирает шумы и заменяет их информацией, полученной через сеть глубокого обучения.

В процессе подавления шумов ускорение DL Boost дает положительный эффект на процессорах Xeon Platinum 8280 и Xeon W-3275. Рабочая станция с Xeon W-3275 справляется с подавлением шумов за 23,1 с, а Xeon W-3175X требуется почти в десять раз больше времени.

OSPRay и Open Image Denoise

Трассировка лучей и подавление шумов

Секунды
Меньше - лучше

Преимущество по расчетам подавления шумов отражается и на общем времени, которое уходит на расчет кадра. В нашем случае мы подразумеваем кадр с низким разрешением и небольшим количеством семплов. Результат можно экстраполировать на настоящее кинопроизводство - расчеты будут занимать намного больше времени, и ускорение подавления шумов даст более ощутимую экономию.


Тесты производительности и энергопотребления - это хорошо, но для полной картины их стоит соотнести. В многопоточных тестах кодирования и рендеринга мы наблюдаем хорошую масштабируемость процессоров от числа ядер. Но как насчет соотношения производительности на ватт?

Многопоточная производительность на ватт

Cinebench nT

в баллах/Вт
Больше - лучше

По многопоточной производительности на ватт Xeon W-3275 занимает среднее положение. Новые процессоры Ryzen Threadripper выходят вперед. По крайней мере, Xeon W-3275 работает эффективнее Xeon W-3175X.

Многопоточная производительность на евро

Cinebench nT

в баллах/евро
Больше - лучше

Из-за высокой розничной цены Xeon W-3275 не слишком хорошо показывает себя по соотношению цена/производительность. Здесь давление новых процессоров HEDT от AMD весьма ощутимо.


Производительность Xeon W-3275 можно рассматривать под двумя углами. С одной стороны, у нас 28 ядер на архитектуре Cascade Lake. Конечно, Intel постаралась выжать максимум из 14-нм техпроцесса, но ограничения Xeon W-3275 все равно заметны. Например, в таблице частот Boost на первой странице хорошо видно, что процессор быстрее Xeon W-3175X лишь при использовании от одного до четырех ядер. Если нагружать больше ядер, то Xeon W-3175X будет работать на более высоких тактовых частотах из-за большего бюджета энергопотребления. Xeon Platinum 8280 работает примерно на тех же частотах, что и Xeon W-3275 при нагрузке на все ядра или на значительное количество, но при занятости меньшего числа ядер версия CPU для рабочих станций дает преимущества.

Что видно и по результатам тестов. Xeon W-3275 хорошо показывает себя в приложениях, которые используют до четырех ядер. Xeon W-3175X дает преимущества в случае загрузки большего числа ядер. У данного CPU просто выше тактовые частоты в подобных сценариях, что и приводит к более высокой производительности. Конечно, Xeon W-3275 придется сразиться с конкурентами AMD. Здесь поджидают Ryzen Threadripper 3960X с 24 ядрами, а также Ryzen Threadripper 3970X с 32 ядрами. Так что в сегменте рабочих станций Xeon W-3275 придется нелегко.

Где Xeon W-3275 показывает себя в наиболее выгодном свете, так это приложения DL Boost. Все же Intel добавила поддержку AVX512VNNI. Но, как и в случае любых других подобных расширений, программное обеспечение должно включать соответствующую оптимизацию. Впрочем, все больше приложений для рабочих станций обзаводятся поддержкой. Хорошим примером можно назвать PyTorch - платформу глубокого обучения. Многие приложения сферы искусственного интеллекта уже выигрывают от DL Boost. OSPRay и Open Image Denoise - вполне наглядные примеры.

Отличия по производительности здесь могут быть весьма существенными. Процессор Xeon W-3275 получал прирост производительности от четырех до почти десяти раз по сравнению с Xeon W-3175X. Снижение времени вычислений будет важным аргументом для профессиональной среды, где затраты на рендеринг и расчеты весьма существенны. Конечно, процессор обойдется в круглую сумму. При активации AV512 процессор снижал частоту до 2,5 ГГц, но все равно работал достаточно быстро. Весьма важно и энергопотребление. Xeon W-3275 работал с тепловым пакетом 205 Вт, но на непродолжительное время энергопотребление могло увеличиваться до 250 Вт и выше.

Процессор Xeon W-3275 обойдется в круглую сумму, поэтому перед покупкой следует хорошо понимать его преимущества. В большинстве сценариев рабочей станции Intel сегодня не может выставить достойных конкурентов процессорам AMD. Но если ваши приложения умеют использовать DL Boost, то брать Xeon W-3275 стоит. Так что следует присмотреться к используемым приложениям, после чего уже переходить к рекомендованным аппаратным компонентам. Следует учитывать и доступные платформы. AMD уже предлагает PCI Express 4.0, но в случае Intel придется придерживаться PCI Express 3.0. В любом случае, в сегменте рабочих станций важны и другие факторы: стабильность платформы, ECC, BIOS, драйверы и т.д.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору лучшего процессора Intel и AMD на зиму 2020. Оно поможет выбрать оптимальный CPU за свои деньги и не запутаться в ассортименте моделей на рынке.

Преимущества Xeon W-3275:

Недостатки Xeon W-3275: