Страница 2: Второе поколение Ryzen Threadripper в деталях

Родственные связи двух линеек настольных процессоров заметны по названиям: Ryzen для обычных пользователей или настольных ПК, Ryzen Threadripper - для high-end настольных ПК (HEDT). В данном отношении второе поколение не отличается от первого. Близость была хорошо видна и год назад, когда появились процессоры Ryzen Threadripper 1900X. И у второго поколения она отлично прослеживается.

Для второго поколения процессоров Ryzen Threadripper, чей распределитель тепла вновь припаивается, AMD снова использовала ту же архитектуру, что и для моделей Ryzen. То есть четыре новых чипа опираются на архитектуру Zen+ и производятся по техпроцессу 12-нм LP на заводах GlobalFoundries. Мы уже рассмотрели подробности архитектуры в тесте второго поколения Ryzen, поэтому здесь остановимся лишь на самых важных моментах.

Изменения кэша и контроллера памяти

Кроме уменьшения структуры транзисторов с 14 до 12 нм, AMD подчеркивает снижение задержек памяти по сравнению с первым поколением Ryzen Threadripper. Для кэшей L1, L2 и L3 AMD указывает улучшения порядка 8, 9 и 15%, но для памяти всего 2%. Впрочем, по производительности кэша AMD все равно отстает от Intel, что соответствующим образом сказывается на приложениях, чувствительных к скорости кэша и памяти.

AMD Ryzen Threadripper 2990WX

AMD Ryzen Threadripper 2990WX: размер кэша по сравнению с первым поколением не изменился, но задержки уже ниже

Поддерживаемая официально частота памяти увеличилась с DDR4-2666 до DDR4-2933, хотя для второго поколения Ryzen Threadripper верно то же самое, что и для Ryzen 2: все зависит от конфигурации. Процессор поддерживает максимальную частоту памяти только в том случае, если материнская плата поддерживает только четыре банка памяти, и все они заполнены. Если доступны восемь банков, из которых заняты четыре, то AMD обещает лишь DDR4-2666, с частотами DDR4-2133 (один ранг) и DDR4-1866 (два ранга) при полном заполнении (восемь планок).

Поддержка памяти DDR4 вторым поколением процессоров Ryzen Threadripper
Конфигурация памятиОдин/два рангаЧастота памяти
4 из 4ОдинDDR4-2933
4 из 4ДваDDR4-2933
4 из 8ОдинDDR4-2666
4 из 8ДваDDR4-2666
8 из 8ОдинDDR4-2133
8 из 8ДваDDR4-1866

AMD не стала менять размер кэшей L2 и L3. Они по-прежнему составляют 512 кбайт на ядро (L2) и 16 Мбайт на кристалл (L3), что связано с архитектурой Zen+. Однако по кэшу L3 процессор Ryzen Threadripper 2970WX стал исключением, на нем мы остановимся чуть позже.

Как и в случае первого поколения, мы получаем четыре канала памяти. Они поддерживают память ECC (но не регистровую ECC!), доступны 64 линии PCIe 3.0, из которых четыре зарезервированы на связь с чипсетом.

CCX и Infinity Fabric

При обсуждении архитектур Zen и Zen+ весьма важны две темы - CCX и Infinity Fabric. Оба фактора обеспечивают хорошую масштабируемость в зависимости от числа ядер, в результате высокий уровень многопоточной производительности, что AMD считает важным.

Блок CCX (Compute Complex) содержит четыре вычислительных ядра, каждый с кэшем L2 и L3. Как обычно в качестве интерконнекта используется Infinity Fabric, состоящий из двух уровней. Control Fabric обеспечивает связь разных блоков Engine Hubs, отвечая за задачи управления энергопотреблением, безопасностью, сбросом и инициализацией, тестированием. Второй уровень - Data Fabric, здесь уже передаются данные с высокой скоростью и низкими задержками.

AMD Ryzen Threadripper 2nd Gen: Infinity Fabric состоит из Control Fabric и Data Fabric

В случае первого поколения Ryzen Threadripper все было довольно простым. Два кристалла (0 и 1) всегда были активны, пусть не всегда полностью. Каждый кристалл имел доступ к двум каналам памяти и 32 линиям PCIe 3.0. Интерконнект Infinity Fabric обеспечивал обмен данными с другим кристаллом. В случае второго поколения Ryzen Threadripper подобная конфигурация верна лишь для моделей 2920X и 2950X, которые опираются на два кристалла.

Два процессора WX, а именно 2970WX и 2990WX, отличаются от приведенной схемы. В последнем случае установлены четыре кристалла, обеспечивающие 32 ядра, но только два могут напрямую работать с памятью и линиями PCIe 3.0, что приводит к большей плотности интерконнекта. Теперь кристаллы соединяют уже шесть каналов, которые позволяют каждому кристаллу обмениваться данными с каждым. Сама AMD говорит о кристаллах IO (0 и 2), которые имеют доступ к памяти и линиям PCIe 3.0, и кристаллах Compute (1 и 3), которые могут получать данные только по каналам Infinity Fabric.

Ryzen Threadripper 2950X - внутренний интерконнект

Ryzen Threadripper 2990WX - внутренний интерконнект

Пропускная способность канала Infinity Fabric составляет 50 Гбайт/с в случае дизайна с двумя кристаллами, подобного Ryzen Threadripper 2950X. С четырьмя активными ядрами, как в случае Ryzen Threadripper 2990WX, мы получаем 25 Гбайт/с на канал. Если взять память на частоте 1.600 МГц или DDR4-3200, то потребуется примерно 22 Гбайт/с на канал.

NUMA и UMA, Game Mode и Creator Mode

В случае обычных настольных процессоров нет надобности разбираться в терминах UMA и NUMA. Разница между ними заключается в том, как процессор обращается к памяти. В случае настольных систем процессоры обычно представляют собой цельный кристалл, на котором установлены контроллеры всех каналов памяти. Тогда используется архитектура Uniform Memory Access (UMA): процессор имеет доступ ко всей памяти.

В том случае, когда процессор состоит из нескольких кристаллов, не все они имеют подключение ко всем контроллерам памяти. И архитектура UMA имеет существенный недостаток. Пропускная способность памяти остается прежней, поскольку число каналов прежнее, но вот задержки увеличиваются. Путь к определенным каналам памяти становится дольше из-за неизбежного использования интерконнекта между кристаллами. Если приложение чувствительно к задержкам памяти, производительность снижается.

В отличие от Ryzen Threadripper 2950X, процессор Ryzen Threadripper 2990WX может работать только в режиме NUMA.

В таком случае решением может стать архитектура NUMA (Non-Uniform Memory Access). Здесь к каждому кристаллу привязывается своя область памяти. Такой подход позволяет снизить задержки в целом, но придется пожертвовать пропускной способностью памяти.

Ryzen Threadripper 2950X: сравнение между UMA и NUMA
РежимЧтениеЗаписьКопированиеЗадержки
UMA86.920 Мбайт/с87.538 Мбайт/с80.269 Мбайт/с95,6 нс
NUMA69.446 Мбайт/с
86.066 Мбайт/с
77.075 Мбайт/с
69,8 нс

Проблема в том, что переключение между UMA и NUMA, которые AMD называет Distributed Mode и Local Mode, выполняется отнюдь не в динамике. Через Ryzen Master активируется соответствующая опция BIOS, после чего необходима перезагрузка. Кроме того, в целом сложно сказать, какие именно приложения выигрывают от UMA или NUMA. Здесь нет общих правил, все необходимо тестировать. Сама AMD указывает, что Ryzen Threadripper 2950X лучше работает в режиме Distributed Mode (UMA), по умолчанию активен именно этот режим. Но Ryzen Threadripper 2990WX может работать только в режиме NUMA из-за дизайна с 4 кристаллами.

UMA vs NUMA Cinebench 15 Multi-Thread

AMD Threadripper 2950X

UMA
3216 XX


3110 XX


Баллы
Больше - лучше

UMA vs NUMA POV-ray Multi-Thread

AMD Threadripper 2950X

UMA
6444 XX


6247 XX


Баллы
Больше - лучше

Впрочем, в Ryzen Master можно активировать другие настройки, которые связаны с архитектурой Ryzen Threadripper и могут дать определенные преимущества или просто необходимы, чтобы приложения работали корректно. Первая опция - Legacy Compatibility Mode. Она позволяет отключать кристаллы, чтобы решать проблемы с приложениями, не поддерживающими больше восьми ядер CPU. Проблемы могут проявлять себя в виде слишком низкой производительности или "вылетов". Если верить AMD, проблемы наблюдаются даже в таких свежих играх, как "Far Cry 5" и "Total War: Warhammer II". Первая упомянутая игра от Ubisoft отказывалась запускаться на Ryzen Threadripper 2990WX без активированного режима Legacy Compatibility Mode, то есть с полными 32 ядрами.

В случае Ryzen Threadripper 2950X доступны только стандартный режим и Legacy Compatibility Mode. В первом работают оба кристалла, активны все ядра и каналы памяти. В последнем - только один кристалл с восемью ядрами и двумя каналами памяти. В случае Ryzen Threadripper 2990WX есть дальнейшие градации. На первом уровне доступны два кристалла, то есть 16 ядер и четыре канала памяти, на втором - только один кристалл, то есть восемь ядер и два канала памяти. Отметим, что при активации Legacy Compatibility Mode на всех CPU используется архитектура NUMA.

Legacy Compatibility Mode AMD Ryzen Threadripper
МодельСтандартный режимПоловинаЧетверть
Ryzen Threadripper 2950X2 кристалла, 16 ядер, 4 канала1 кристалл, 8 ядер, 2 каналаН/Д
Ryzen Threadripper 2990WX4 кристалла, 32 ядра, 4 канала2 кристалла, 16 ядер, 4 канала1 кристалл, 8 ядер, 2 канала

Для быстрого переключения между разными режимами в утилите Ryzen Master доступны два профиля: Game Mode и Creator Mode. В Creator Mode активны все кристаллы и ядра, система работает в режиме Distributed Mode (UMA) - поэтому данный режим на Ryzen Threadripper 2990WX недоступен. В Game Mode активны Legacy Compatibility Mode и Local Mode (NUMA).

Ryzen Threadripper 2990WX с двумя активными кристаллами

Ryzen Threadripper 2990WX с одним активным кристаллом

В игровых тестах можно посмотреть влияние обоих профилей. Например, в "Far Cry 5" частота кадров увеличивается почти на 25%, "Rise of the Tomb Raider" на 16%. В других тестах, таких как "F1 2017", переход на игровой режим дает положительный эффект только по среднему значению fps. А в других играх, если учесть погрешность измерений, влияния вообще не прослеживается.

Precision Boost 2 и XFR 2

В первом поколении процессоров Ryzen Threadripper использовался набор сенсоров и анализа SenseMI, являющийся неотъемлемым звеном архитектуры Zen. При переходе на архитектуру Zen+ мы получили две обновленные технологии, как и в случае перехода с Ryzen на Ryzen 2.

Первое изменение касается Precision Boost, чья базовая функциональность осталась прежней. Как и раньше, таковые частоты могут меняться с шагом 25 МГц, в зависимости от доступного бюджета по температуре и энергопотреблению. Однако теперь тактовые частоты не привязаны к числу ядер. В результате ядра могут более гибко выставлять тактовые частоты, впрочем, здесь можно посетовать на отсутствие фиксированных стандартов. Например, у Intel частоты Turbo определены для одного, двух, четырех или шести ядер. AMD указывает лишь базовую и максимальную частоты, последняя чаще всего касается нагрузки только на одно ядро.

В случае Precision Boost 1 небольшой прирост частот с шагом 25 МГц был возможен, максимум, для двух ядер/четырех потоков, после чего частота начинала снижаться вплоть до базовой. С новым поколением Precision Boost 2 частота снижается намного медленнее, здесь уже не принципиально, сколько ядер нагружено. Соответствующие сенсоры опрашиваются 1.000 раз в секунду, они передают свою информацию через Infinity Fabric. Максимальная частота в результате выставляется на основе совокупности нескольких алгоритмов. Поэтому частота можно много раз меняться, но за определенный период времени средняя производительность будет выше. Для Ryzen Threadripper 2950X AMD примерно указывает частоту Turbo на уровне 3,9 ГГц для четырех ядер, 3,7 ГГц для восьми ядер и 3,6 ГГц для 12 ядер. Ryzen Threadripper 2990WX должен работать на частоте 3,8 ГГц (восемь ядер), 3,6 ГГц (16 ядер) и меньше 3,5 ГГц (24 ядра).

AMD Ryzen Threadripper 2nd Gen: технология Precision Boost 2 позволяет достигать более высоких тактовых частот, если позволяет бюджет по температуре и энергопотреблению

Технологию Extended Frequency Range (XFR) можно рассматривать как дополнение. Благодаря XFR AMD позволяет задействовать потенциал более мощных систем охлаждения, то есть большего теплового бюджета. Например, переход с кулера Wraith Ripper на СВО с 360-мм радиатором при прежней температуре воздуха приведет к росту производительности примерно на 2%. Благодаря большему тепловому бюджету тактовые частоты могут подняться выше планки, указанной AMD. Компания говорит о приросте производительности до 16%, но при этом учитываются разные температуры окружающей среды.

Технология XFR 1 в первом поколении Ryzen Threadripper могла увеличивать тактовые частоты только двух ядер на кристалл. В случае XFR 2 такого ограничения нет. Впрочем, как и в случае тестов второго поколения Ryzen, на технологию можно не обращать внимания. После установки более мощной системы охлаждения максимум, что вы получите, это пики в дополнительные 50 МГц.