> > > > Второе поколение Ryzen Threadripper: влияние конфигурации памяти меньше, чем ожидалось

Второе поколение Ryzen Threadripper: влияние конфигурации памяти меньше, чем ожидалось

Опубликовано:

threadripper teaserВ ближайшем будущем AMD представит свои процессоры Ryzen Threadripper второго поколения. Ранее они оснащались, максимум, 16 ядрами. Теперь на рынок выходят CPU с 24 и 32 ядрами.

Около двух недель назад оверклокер Роман Хартунг (Roman Hartung), известный под ником der8auer, провел тесты производительности AMD EPYC 7601 с 32 ядрами, что позволило оценить производительность процессоров Ryzen Threadripper второго поколения. Поскольку процессоры EPYC работают на меньших тактовых частотах по сравнению с Ryzen Threadripper, Роман разогнал процессор. Он воспользовался материнской платой Supermicro H11SSL-i и разогнал процессор до 3,8 ГГц. Результаты в тесте Cinebench оказались весьма впечатляющими, но, к сожалению, получить высокие тактовые уровня Ryzen Threadripper 2990X не получилось.

Но Роман и не думал сдаваться. Он решил обойти ограничения подсистемы питания материнской платы. И преуспел. Роман воспользовался утилитой eVc и интерфейсом I2C, через который можно управлять многими компонентами материнской платы, в том числе контроллером подсистемы питания. Роман выставил напряжение на 1,45 В, при этом подсистема питания выдавала на процессор больше 500 Вт мощности, компоненты быстро нагревались выше 90 °C. Чтобы предотвратить перегрев VRM, использовалась система жидкостного охлаждения 3M Novec. Все это позволило достичь частоты 4.050 МГц и провести дополнительные тесты.

Благодаря более высоким тактовым частотам, процессор EPYC 7601 на 4.050 МГц показал результат Cinebench почти 6.100 баллов. Вполне достойный уровень, что подняло планку многоядерного процессора в сегменте настольных ПК/рабочих станций еще выше.

Cinebench R15

Multi-Threaded

Баллы
Больше - лучше

Влияние интерфейса памяти не такое существенное, все зависит от приложения

32 ядра на 3,8 или 4,0 ГГц - весьма мощная комбинация, которая позволит процессорам Ryzen Threadripper с 24 и 32 ядрами раскрыть потенциал производительности. Но еще одно преимущество заключается в интерфейсе памяти. В отличие от серверных процессоров EPYC, модели Ryzen Threadripper продолжат опираться на 4-канальный интерфейс памяти вместо восьми каналов. В первых проведенных тестах результат составил на 3,4 ГГц 3.867 баллов для четырех каналов и 5.234 балла для восьми каналов памяти.

Роман решил вернуться к данному вопросу, но заключение на этот раз оказалось иным. В зависимости от того, как к процессорам EPYC подключается память в восьми слотах DIMM, производительность отличается. Конечно, благодаря в два раза большему числу каналов памяти, 8-канальный интерфейс дает 125 Гбайт/с, почти в два раза больше 65 Гбайт/с у 4-канального интерфейса. Также имеются отличия и по задержкам, в зависимости от адресуемого DIMM и узла NUMA, который к нему обращается. Как раз недавно мы провели дополнительные тесты режимов Game и Creator под Ryzen Threadripper. В зависимости от приложения, задержки и пропускная способность памяти могут сказываться в той или иной степени. Что касается процессоров Ryzen Threadripper, процессоры будут довольствоваться 4-канальным интерфейсом.

Похоже, что структура подключения отдельных каналов памяти играет не самую важную роль. В теории мы уже исследовали данный вопрос, предположив, что в некоторых конфигурациях могут возникнуть проблемы.

Слева можно видеть конфигурацию, схожую с нынешним первым поколением. Только два кристалла Zeppelin из четырех оснащены двумя контроллерами памяти и 32 линиями PCI Express каждый. Два других кристалла Zeppelin только обеспечивают ядра без внешних интерфейсов. И с увеличением числа ядер до 24 и 32 ничего не изменится.

Ситуация со второй возможной конфигурацией отличается. Каждое ядро Zeppelin содержит по одному контроллеру DDR4 и по 16 линий PCI Express. В таком случае процессор Ryzen Threadripper будет содержать уже четыре узла NUMA, к каждому подключена собственная память по одному каналу. В режиме NUMA задержки при работе с локальной памятью будут вновь низкими, но пропускная способность значительно снижается - уже в четыре раза. В режиме Creator Mode мы получим прежнюю высокую пропускную способность, но и высокие задержки.

Роман пришел к заключению, что производительность, по крайней мере, в Cinebench, не имеет существенных отличий - независимо от подключения планок памяти.