Страница 2: Архитектура Zen+

Для нового поколения CPU AMD вновь использовала архитектуру Zen, которой теперь исполняется один год, но она была оптимизирована во многих областях. Поэтому AMD назвала новую архитектуру Zen+. Добавьте к этому и немного уменьшенный техпроцесс, то есть новое поколение Ryzen по терминологии Intel "тик-так" нельзя отнести ни к "тику", ни к "таку".

12 нм вместо 14 нм, DDR4-2933 вместо DDR4-2666

Еще после представления APU Raven Ridge стало понятно, что AMD перейдет на более скоростную память. Как и в случае APU, новые процессоры Ryzen поддерживают DDR4-2933 вместо DDR4-2666 первого поколения. Впрочем, на самом деле это не так и важно, поскольку неофициально процессоры работают и с более скоростной памятью. Что положительно сказывается на производительности, но об этом мы поговорим чуть позже. Впрочем, следует помнить, что некоторые комбинации режимов либо невозможны, либо ограничены. Стоит обращать внимание не только на частоту памяти, но и на структуру планок (одно- или двуранговые) и число модулей. Как и раньше, процессоры поддерживают двухканальный режим работы.

Поддержка памяти DDR4 процессорами Ryzen 2xxx
Конфигурация памяти Частота
Dual-Channel / Dual Rank / 4 DIMM DDR4-1866
Dual-Channel / Single Rank / 4 DIMM DDR4-2133
Dual-Channel / Dual Rank / 2 DIMM DDR4-2400
Dual-Channel / Dual Rank / 2 DIMM DDR4-2667
Dual-Channel / Single Rank / 2 DIMM DDR4-2933*
*: требуется материнская плата с числом слоев PCB не менее шести

AMD почти не раскрывает детальные отличия между Zen (Summit Ridge)/Zen 1.5 (Raven Ridge) и Zen+ (Pinnacle Ridge). Разве что упоминаются "целевые улучшения", направленные на уменьшение задержек. Для кэша L1 задержки снизились примерно на 13%, для кэша L2 - на 34%, для кэша L3 - на 16%. Задержки при работе DRAM снижены на 11%. Также увеличился рейтинг IPC (Instructions per Cycle), то есть число выполняемых инструкций за такт. Zen+ показывает прирост на 3%.

Переход с 14-нм на 12-нм техпроцесс (12LP) привел к увеличению производительности транзисторов. AMD указывает прирост на 10-15%. Что позволило повысить тактовые частоты на 300 МГц с одновременным снижением напряжения ядер CPU на 50 мВ. По сравнению с Summit Ridge это должно привести к 10-15% снижению энергопотребления при равных тактовых частотах. Как видим, и здесь революционных изменений ждать не приходится, все же переход с 14 на 12 нм не такой существенный. Серьезные изменения нас ждут в следующем году с поколением Zen 2.

Но AMD приготовила кое-что еще. По крайней мере, в случае процессоров Ryzen 7 2700X и Ryzen 5 2600X: если все ядра нагружаются одновременно, тактовые частоты все равно остаются около планки 4 ГГц. В случае предшественников такой подход работал только с нагрузкой на одно ядро. В наших тестах мы действительно наблюдали подобное поведение, частоты во многих случаях были около планки 4 ГГц. Уже одно это приводит к тому, что вычислительная производительность оказывается выше, чем у предшественников.

Однако все имеет свою цену: Ryzen 7 2700X получили более высокий TDP 105 ВТ, хотя у Ryzen 7 1800X он был ограничен 95 Вт. В случае Ryzen 5 2600X тепловой пакет оставлен прежним - 95 Вт. Процессоры Ryzen 7 2700 и Ryzen 5 2600 более экономичны, они потребляют не более 65 Вт.

Максимальные тактовые частоты Ryzen 7 2700X и Ryzen 5 2600X
Модель 2 пот. 4 пот. 6 пот. 8 пот. 10 пот. 12 пот. 14 пот. 16 пот.
Ryzen 7 2700X 4,350 ГГц 4,200 ГГц 4,125 ГГц 4,050 ГГц 4,050 ГГц 4,025 ГГц 3,975 ГГц 3,925 ГГц
Ryzen 5 2600X 4,250 ГГц 4,075 ГГц 4,050 ГГц 4,050 ГГц 4,025 ГГц 4,025 ГГц - -

Как и в случае первого поколения, у новых процессоров распределитель тепла припаивается. AMD вновь использует припой на основе сплава индия. Если верить компании, такой подход увеличивает затраты, но обеспечивает более эффективное отведение тепла. По сравнению с другими решениями, температура ядер должна быть примерно на 10 °C ниже.

Zen+ использует знакомую архитектуру

Некоторое время назад утекла информация о том, что AMD работает над поколением Zen 5, что вызвало вопросы о номенклатуре CPU. Ясности с нумерацией пока нет, поскольку сама AMD в своей документации постоянно перескакивает с одной номенклатуры на другую. Первое поколение Ryzen опирается на архитектуру Zen 1, здесь вопросов нет. Но вот Raven Ridge иногда называются как Zen 1.5, а вышедшие сегодня процессоры Ryzen второго поколения - как Zen+. Между тем пользователи часто говорят о втором поколении как Zen 2. А процессоры Ryzen x 3xxx в таком случае вполне логично должны называться Zen 3.

Однако не следует забывать, что второе поколение процессоров Ryzen базируется на архитектуре Zen, представленной в прошлом году. Пусть и с упомянутыми выше оптимизациями. Что хорошо видно по числу транзисторов - оно осталось на прежнем уровне 4,8 млрд.

Конечно, отличия от предыдущей архитектуры Bulldozer можно назвать революционными. AMD перешла на классический дизайн процессора. Каждое ядро CPU использует четыре целочисленных блока, которые имеют 168 регистров и могут обрабатывать 192 инструкции одновременно. Два блока Load/Store отвечают за запись данных обратно в кэши после вычислений. Используются два блока работы с плавающей запятой, по 128 FMAC каждый (Floating Point Multiply Accumulators). Кэш инструкций имеет размер 64 кбайт 4-way, кэш данных - 32 кбайт с восемью одновременными обращениями (8-way). Кэш L2 имеет размер 512 кбайт, к нему тоже возможно одновременное обращение на чтение или запись по восьми каналам (8-way). Добавим к этому общий кэш L3.

Впрочем, кэш L3 для ядер доступен не в полном объеме, что связано со структурой CPU Complex (CCX). В случае Ryzen 7 2700X и Ryzen 7 2700 каждый из двух CCX содержит четыре ядра и 8 Мбайт кэша L3 - его могут использовать только четыре данных ядра. Ryzen 5 2600X и Ryzen 5 2600 содержат только три ядра в CCX, но для них все равно доступны те же 8 Мбайт L3. Кэш 8 Мбайт разделен на четыре раздела по 2 Мбайт, каждый раздел привязан к своему ядру CPU. И работа этих разделов зависит от частоты и нагрузки соответствующих ядер CPU. В результате при малой нагрузке напряжение и частота снижаются не только для ядра CPU, но и для соответствующего раздела кэша.

Добавьте к этому технологию SMT, позволяющую выполнять в два раза больше потоков, чем имеется ядер CPU. Впрочем, не стоит думать, что два потока на одном ядре будут выполняться с равной производительностью.

Infinity Fabric

Как и в первом поколении Zen, за связь между двумя CCX, оперативной памятью и различными контроллерами вновь отвечает интерконнект Infinity Fabric. AMD не приводит каких-либо изменений. В любом случае, мы по-прежнему получаем два уровня. Control Fabric обеспечивает связь разных блоков Engine Hubs, отвечая за задачи управления энергопотреблением, безопасностью, сбросом и инициализацией, тестированием.

Второй уровень - Data Fabric, здесь уже передаются данные с высокой скоростью и низкими задержками. В том числе и с оперативной памятью.

Структура CCX вместе с Infinity Fabric призвана обеспечить практически линейное масштабирование многопоточной производительности.