AMD Ryzen 3000: Zen 2 и до 16 ядер - все подробности

Опубликовано:

amd-matisseНа мероприятии Next Horizon Tech Day незадолго до открытия выставки E3 AMD раскрыла все подробности процессоров Ryzen третьего поколения и архитектуры Zen 2. Помимо вариантов с шестью, восемью и 12 ядрами, которые были объявлены на Computex, AMD раскрыла на Tech Day планы по выпуску 16-ядерного Ryzen. Ниже мы расскажем о всем детально.

Но сначала позвольте поделиться подробностями архитектуры Zen 2, о которых ранее не было известно. Когда архитектура Zen 2 планировалась в 2015 году, целью был техпроцесс 7 нм. Но в то время еще не было понятно, получится на него перейти или нет. Zen 2 разрабатывалась как серверная архитектура с низкими тактовыми частотами, поэтому и дизайн у нее соответствующий. Но позднее AMD обнаружила, что процессоры могут работать на существенно более высоких частотах. Поэтому Zen 2 вполне хорошо подошла и для настольных процессоров Ryzen. Какой был альтернативный план, AMD не пояснила.

Этим летом архитектура Zen 2 увидит свет вместе с процессорами Ryzen, позднее в нынешнем году она станет использоваться и во втором поколении процессоров EPYC. Конечно, у AMD есть планы по поводу Zen 3 и следующих архитектур.

Все это было подтверждено на Tech Day, AMD рассказала об архитектуре Zen 3, разработка которой идет по плану - она как раз будет использоваться с улучшенным техпроцессом (7 nm+). Архитектура Zen 4 находится на этапе дизайна, она должна появится уже в 2020 году.

Дизайн chiplet и 7-нм техпроцесс должны принести свои плоды, но AMD подчеркнула, что компании пришлось преодолеть немало препятствий. 7-нм производство потребовало использования большего числа трафаретов для каждого этапа фотолитографии, в некоторых случаях до четырех на этап. Однако такой подход позволил увеличить плотность расположения транзисторов вплоть до двух раз.

Для архитектуры Zen 2 AMD выставила ряд целей, которые должны были увеличить IPC на 8-10%. В конечном итоге удалось добиться 15%, причина следующая:

AMD выпустит следующие процессоры:

Линейка Ryzen 7 и Ryzen 9

Ядра/ потоки Базовая частота/BoostКэш L3Кэш L2TDPЦена
Ryzen 9 3950X 16 / 32 3,5 / 4,7 ГГц64 MB8 MB105 Вт749 USD
Ryzen 9 3900X 12 / 24 3,8 / 4,6 ГГц64 MB6 MB105 Вт499 USD
Ryzen 7 3800X 8 / 16
3,9 / 4,5 ГГц32 MB4 MB105 Вт399 USD
Ryzen 7 3700X 8 / 16 3,6 / 4,4 ГГц32 MB4 MB65 Вт329 USD

Слухи, которые ходили во время Computex, были подтверждены на Tech Day: процессор Ryzen с 16 ядрами все же выйдет. Он будет называться Ryzen 9 3950X, базовая частота составит 3,5 ГГц, в режиме Boost она будет увеличиваться до 4,7 ГГц. В результате мы получаем самый быстрый процессор Ryzen по частоте Boost. Тепловой пакет процессора составил те же 105 Вт. CPU Ryzen 9 3950X выйдет в сентябре. Все остальные процессоры, как и соответствующие материнские платы, появятся 7 июля. Ближе к тому времени мы наверняка узнаем и цены в рублях.

Более экономным пользователям AMD предлагает процессоры Ryzen 5:

Линейка Ryzen 5

Ядра/ потоки Базовая частота/BoostКэш L3Кэш L2TDPЦена
Ryzen 5 3600X 6 / 12 3,8 / 4,4 ГГц32 MB3 MB95 Вт249 USD
Ryzen 5 3600 6 / 12
3,6 / 4,2 ГГц32 MB3 MB65 Вт199 USD

Все процессоры опираются на платформу AM4 с одноименным сокетом. AMD рассказала подробности платформы еще на Computex. Среди прочего, процессоры Ryzen третьего поколения предлагают 24 линии PCI Express 4.0. Четыре зарезервированы для подключения чипсета. Остаются 16+4 линий для видеокарты и других устройств, таких как SSD. Официально поддерживается память DDR4-3200, однако память с CPU третьего поколения может работать в разгоне и на более высоких частотах по сравнению с предыдущим поколением.

Чипсет производится по 14-нм техпроцессу и имеет ту же структуру, что и кристалл ввода/вывода в составе процессоров. В результате AMD может выпускать чип для использования в разных сценариях. Но кристалл ввода/вывода CPU все же производится по 12-нм техпроцессу и играет основную роль в работе с компонентами, если можно так выразиться. В чипсете же используется 14-нм кристалл ввода/вывода. И некоторые компоненты, такие как контроллеры памяти, в чипсете просто не задействованы.


Кристаллы на основе архитектуры Zen 2 имеют внутреннее название Valhalla. Кристалл Valhalla, также называемый как CCD (Core Complex Die), состоит из двух блоков Core Complexes (CCX), каждый по четыре ядра. В результате кристалл Valhalla может содержать, максимум, восемь ядер. Поддержка SMT не изменилась, каждое ядро может выполнять два потока.

Каждый блок CCX оснащен 16 Мбайт кэша L3, который разделен на четыре участка по 4 Мбайт. Каждое ядро имеет доступ к собственным 512 кбайт кэша L2. Кэш L1 состоит из 32 кбайт для инструкций и 32 кбайт для данных. Также AMD добавила новые инструкции работы с кэшем, которые должны увеличить эффективность обработки.

Значительную роль в улучшении IPC является новый предсказатель ветвлений. Эффективное предсказание ветвлений позволяет более полно задействовать все ступени конвейера. Процессор предсказывает дальнейшие вычисления, которые произойдут вероятнее всего. Прогноз может сбыться, но CPU может и ошибиться. В итоге от доли успешных предсказаний зависит эффективность работы процессора. AMD с процессорами Zen 2 использует новый блок предсказания TAGE, где TAGE как раз описывает один из возможных алгоритмов.

Предсказатель ветвлений TAGE можно назвать гибридным. То есть вместо одного вероятного пути дальнейших вычислений рассчитываются несколько. У каждого сработавшего ветвления повышается приоритет, более приоритетные ветвления будут затем рассчитываться первыми. Буфер предсказания ветвлений TAGE довольно большой, и нем хранятся не отдельные ветвления, а их дерево. На данный момент предсказание ветвлений TAGE считается одним из самых эффективных.

Кэш микроопераций теперь может содержать в два раза больше инструкций. В случае Zen 2 число инструкций составляет 4K, у процессоров Zen и Zen+ буфер был всего 2K. AMD увеличила число блоков генерации адресов Address Generation Units (AGU) с двух до трех.

Весьма интересны два 256-битных блока работы с плавающей запятой, которые теперь могут обрабатывать инструкции AVX256. За такт теперь могут выполняться две операции чтения и одна записи, что позволит быстрее наполнять вычислительные блоки данными.

Кэш данных L1 может обмениваться информацией с кэшем L2 со скоростью 32 байт/такт в обоих направления. В случае кэша инструкций они могут считываться из кэша L2 со скоростью 32 байт/такт. Кэш L2, в свою очередь, может считывать или записывать данные из кэша L2 со скоростью 32 байта/такт. Кэш L3 был увеличен, чтобы минимизировать внешние запросы через Infinity Fabric.

AMD не только увеличила кэши, но и соответствующие регистры. L1 BTB теперь хранит 512 записей вместо 256. В случае L2 BTB размер увеличился с 4K до 7K.

Что касается работы с числами с плавающей запятой, мы уже отметили выше два 256-битных блока. Задержка умножения была снижена с четырех до трех тактов.

Есть ряд улучшений по целочисленным вычислениям. Планировщик Integer Scheduler теперь содержит 92 записи вместо 84. Файл регистров общего назначения был увеличен со 168 до 180 записей. Вместо шести теперь поддерживаются до семи операций выдачи за такт (четыре ALU, три AGU).


Переход на техпроцесс 7 нм и дизайн chiplet позволили установить в упаковку три кристалла (два кристалла CPU и один ввода/вывода). Если кристаллы CCX с архитектурой Zen+ имели площадь 60 мм², у Zen 2 она составляет только 31,3 мм². В результате AMD получила возможность установить в два раза больше ядер в прежнюю упаковку. В зависимости от приложений, такой подход может привести к существенному масштабированию производительности. Также свою роль играют уменьшенные задержки доступа к памяти и Infinity Fabric, на чем мы остановимся ниже.

Топология процессоров Ryzen нового поколения следующая:

Для процессоров Ryzen с шестью и восемью ядрами AMD будет использовать один кристалл CCD (Core Complex Die) и один кристалл ввода/вывода. Интерконнект между двумя кристаллами реализован через Infinity Fabric. Обмен данными выполняется со скоростью 32 байт/такт в обоих направлениях.

Процессоры Ryzen с 12 или 16 ядрами содержат уже два кристалла CCD. Оба они подключаются интерконнектом Infinity Fabric к кристаллу ввода/вывод со скоростью до 32 байт/такт.

Третье поколение процессоров Ryzen использует интерконнект Infinity Fabric второго поколения. Он уже ранее применялся для процессоров на основе многочипового дизайна MCM. Но в случае второго поколения ширина увеличилась с 256 до 512 бит. Произошли и другие оптимизации Infinity Fabric. Если раньше частота Infinity Fabric была привязана к частоте памяти, то теперь она может быть изменена. Разделение начинается с делителя памяти выше DDR4-3733. Интерконнект Infinity Fabric в таком случае перестает работать в режиме 1:1, переходя на 2:1. В результате частоту памяти можно выставлять выше, но и задержки увеличатся.

Упаковка - еще одна проблема

Два кристалла CPU по 7-нм техпроцессу, один кристалл ввода/вывода по 12-нм технологии, скоростная шина памяти, PCI Express 4.0 - все это накладывает свои требования на упаковку. Подложка, на которую устанавливаются кристаллы, теперь состоит из 12 слоев (половина из них используются для питания). Ранее процессоры в дизайне MCM опирались на подложку с восемью или десятью слоями. Причем на данный момент только две компании могут изготавливать подложку, обе находятся в Японии. AMD уже довольно давно с ними сотрудничает по разным продуктам.

Произошли изменения и по подключению чипов к подложке. Например, шаг между контактными шариками BGA снизу кристалла составляет для 12-нм чипов 150 мкм. В случае новых 7-нм кристаллов шаг уменьшился до всего 130 мкм. AMD теперь использует менее толстые медные "колонны", обеспечивающие контакт между кристаллом и подложкой. Отметим, что подложка во всех процессорах используется одинаковая, как с одним CCD, так и с двумя CCD.

В галерее ниже можно найти дополнительные подробности.

Совместимость с сокетом AM4 начинается от Excavator и заканчивается на данный момент Matisse - с 28 нм на 7 нм, с монолитного кристалла на дизайн chiplet, с PCI Express 3.0 на 4.0 и с памяти DDR4-2600 на DDR4-3200. Все это, конечно, заставило решать немало проблем с маршрутизацией в упаковке.

AMD приходится отбирать чипы, которые производит TSMC, после чего сортировать их в зависимости от качества для разных процессоров. Для Ryzen 9 3950X отбираются лучшие чипы. AMD не раскрыла, какая часть и каких чипов будет выделена для новых процессоров EPYC.


С предыдущим поколением Ryzen AMD сотрудничала с Microsoft по вопросу Windows и с разработчиками Linux, чтобы внести различные оптимизации под архитектуру Zen и структуру процессоров. Данные шаги были повторены и для процессоров Ryzen третьего поколения. Они связаны как с новой архитектурой Zen 2, так и со спецификой дизайна chiplet.

Процессоры Ryzen Threadripper стали хорошим примером, поскольку дизайн MCM раскрывал свой потенциал не во всех сценариях. Проблемы возникали с более чем одним узлом NUMA, подключением памяти и обращением к ней с разных ядер.

AMD с третьим поколением процессоров Ryzen уже внесла различные оптимизации, которые доступны пользователям вместе с майским обновлением Windows 10. Новый драйвер чипсета позволит раскрыть потенциал процессоров сразу же после установки "чистой" системы.

Диспетчер задач Windows теперь понимает топологию CPU. Он знает структуру процессоров, разделение CCD и CCX, он пытается выполнять потоки и процессы одного приложения на одном CCX. Что минимизирует дополнительный обмен данных через кэши, снижает задержки и приводит к более высокому уровню производительности.

Третье поколение процессоров Ryzen сможет изменять тактовые частоты быстрее благодаря новому режиму (он реализован в UEFI через CPPC2). Под нагрузкой частоты будут расти быстрее, что обеспечит более ранее достижение максимальной производительности. Режим поддерживается Windows 10 с майского обновления. AMD указывает, что частота процессора теперь меняется не с шагом 30 мс, а за 1-2 мс. Конечно, если нагрузка продолжительная, то принципиальные изменения мы вряд ли получим. Но в повседневной работе программы должны реагировать быстрее и отзывчивее.

В зависимости от приложения, AMD говорит о приросте производительности до 15% благодаря тому, что операционная система "в курсе" топологии CPU и новому режиму более быстрого выставления частот.

Важным компонентом архитектуры Zen 2 является производительность IPC. Как мы отмечали ранее, AMD внесла разные оптимизации, чтобы увеличить эту производительность. 38% прироста IPC обусловлены переходом на 7-нм техпроцесс. Оставшиеся 62% являются следствием архитектурных улучшений. Здесь решающую роль играет память. Переход с DDR4-2667 на DDR4-3200 уже позволил увеличить производительность. AMD говорит о приросте 8% при переходе на DDR4-3600, компания рекомендует оснащать процессоры Ryzen третьего поколения скоростной памятью. Также процессоры AMD выигрывают от более крупного кэша L3 и изменений в его иерархии.

Контроллер памяти процессоров Ryzen на архитектуре Zen 2 был полностью пересмотрен. Также на материнских платах X570 был улучшен маршрут дорожек до слотов DIMM. Новые процессоры Ryzen официально поддерживают только DDR3-3200, но AMD указывает, что использование более быстрой памяти обеспечит дополнительный прирост производительности.

До частоты DDR4-3733 (включительно) контроллер памяти работает синхронно с Infinity Fabric, то есть частоты растут параллельно, задержки снижаются. Начиная с частоты DDR4-3866 включается делитель 2:1, поэтому задержки увеличиваются. Поэтому переход с DDR4-3733 на DDR4-3866 может даже привести к падению производительности. Но AMD в качестве целевой частоты для амбициозных пользователей видит DDR4-4200. На Tech Day мы посмотрели системы, работающие с памятью DDR4-4600. Сама AMD указывает, что на системах Ryzen уже проведены успешные тесты с планками DDR4-5100.

Разгон памяти дополняется другими возможностями разгона новых процессоров Ryzen и материнских плат. Меню разгона в BIOS/UEFI должно стать более однородным. Также можно ожидать более детального описания в BIOS, чтобы начинающие пользователи не терялись.

Программа Ryzen Master будет доработана, в ней появится еще больше опций, например, для памяти. Технология Precision Boost Overdrive была обновлена, она теперь обеспечивает автоматический разгон. Если система охлаждения позволяет, можно получить прирост частоты до 200 МГц по сравнению со штатной работой. AMD для каждого процессора задает базовую частоту и Boost. И в штатных условиях процессор будет достигать как раз заявленной частоты Boost. Лучшая система охлаждения в данном случае позволит удерживать частоту Boost дольше, на большем количестве ядер. В целом, частота процессоров Ryzen будет меняться с большей динамикой, чем раньше.


AMD использовала различные поводы, чтобы показать производительность новых процессоров Ryzen. Последний раз это произошло как раз на Computex. Конечно, Tech Day не стал исключением. В любом случае, к представленным ниже результатам мы рекомендуем относиться с долей скепсиса, поскольку источником тестов является AMD.

Впервые упомянуты результаты производительности Ryzen 9 3900X, а также сведения по 8- и 6-ядерным моделям.

Начнем с Ryzen 9 3900X с 12 ядрами, который AMD сравнивает с восьмиядерным Intel Core i9-9900K. Как видно, владелец Ryzen 9 3900X не потеряет ничего в играх. Что же касается продуктивных приложений, то 12 ядер покажут себя с лучшей стороны.

Причем за такую же игровую и более высокую производительность в сценариях рабочих станций не придется расплачиваться энергопотреблением. У Ryzen 9 3900X тепловой пакет составляет 150 Вт, система будет работать более экономично, чем Intel Core i9-9900K. AMD указывает прирост производительности на ватт на 58%.

Ryzen 7 3800X сравнивается с Intel Core i7-9700K. Здесь игровая производительность тоже находится на сравнимом уровне, где-то лучше, где-то хуже. Но AMD видит себя впереди Intel по продуктивным приложениям благодаря SMT (у Core i7-9700K нет Hyper-Threading).

Отрыв уже не такой большой, но Ryzen 7 3800X все равно должен обеспечивать на 30% более высокую производительность на ватт.

Продолжим с процессорами Ryzen 5. Здесь AMD сравнивает 6-ядерный Ryzen 5 3600X с Intel Core i5-9600K. Результаты близки - AMD находится на том же уровне в играх, но в сценариях, использующих большее число ядер или SMT, можно видеть преимущество по сравнению с Intel.

Однако преимущество по соотношению производительности на ватт продолжает снижаться. Хотя, если верить AMD, здесь мы получаем вполне достойный прирост 22%.


С платформой AM4 или одноименным сокетом AMD удалось создать долгосрочную основу, которая позволяет даже владельцам Ryzen первого поколения перейти со своими CPU на новейшую материнскую плату. Или, наоборот, установить на старую материнскую плату новенький процессор.

Если верить AMD, третье поколение процессоров Ryzen будет работать на всех материнских платах X570, X470 и B450. Со старыми моделями есть ограничения, поскольку здесь все зависит от производителей - они должны выпустить соответствующие обновления BIOS. Впрочем, большинство производителей уже пошли на такой шаг с материнскими платами на чипсетах 400 и 300. Для некоторых моделей обновления появятся позже. В любом случае, мы рекомендуем ознакомиться с веткой обновлений AM4 UEFI/BIOS нашего немецкого форума.

Также с третьим поколением процессоров Ryzen AMD снова предлагает комплект апгрейда. Если у вас нет совместимого процессора для материнской платы, чтобы выполнить обновление BIOS, AMD вышлет комплект из процессора и кулера, чтобы установить новую версию BIOS.

Отсутствующая поддержка процессоров Ryzen первого и, частично, второго поколения на новых материнских платах X570 AMD объясняет тем, что у производителей материнских плат нет особого интереса в валидации плат со старыми CPU. Так что если у вас имеется подобный процессор, и вы хотите перейти на новую материнскую плату, эту особенность следует иметь в виду. Впрочем, есть вероятность, что производитель материнской платы предложит более широкую поддержку в будущем. Здесь ситуация уже не в руках AMD.

Важным фокусом платформы AM4 на новом чипсете X570 является поддержка PCI Express 4.0. AMD предлагает на CPU 24 линии. Четыре зарезервированы для подключения чипсета, еще 16 предназначены для слотов PCI Express, остаются четыре линии для прямого подключения накопителей NVMe SSD к процессору, например.

Производители материнских плат здесь получают определенную гибкость. Четыре линии PCIe 4.0 процессора могут быть реализованы в виде 1x4 NVMe, 2x SATA + 1x2 NVMe или 2x2 NVMe.

Остальные компоненты можно подключить к чипсету, что дает большую гибкость. Возможно сочетание 2x4 NVMe + 4 SATA, 1x4 NVMe + 8x SATA или 3x NVMe. Производители материнских плат могут выбирать желаемую конфигурацию и самостоятельно решать, нужно им больше портов SATA или слотов NVMe. Дополнительные порты Ethernet и другие интерфейсы тоже можно реализовать через имеющиеся линии.

Важным моментом для AMD является доступность как можно большего числа интерфейсов. Сильным козырем обещает стать и PCI Express 4.0. Но и портов USB 3.1 Gen2 и SATA можно вывести больше, чем у конкурента. Впрочем, здесь все зависит от производителей материнских плат, которые сами будут решать, что важнее для покупателя.

На Computex мы видели большое количество новых материнских плат на чипсете X570. О чем мы опубликовали соответствующие новости, рекомендуем ознакомиться с дайджестом.


Все указывает на то, что AMD не только смогла наверстать свое отставание от Intel, но и обойти многолетнего лидера почти во всем. AMD уже неплохо показала себя с процессорами Ryzen первого поколения, которые смогли выделиться приличным числом ядер, теперь AMD догнала Intel по однопоточной производительности.

В результате AMD теперь может сравнивать свои процессоры с продуктами Intel напрямую, ядро на ядро. Конечно, AMD осталась привержена своей стратегии, фокусируясь на большем числе ядер. Начиная с 7 июля можно будет приобрести процессоры, обеспечивающие до 12 ядер для настольного сегмента. А в сентябре будут доступны и 16-ядерные CPU.

Конечно, польза от такого числа ядер очень сильно зависит от приложений и сценариев. Раньше AMD всегда отставала, если не удавалось загрузить большинство ядер - например, в играх, которым не требуется больше четырех или шести ядер. И до сих пор "слабым звеном" оставалась низкая однопоточная производительность AMD. Но с третьего поколения Ryzen ситуация изменилась в пользу AMD. Значительный прирост производительности IPC позволил AMD сравняться с Intel по скорости отдельных ядер.

Но не будем забывать, что на руках у нас пока имеются только результаты производительности, объявленные AMD. К 7 июля мы собираемся подготовить собственные тесты. Пока неизвестно, какие процессоры получит наша тестовая лаборатория. Также мы детально рассмотрим вопрос зависимости производительности от тактовых частот памяти. И проведем стандартные тесты в играх и приложениях для рабочих станций. Поддержка PCI Express 4.0 тоже должна сыграть свою роль. Для NVMe SSD преимущества очевидны, но в случае видеокарт не все пока ясно. Впрочем, в июле нас ждут новые видеокарты Radeon RX на архитектуре Navi, так что месяц обещает быть интересным.