Страница 2: Ryzen 7000X3D и корпусировка

Процессоры Ryzen 7000X3D находятся на пределе современных возможностей производства и корпусировки. AMD и TSMC установили еще один кристалл на CCD, причем соединяются они через TSV. На CCD имеются соответствующие контактные точки и TSV, а также логика управления и питания. Сверху на него накладывается кристалл SRAM, при этом должна соблюдаться очень высокая точность. Кристалл удерживается просто прилипанием медных контактных точек.

Разница между Zen 3 с кэшем 3D V-cache и Zen 4 с кэшем 3D V-cache невелика. Чип SRAM, по всей видимости, производится по 6-нм техпроцессу, поэтому он чуть меньше. Но ничего особого увидеть все равно не получится, поскольку слой кремния выравнивает по высоте CCD плюс SRAM со вторым CCD и IOD. Мы уже приводили подробности Ryzen с 3D V-Cache в стеке и кольцевой шины.

Впрочем, большинству пользователей не так интересно, как именно все устроено под распределителем тепла. Процессор должен работать, и здесь имеет значение производительность Ryzen 7000X3D.

Предыдущий Ryzen 7 5800X3D был для AMD «пробным шаром», теперь представлены уже три модели с дополнительным кэшем L3 на CCD, причем они по-разному сконструированы.

Поступившие в розницу процессоры Ryzen 9 7950X3D и Ryzen 9 7900X3D предлагают 8+8 и 6+6 ядер, но только половина находится на CCD с дополнительным кристаллом SRAM. Поэтому здесь необходима эффективная диспетчеризация: у нас есть ядра с дополнительным кэшем на первом кристалле, а также ядра с потенциально более высокими частотами на втором. В зависимости от приложения, большая частота может быть важнее, чем дополнительный кэш.

Что касается игр, то все они должны работать на CCD0 с дополнительным кэшем. Сразу скажем, что так оно и было. Ситуация может отличаться для приложений, особенно однопоточных. В наших тестах они часто запускались на ядре CCD1.

Если верить AMD, свежей версии BIOS и драйвера чипсета AMD с версии 5.02.19.2221 достаточно для правильной работы диспетчеризации. Под Windows 11 также рекомендуется обновить Xbox Game Bar, чтобы запуск игры определялся корректно. Также в Windows должен быть включен игровой режим, чтобы фоновые процессы не мешали.

После установки драйвера чипсета в Диспетчере устройств появятся два новых устройства: "AMD PPM Provisioning File" и "AMD 3D V-Cache Performance Optimizer". В фоне будет работать сервис "AMD 3D V-Cache Performance Optimizer Service" и "amd3dvcacheUser.exe", отслеживая запущенные приложения.

При запуске игры все потоки должны выполняться на CCD0. В случае Ryzen 9 7950X3D ядра от 8 до 15 (потоки от 16 до 31) паркуются и не работают. Суть в том, чтобы увеличить процент попаданий в кэш L3.

В наших тестах мы не столкнулись с какими-либо проблемами диспетчеризации, впечатления были только положительные. Но мы решили провести дополнительные тесты. Мы записали максимальные тактовые частоты у разных процессоров и CCD.

Максимальные тактовые частоты CCD

CCD0 CCD1
Ryzen 9 7950X3D 5,25 ГГц 5,7 ГГц
Ryzen 9 7950X 5,7 ГГц 5,7 ГГц
Ryzen 9 7900X3D - -
Ryzen 9 7900X 5,6 ГГц 5,6 ГГц
Ryzen 7 7800X3D - -
Ryzen 7 7700X
-5,4 ГГц

У процессоров Ryzen 9 7950X, Ryzen 9 7900X и Ryzen 7 7700X мы получили максимальную частоту 5,7, 5,6 и 5,4 ГГц на CCD. Пока мы получили только процессор Ryzen 9 7950X3D, максимальная частота CCD0 составила 5,25 ГГц, а CCD1 – 5,7 ГГц. В играх, например, CCD0 может достигать 5,25 ГГц. А CCD1 может показывать в однопоточных тестах частоту до 5,7 ГГц.

Скриншот выше показывает, как распределяются потоки по ядрам в играх. Легко видеть, что нагружены ядра с первого по восьмое на частоте 5.000+ МГц, а ядра с девятого по 16 запаркованы и не участвуют в каких-либо вычислениях. Во всех протестированных играх ситуация была именно такой.

Под полной нагрузкой частоты намного ниже. Если запустить рендеринг на всех 16 ядрах, то на CCD1 они показывают частоты от 4.850 до 4.875 МГц, в случае CCD0 уровень был около 4,725 МГц. В случае Ryzen 9 7950X картина была похожей.

Задержки и пропускная способность памяти

Дополнительный кэш L3 на CCD должен показать преимущества в играх. В тестах задержек и пропускной способности эффект от дополнительного кэша тоже должен быть ощутим. Мы использовали утилиту clamchowder, которая позволяет выполнять подобные бенчмарки.

Увеличение емкости кэша L3 приводит к небольшому повышению задержек. Дельта составила от менее одной наносекунды до нескольких наносекунд. Впрочем, преимущества от увеличения кэша все же перевешивают недостатки от более длительных задержек.

Начиная с одного мегабайта разница становится более ощутимой, поскольку требуется записывать или считывать больше данных. Если 32 Мбайт на CCD1 заполнятся, то данные придется перекачивать в оперативную память, в случае же CCD0 можно задействовать более крупный кэш L3. Конечно, он тоже имеет ограничение емкости в 96 Мбайт, после чего данные все равно придется перекачивать в оперативную память.

По пропускной способности кэша и памяти процессоры Ryzen 9 7950X без кэша 3D V-Cache и Ryzen 9 7950X3D с дополнительным кэшем показали себя примерно одинаково. Отдельные уровни кэша в иерархии (от L1 к L2, от L3 к L3, от L3 к ОЗУ) подключены идентично через Infinity Fabric, поэтому мы не были удивлены схожей производительностью.

Наконец, мы оценили задержки между ядрами, здесь результаты предсказуемые, поскольку изменений по структуре двух CCD и их соединению не произошло. На CCD0 в процессоре Ryzen 9 7950X3D просто была добавлена память SRAM, которая никак не повлияла на задержки между ядрами.