Страница 10: Дополнительные тесты: память и задержки ядер, IPC

В тесте AIDA64 мы получили задержки доступа чтения 144,6 нс. Однако AIDA64 проводит измерения при определенном размере блока. При повышении размера блока задержки увеличиваются вплоть до 230 нс.

В случае современной быстрой памяти DDR4 и оптимизированного контроллера можно получить задержки чуть ниже 60 нс, но пропускная способность DDR4 медленно подходит к своему пределу. Используемая здесь GDDR6 дает более высокую пропускную способность, но и задержки значительно выше. Похоже, что для консолей AMD пришлось пойти на некоторые компромиссы вместе с Sony, поскольку встроенная графика, которой здесь нет, выигрывает, главным образом, от высокой пропускной способности.

По задержкам AMD довольно сильно продвинулась вперед с поколениями Zen. Ryzen 4700S опирается на архитектуру Zen 2, здесь мы получаем типичные задержки для четырех ядер первого кластера CCX, при обращении к второму кластеру они намного выше. Ryzen 7 4700GE здесь дает порядка 20/50 нс.

От снижения задержек выигрывает игровая производительность, по этой причине Ryzen 4700S в виде Oberon хорошо подходит для PlayStation 5. Но уровня Zen 3 мы здесь не получили, конечно.

Тесты IPC

Ryzen 4700S - не просто специализированный чип Ryzen с восемью ядрами Zen 2. Как показывает анализ снимка кристалла, AMD вместе с Sony внесли изменения в блоки работы с плавающей запятой и соответствующие регистры. Суть изменений не раскрывается, но сами блоки физически меньше. Наши тесты показывают, что регистры идентичны, то есть по-прежнему используются 60 регистров FP (16 архитектурных и 144 спекулятивных).

Но по производительности мы получили всего лишь половину от типичного процессора Zen 2. Наш анализ подкрепляется результатами сообщества Twitter, в том числе @GPUsAreMagic.

Однако кое-где Ryzen 4700S оказался быстрее, чем мы ожидали. Мы проводили стандартные тесты, чтобы избежать ошибок. И специализированный дизайн Ryzen 4700S можно вполне назвать Zen2+.

В таблице видна меньшая производительность вычислений с плавающей запятой, но вот целочисленная производительность оказалась даже чуть выше. Почему AMD пошла на подобные изменения, и в какой степени они затрагивают АЛУ, сказать сложно. В конечном итоге перед нами оптимизация Zen2+ под консоли.