Страница 2: Дополнительные подробности и таблица процессоров

Genoa и дизайн SoC

12 CCD и IOD, а также два сокета в конфигурации 2S необходимо как-то соединять. В общей сложности Genoa предлагает 128 линий соединения SerDes 32 Гбит/с для разных стандартов. В конфигурации 1S их можно использовать для 128 линий PCI Express 5.0 (плюс 8x PCI Express 3.0). В системе 2S доступны 160 линий PCI Express. Вместо PCI Express можно вывести 64 линии CXL.

С предыдущими поколениями AMD уже предлагала отличную подсистему ввода/вывода. Genoa продолжает традиции, обеспечивая значительное число линий PCI Express. У процессоров Sapphire Rapids, скорее всего, число линий PCI Express будет ограничено 80, что больше Ice Lake, но все по-прежнему меньше AMD.

Впрочем, здесь производители серверов получают определенную гибкость. Они могут использовать три или четыре канала соединения между процессорами (3Link или 4Link) в системе 2S. С тремя каналами доступны 160 линий PCIe 5.0 и 12 PCIe 3.0. В случае 4Link число линий ограничивается 128 PCIe 5.0 и 12 3.0.

Еще один уровень гибкости добавляется в том, что производителям не нужно выводить четыре канала с одной стороны, их можно реализовать как 2+2 с двух сторон.

Линии PCI Express тоже могут быть в разных конфигурациях: они различаются по блокам с x16, x8, x4, x2 и x1. В общей сложности на блок x16 можно подключить девять устройств (8x x1 + 1x x8).

Существенная доля энергопотребления процессора EPYC связана с подключением CCD к IOD. AMD внесла некоторые улучшения в интерконнект чиплетов GMI3, что привело к небольшому повышению эффективности. AMD говорит о <2 пДж/бит, ранее речь шла о точном значении 2 пДж/бит. Интерфейсы SerDes с пропускной способностью 36 Гбит/с работают с отношением 20:1 от тактовой частоты Infinity Fabric процессора, которая составляет 1,8 ГГц. Если интерфейсы не используются, то GMI3 потребляют примерно на 20% меньше энергии, чем у предшествующего поколения.

Впервые процессоры EPYC стали поддерживать CXL. Здесь тоже используются интерфейсы SerDes, который обеспечивали линии PCI Express. Поддерживается стандарт CXL 1.1(+) с некоторыми функциями CXL 2.0 для Type 3. К сокету можно подключать до 16 устройств CXL. Два других типа CXL не поддерживаются.

  • Type 1: не поддерживается (ускоритель с собственной памятью)
  • Type 2: не поддерживается (устройство кэширования или ускоритель)

Гипервизоры и системы виртуализации на процессоре могут использовать расширение памяти CXL. Память, подключаемая через CXL, базируется на DDR, задержки будут примерно на уровне передачи от сокета к сокету. AMD не видит каких-либо недостатков в подобном внешнем подключении памяти.

Собственные тесты AMD

Конечно, AMD показала свои тесты, в которых проводится сравнение с процессорами Intel Ice Lake и собственными предшественниками. К сожалению, не с процессорами Xeon четвертого поколения на Sapphire Rapids, поскольку они еще не вышли.

Почти во всех категориях AMD не только обгоняет предшественника, но и конкурента. Производительность SpecINT по сравнению с Milan была удвоена, она в три раза выше, чем у Ice Lake с 40 ядрами. По целочисленной производительности на ватт преимущество перед конкурентом 2,6x-кратное.

96 ядер на сокет позволяют во многих случаях использовать только один сокет вместо двух. AMD здесь указывает экономию 25% по энергопотреблению при почти одинаковой производительности. Производительность на ядро/поток на +50% выше Intel. Кроме того, 1S позволяет экономить на лицензиях, что дает максимальную производительность в расчете на лицензию. AMD считает, что клиенты получат на 50% больше производительности на лицензию, также потребуется меньше лицензий для достижения целевой производительности или числа ядер.

Если верить AMD, здесь можно снизить цену покупки, поскольку для целевой вычислительной производительности придется покупать меньше серверов. И цену владения парком серверов. Как указывает AMD, для целевого уровня 8.500 баллов SPECrate 2017_int_base потребуются 15 серверов с двумя Intel Xeon Platinum 8380 каждый. Либо всего пять серверов с двумя EPYC 9654 (96 ядер) каждый. AMD указывает затраты на электроэнергию 103.000 кВт·ч для систем Intel и примерно в два раза меньше 47.000 кВт·ч для новых EPYC.

В двух галереях выше приведены дополнительные слайды и результаты тестов. Наши коллеги ServeTheHome и Phoronix уже представили независимые тесты к моменту выхода процессоров Genoa.

Обзор процессоров

По логике процессоры Genoa должны были выйти в линейке 8000, но прирост производительности просто слишком велик, чем AMD объясняет переход на линейку 9000. Номенклатура расшифровывается следующим образом:

"9" в начале модельного номера указывает на линейку – то есть Genoa. То же самое касается последней цифры, которая всегда "4". Третий знак указывает на число ядер (0=8, 1=16, 2=24, 3=32, 4=48, 5=64, 6=84/96). Второй знак – рейтинг производительности. Чем больше цифра, тем выше ожидаемая производительность. Наконец, добавление буквы “F” в конце указывает на увеличенную частоту, а буква “P” означает односокетные системы.

Сравнение процессоров Genoa

Ядра Базовая частота/Boost Кэш L3 Default TDP cTDP Цена
EPYC 9654/P 96 2,4 / 3,7 ГГц 384 Мбайт 360 Вт 320 - 400 Вт 11.805 USD
EPYC 9634 84 2,25 / 3,7 ГГц 384 Мбайт 290 Вт 240 - 300 Вт 10.304 USD
EPYC 9554/P 64 3,1 / 3,75 ГГц 256 Мбайт 360 Вт 320 - 400 Вт 9.087 USD
EPYC 9534 64 2,45 / 3,7 ГГц 256 Мбайт 280 Вт 240 - 300 Вт 8.803 USD
EPYC 9474/F 48 3,6 / 4,1 ГГц 256 Мбайт 360 Вт 320 - 400 Вт 6.780 USD
EPYC 9454/P 48 2,75 / 3,8 ГГц 256 Мбайт 290 Вт 240 - 300 Вт 5.225 USD
EPYC 9374F 32 3,85 / 4,3 ГГц 256 Мбайт 320 Вт 320 - 400 Вт 4.850 USD
EPYC 9354/P 32 3,25 / 3,8 ГГц 256 Мбайт 280 Вт 240 - 300 Вт 3.420 USD
EPYC 9334 32 2,7 / 3,9 ГГц 128 Мбайт 210 Вт 200 - 240 Вт 2.990 USD
EPYC 9274F 24 4,05 / 4,3 ГГц 256 Мбайт 320 Вт 320 - 400 Вт 3.060 USD
EPYC 9254 24 2,9 / 4,15 ГГц 128 Мбайт 200 Вт 200 - 240 Вт 2.299 USD
EPYC 9224 24 2,5 / 3,7 ГГц 64 Мбайт 200 Вт 200 - 240 Вт 1.825 USD
EPYC 9174F 16 4,1 / 4,4 ГГц 256 Мбайт 320 Вт 320 - 400 Вт 3.850 USD
EPYC 9124 16 3,0 / 3,7 ГГц 64 Мбайт 200 Вт 200 - 240 Вт 1.083 USD

Для самых мощных моделей указан TDP 360 Вт. Но AMD оставляет возможность для клиентов увеличить TDP некоторых моделей до 400 Вт. Ранее порог был 280 Вт. Базовая частота и Boost в некоторых случаях существенно увеличились по сравнению с предшественниками, несмотря на прирост числа ядер CPU до 50%.

Интересно, что базовая частота моделей с 84 или даже 96 ядрами не снизилась по сравнению с процессорами Milan. Здесь 5-нм техпроцесс CCD показывает себя с лучшей стороны. Как мы отмечали ранее, частоты Boost во многих случаях даже увеличились. Процессоры F вообще оптимизированы под высокие тактовые частоты. Например, EPYC 9174F достигает базовой частоты 4,1, а Boost – 4,4 ГГц.

Вместо предыдущего максимума кэша L3 в 256 Мбайт процессоры EPYC на дизайне Genoa обеспечивают до 384 Мбайт на 12 CCD. Объем кэша L3 конкретных моделей зависит от числа активных CCD. Как и раньше, AMD иногда оставляет одно активное ядро на CCD, чтобы выдать максимальную емкость L3 по отношению к числу ядер. Хотя у Genoa немного отличается конфигурация с 12 CCD и 16 или 24 ядрами.

Процессоры EPYC на дизайне Genoa доступны с сегодняшнего дня. Цены AMD тоже привела. Партнеры AMD в серверном сегменте HPE, Lenovo, Atos, Inspur, AWS, Azure и многие другие вскоре представят свои продукты и сервисы на основе четвертого поколения EPYC.

Mercury Research как раз опубликовала новое распределение по рыночной доле CPU. AMD теперь занимает 17,5%, доля увеличилась на 7% по сравнению с предыдущим годом (10,2%), а также немного увеличилась по сравнению с Q2 2022 (13,9%).

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).