> > > > Hotchips 34: NVIDIA раскрыла подробности кэша и памяти Grace Superchip

Hotchips 34: NVIDIA раскрыла подробности кэша и памяти Grace Superchip

Опубликовано:

nvidia-graceВесной NVIDIA официально представила первый чип ARM для суперкомпьютеров/серверов под названием Grace. Grace CPU опирался на 72 ядра ARM и 32 канала памяти LPDDR5X. Емкость памяти составила 512 Гбайт, пропускная способность памяти - 546 Гбайт/с.

На Hotchips 34 NVIDIA расскажет о Grace CPU, Grace CPU Superchip (2x Grace CPU) и Grace Hopper Superchip, который сочетает Grace CPU и Hopper GPU. NVIDIA покажет презентацию 22 августа, но часть информации уже известна.

Чтобы обеспечить совместимость с остальной серверной экосистемой, NVIDIA анонсировала поддержку на Grace двух стандартных функций ARM Server Base System Architecture (SBSA) и ARM Server Base Boot Requirements (SBBR). Также будет поддерживаться ARM Memory Partitioning and Monitoring (MPAM).

NVIDIA впервые не только раскрыла теоретическую пропускную способность подключенной памяти LPDDR5X 546 Гбайт/с, но и показала результаты тестов.

Они были получены в бенчмарке Stream. Grace CPU показал между 505 и 536 Гбайт/с, что довольно близко к теоретическому уровню 546 Гбайт/с. Отметим, что NVIDIA использовала инженерный образец чипа, в финальной версии он может быть доработан.

Также NVIDIA показала результаты тестов, касающиеся передачи данных между двумя CPU (Grace CPU Superchip) или Grace CPU и Hopper GPU (Grace Hopper Superchip) через интерфейс NVLink C2C. Данные считываются и записываются в память второго чипа с пропускной способностью 429 и 407 Гбайт/с, соответственно. Одновременное считывание и запись данных выполняются с пропускной способностью 506 Гбайт/с. Теоретически двунаправленная пропускная способность может достигать 900 Гбайт/с.

117 Мбайт кэша L3 и 68 линий PCIe 5.0

NVIDIA вместе с Grace CPU и соответствующей архитектурой представила Scalable Coherency Fabric (SCF). Mesh-интерконнект соединяет отдельные ядра, память, компоненты ввода/вывода и NVLink-C2C. SCF имеет двунаправленную пропускную способность 3.225,6 Гбайт/с.

Через SCF соединяются четыре узла коммутации кэша (cache switch nodes, CSN), блоки ядер и разделы кэша SCC. Также к SCF подключены контроллеры памяти LPDDR5X и NVLink C2C PHY.

Grace CPU оснащен 117 Мбайт кэша L3 в сумме, который доступен для всех 72 ядер. По всей mesh-сети распределены ядра CPU и разделы кэша SCC. Узлы CSN обеспечивают коммутацию данных по сети, они представляют собой интерфейсы между ядрами CPU, кэшем и остальной системой.

Grace CPU и соответствующие ускорители подключаются через NVLink, но чип также поддерживает линии PCI Express 5.0. Доступны 68 линий, из которых 56 относятся непосредственно к PCI Express 5.0. А 12 дополнительных линий могут использоваться как для NVLink, так и PCI Express.

Grace CPU Superchip и Grace Hopper Superchip будут доступны в первой половине 2023. Мы посмотрим презентацию NVIDIA на Hotchips 34 и добавим новую информацию, если она появится.

Первые тесты CPU

NVIDIA представила первые тесты процессора Grace, позволяющие оценить производительность ядер ARM. Использовался бенчмарк SPECrate2017_int_base, то есть измерялась целочисленная производительность без дополнительных оптимизаций.

Напомним, что результаты приведены для инженерного предварительного образца чипа. Один Grace CPU набрал 370 баллов, два Grace CPU показали идеальное масштабирование до 740 баллов.

Чип Alibaba Cloud Yitian 710 недавно привлек внимание очень высокими результатами SPECrate2017_int_base, которые превысили значения именитых производителей. С 510 баллами данный чип действительно один из самых быстрых на рынке, AMD Epyc 7773X тоже дает более высокую производительность по сравнению с Grace CPU. Однако чип NVIDIA все же быстрее Ampere Altra Q80-33 и Xeon Platinum 8351N.

Ниже мы привели подробности микроархитектуры и числа ядер для более удобного сравнения.

Сравнение процессоров

SPECrate2017
int_base
Микроархитектура Ядра
1x Grace CPU 370 ARMv9 72
2x Grace CPU 740 ARMv9 144
1x Alibaba Cloud Yitian 710 510 ARMv9 128
1x AMD Epyc 7773X 440 x86 64
1x Ampere Altra Q80-33 300 ARMv8 80
1x Xeon Platinum 8351N 265 x86 36

Впрочем, ситуация для NVIDIA не такая радужная. Процессоры Grace выйдут в первой половине 2023, а к этому времени AMD, Intel и, вероятно, Ampere уже представят новые поколения. Поэтому NVIDIA придется конкурировать уже с ними.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).