> > > > Австралийский суперкомпьютер подтверждает Instinct MI200 GPU со 128 Гбайт памяти

Австралийский суперкомпьютер подтверждает Instinct MI200 GPU со 128 Гбайт памяти

Опубликовано:

amd-instinct-mi100В ноябре прошлого года AMD представила первые GPU на архитектуре CDNA. А именно Radeon Instinct MI10, которые в некоторых сценариях вполне достойно показывают себя по сравнению с NVIDIA A100, но все же уступают моделям NVIDIA с 80 Гбайт памяти, поскольку оснащены всего 32 Гбайт HBM. Первое поколение архитектуры CDNA является производной от GCN, но в случае CDNA 2 AMD изначально разработала микроархитектуру для вычислений. Официально новая архитектура будет представлена позднее в этом году.

На конференции ISC-HPC, Уго Варето (Ugo Varetto), CTO Pawsey Supercomputing Centre в Перте (Австралия) презентовал систему для обработки данных крупнейшего в мире радиоинтерферометра Square Kilometre Array (SKA). Антенны радиотелескопа расположены в Австралии и Южной Африке.

Суперкомпьютер под названием Setonix обеспечит вычислительную производительность 50 PFLOPS. Уже известно, что он будет использовать процессоры EPYC, но конкретные модели неизвестны. Кроме того, будут использоваться 750+ GPU, но тоже без подробностей. Конечно, суперкомпьютер будет опираться на мощную подсистему хранения, а именно кластер HPE Lustre емкостью 15 Пбайт. Он будет состоять из NVMe SSD с быстрым подключением (near-node). Для обычного хранения данных предусмотрен массив на 90 Пбайт. Для обеспечения сохранности данных используется стирающий код 8+3, то есть к восьми частям данных добавляются три части кода для восстановления, которые затем распределяются по 11 (8+3) дискам.

На презентации Варето указал 200.000 ядер Milan CPU, что соответствует 3.125 64-ядерным процессорам EPYC. Кроме того, в состав суперкомпьютера входят 750+ GPU с названием MI Next. Здесь речь явно идет о Radeon Instinct MI200. Причем каждый GPU будет оснащаться 128 Гбайт памяти. Поскольку будут использоваться чипы HBM2E с 1.024-битным интерфейсом, 128 Гбайт будут наполняться восемью чипами с интерфейсом 8.192 бит. В результате пропускная способностью восьми чипов HBM2E составит 3,28 Тбайт/с. Для сравнения: у Radeon Instinct MI100 она составляет 1,23 Тбайт/с, а у самого быстрого варианта NVIDIA A100 - 2 Тбайт/с.

GPU с кодовым названием Aldebaran базируются на архитектуре CDNA-2 и дизайне MCM на основе двух чиплетов. Два чиплета подключаются интерконнектом друг к другу и 4x 1.024-битным интерфейсом к памяти HBM2E каждый, но дополнительной информации пока нет. Скорее всего можно ожидать 2x 128 Compute Units и 16.384 потоковых процессоров, которые предназначены для расчетов FP64, но они поддерживают и меньшие уровни точности. Для GeForce and Radeon GPU важны также FP32, INT32 и FP16.

AMD представит ускорители Radeon Instinct MI200 на архитектуре CDNA-2 до конца года. Интересно, сможет ли AMD сделать существенный прорыв с GPU-ускорителями. В списке суперкомпьютеров Top500 действительно появляется больше новых систем с процессорами EPYC вместо Xeon, но на рынке GPU-ускорителей доминирует NVIDIA. Если быть более точным, новые системы появляются исключительно с ускорителями A100. Другие производители существенной роли не играют. Поэтому систем на ускорителях Radeon Instinct MI100 очень мало, и на рынке они отсутствуют. Вероятно, AMD так и не смогла продать крупные партии ускорителей первого поколения CDNA.

Однако все же был анонсирован суперкомпьютер Frontier, который будет опираться на процессоры EPYC (Custom Milan) и ускорители Radeon Instinct. Система обеспечит производительность 1,5 EFLOPS, каждый узел будет содержать один процессор EPYC и четыре ускорителя Radeon Instinct. Судя по всему, мы получим первый суперкомпьютер в списке лидеров с подобными компонентами. Сборка изначально планировалась на 2021 год.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).