Больше 145 тысяч ядер: HPE Astra становится самым крупным суперкомпьютером ARM
Суперкомпьютер Astra был построен Сандийскими национальными лабораториями совместно с Министерством энергетики США для Администрации по национальной ядерной безопасности США (NNSA). Сандийские национальные лаборатории занимаются разработкой, созданием и испытанием неядерных компонентов ядерного оружия. NNSA обеспечивает наблюдение за ядерным арсеналом США. В данной сфере требуются мощные суперкомпьютеры, чтобы вычислять эффективность ядерных зарядов без проведения испытаний.
Если верить HPE, Astra был выбран из-за особенностей платформы ARM. Если суперкомпьютеры обычно фокусируются на чистой производительности CPU, которая у лидера Summit достигла 200 PFLOPs, в случае ARM акцент смещается на производительность памяти. Процессоры ThunderX2 от Cavium работают с восемью каналами памяти, что является одной из причин прироста производительности памяти на 33% по сравнению с "традиционными" системами. Конечно, влияет и структура памяти. Память представляет собой единый массив, к которому может обращаться любой CPU, что позволяет избежать привычных "узких мест". Если верить HPE, перенос информации из памяти разных типов и уровней сегодня занимает порядка 90% вычислений компьютера. Для каждого шага вычислений данные проходят по четко заданному пути, что как раз не требуется в случае единого массива.
Впрочем, это и объясняет, почему Astra не занимает ведущих позиций в списке Top500 - он все же учитывает вычислительную производительность. Ее HPE указывает на уровне 2,3 PFLOPs, что дает примерно 60-е место. По 2.592 двухпроцессорным серверам распределены 145.152 вычислительных ядра. Для сравнения, у Summit используется 4.608 узла с двумя процессорами IBM Power 9, каждый оснащен 22 ядрами CPU, что дает 202.752 ядра в сумме. Как видим, ARM все еще не может конкурировать по производительности в расчете на ядро. По этой причине ARM акцентирует эффективность. HPE пояснила нашим коллегам Engadget, что энергия, которая уходит на перемещение данных в системе, на порядок больше, чем энергия, уходящая на вычисление этих данных. Поэтому переход на серверы ARM с единым массивом памяти позволяет снизить энергопотребление.
К сожалению, точных спецификаций системы не приводится, в том числе нет информации об объеме памяти и энергопотреблении.