> > > > Самый быстрый суперкомпьютер в мире теперь в Японии

Самый быстрый суперкомпьютер в мире теперь в Японии

Опубликовано:

rikenСегодня при обсуждении темы суперкомпьютеров в фокусе внимания оказывается системы уровня экзаскейла, которые обеспечивают вычислительную производительность более одного экзафлопа (EFLOPS, ExaFLOPS). Подобные системы будут вводиться в строй в 2021/2022 годах. Например, можно привести те же Aurora и El Capitan на аппаратных компонентах Intel и AMD. Теперь исследовательский институт RIKEN в Японии объявил спецификации суперкомпьютера Fugaku.

Он будет состоять из 158.976 процессоров A64FX, каждый с 48 ядрами. Данные CPU разрабатывались Fujitsu, они станут первыми процессорами на основе набора команд Armv8.2-A SVE. Процессоры будут работать с базовой частотой 2,0 ГГц, которая на непродолжительное время может увеличиваться до 2,2 ГГц. Вычислительная производительность будет составлять 3,3792 TFLOPS (FP64), 6,7584 TFLOPS (FP32) и 13,5168 TFLOPS (FP16).

Процессоры изготавливаются по 7-нм техпроцессу. 48 ядер работают с 32 Гбайт памяти HBM2, которая будет подключена с пропускной способностью 1 Тбайт/с. Кэш L2 составляет 8 Мбайт. Суперкомпьютер Fugaku опирается на собственный интерконнект TofuD с пропускной способностью 6,8 Гбайт/с на процессор.

Довольно сложно экстраполировать производительность 158.976 процессоров, поскольку она не будет масштабироваться 1:1. Сатоши Матсуока (Satoshi Matsuoka), директор RIKEN, привел в твитере финальную конфигурацию и спецификации вычислительной производительности.

Как видим, 158.976 процессоров A64FX обеспечат следующий уровень производительности:

  • FP64: 537 PFLOPS
  • FP32: 1,07 EFLOPS
  • FP16: 2,15 EFLOPS
  • INT8: 4,30 ETOPS

Если посмотреть в список Top500, то самый быстрый суперкомпьютер сегодня дает пиковую производительность 200,8 PFLOPS. Summit использует 9.216 процессоров IBM и 27.648 ускорителей Tesla V100 на архитектуре Volta. До вчерашнего дня она оставалась флагманом NVIDIA для HPC и ИИ. Вчера NVIDIA представила новые чипы GA100 или A100 Tensor Core GPU, которые обеспечивают уровень 9,7 TFLOPS на одном GPU. Вычислительная производительность INT8 составляет 1.248 TOPS.

Чтобы заменить процессоры суперкомпьютера Fugaku чипами NVIDIA A100, потребуется 55.360 GPU. Но для достижения такого же уровня производительности ИИ/INT8 потребуется всего 680 чипов A100. Конечно, суперкомпьютеру Fugaku предстоит пройти через многочисленные тесты в ближайшие недели и месяцы, прежде чем он будет запущен. Новый список суперкомпьютеров Top 500 будет опубликован в июне. Но чтобы в него попасть, системам необходимо пройти тест. И пока неизвестно, сможет ли Fugaku это выполнить.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).