Top500: Азия значительно увеличивает свои вычислительные мощности

Опубликовано:

top100Начало конференции Supercomputing 2017 (SC17) в Денвере, также совпадает с релизом последней версии рейтингом суперкомпьютеров Top500. Азия создает огромные вычислительные мощности и продолжает возглавлять список Top-5 суперкомпьютеров тремя самыми мощными системами.

Самым быстрым компьютером по-прежнему называется Sunway TaihuLight, имеющий вычислительную мощность 93 PFLOPS (Rmax). Второе место занимает Tianhe-2 (MilkyWay-2) с 33,8 PFLOPS, использующий ускорители Intel Xeon E5-2692v2 и Intel Xeon Phi 31S1P. Европейский Piz Daint, который находится в Швейцарии, переместился на третье место с вычислительной мощностью 19,6 PFLOPS. Увеличение вычислительной мощности достигается за счёт использования ускорителей Tesla P100.

Первым настоящим новичком является суперкомпьютер из Японии, окрещенный Gyoukou. Он использует Xeon D-1571 с 16 ядрами и дополнительные ускорители, которые называются PEZY CS2, которые ещё не были ранее на таких высоких позициях в рейтинге. С производительностью 19,1 PFLOPS Gyoukou наступает на пятки Piz Daint. Первый суперкомпьютер из США находится только на пятом месте. Однако в следующем году США хотят завершить два новых суперкомпьютера, которые также должны войти в пятёрку лучших.

Ускорители Pezy CS2 работают на жидкостном охлаждении

Особенностью нового номера четыре в списке суперкомпьютеров явлются специальные ускорители Pezy CS2. Каждый из них имеет 2048 MIMD-блоков (Multiple Instruction Multiple Data), которые могут работать на частоте 1000 МГц. Для большей эффективности они работают на частоте 700 МГц. При полном цикле они достигают производительности 4,1 TFLOPS для вычислений с двойной точностью, 8,2 TFLOPS с одинарной точностью и 16,4 TFLOPS для INT8 или вычислений с половинной точностью. Для этой цели у процессора есть 64 Кбайт кэша команд L1 и 64 Кбайт кэша данных L1 на ядро. Кроме того, есть 2 МБ кэша L2 на ядро. Также на каждой плате ускорителя доступно четыре слота DIMM для оперативной памяти DDR4 с пропускной способностью 100 Гбайт/с. Потребляемая мощность одного ускорителя составляет 130 Ватт. 

ZettaScaler 2.0 - целая система, которая включает в себя несколько десятков таких плат ускорителей. Они утоплены в специальных корпусах, содержащих хладагент. Это не только гарантирует, что используемое оборудование хорошо охлаждается, но и может использоваться как целая система (включая охлаждение) особенно эффективно.

 В следующем году запланировано множество новых проектов и многочисленных обновлений в области суперкомпьютеров. Это значит, что в следующем году Intel и NVIDIA смогут поставлять большее количество своих высокопроизводительных ускорителей.