> > > > Архитектура Cluster Booster: суперкомпьютеры с турбонаддувом

Архитектура Cluster Booster: суперкомпьютеры с турбонаддувом

Опубликовано:

juelichВ рамках исследовательского проекта DEEP (Dynamical Exascale Entry Platform), финансируемого Евросоюзом, была представлена новая вычислительная архитектура, в которой особое внимание уделено проблеме распределения данных в современных суперкомпьютерах. Система DEEP опирается на так называемую концепцию Cluster Booster. «Бустеры» из многоядерных процессоров с высокой степенью параллельной обработки являются своего рода аналогом турбонаддува для двигателей внутреннего сгорания. Прототип такой системы будет работать в ближайшие несколько лет в Юлихском центре суперкомпьютеров (JSC).

Производители суперкомпьютеров сегодня представляют все более мощные системы, но в ближайшие годы им предстоит преодолеть ряд проблем. Отдельные компоненты достигают все более высокой производительности, но инфраструктура за ними часто не поспевает. Именно по этой причине NVIDIA решила разрабатывать свою систему межсоединений NVLink, а новые вычислительные ускорители Intel Xeon Phi будут поддерживать фирменную технологию Intel Omni-Path Interconnect. Критично не только взаимодействие между кластерами, но и подготовительная работа для эффективной нагрузки вычислительных ускорителей. По этой причине самые быстрые суперкомпьютеры состоят из серверных процессоров и специальных ускорителей. В качестве примера можно привести Tianhe-2 с процессорами Intel Xeon E5-2696 и ускорителями Intel Xeon Phi 31S1P, а также Titan с процессорами AMD Opteron 6274 и ускорителями NVIDIA Tesla K20x – как раз два первых места в рейтинге Top100.

Прототип DEEP в Юлихском центре суперкомпьютеров
Прототип DEEP в Юлихском центре суперкомпьютеров

Архитектура Cluster Booster была специально разработана для грядущих суперкомпьютеров класса exascale, которые будут в сто или даже тысячу раз быстрее современных решений. Уже сегодня суперкомпьютеры используют сотни тысяч или даже миллионы вычислительных ядер – и в будущем количество будет только увеличиваться. Архитектура Cluster Booster позволяет выполнять сложные части программы с малой масштабируемостью на обычных кластерах, а простые части кода с высоким уровнем масштабируемости будут просчитываться на эффективных и мощных «бустерах».

Прототип суперкомпьютера в JSC опирается на многоядерные процессоры Intel, вычислительная производительность составляет 500 TFLOPS. Для сравнения, приведенные выше два первых места в списке Top100 дают производительность 54 902 и 27 112 TFLOPS. DEEP Booster подключен через высокоскоростную сеть к вычислительному кластеру, он состоит из 384 вычислительных узлов с процессорами Intel Xeon Phi, специально предназначенными для выполнения задач с высокой степенью параллелизации. Процессоры, содержащие более 60 ядер каждый, связываются друг с другом через высокоскоростную сеть EXTOLL HPC с топологией 3D-тора, разработанную Гейдельбергским университетом. Все компоненты плотно упакованы в двух серверных стойках, за отведение тепла отвечает система водяного охлаждения. Состояние компьютера отслеживается с помощью нового программного обеспечения, разработанного Центром суперкомпьютеров Лейбница специально для DEEP.

Конечно, аппаратное обеспечение – это одна сторона, но не следует забывать и о подходящей программной начинке, которая позволила бы эффективно использовать аппаратную часть. Команда DEEP полностью разработала программный стек, облегчающий программирование задач. Разработчики приложений получает знакомое окружение программирования, программное обеспечение поможет оптимизировать приложения под эффективное выполнение вычислений. Обе части, кластеры и «бустеры», поддерживают глобальный интерфейс программирования ParTec Systemsoftware ParaStation MPI. Также модель OmpSs, разработанная Barcelona Supercomputing Center, теперь поддерживает выделение параллельных задач на «бустеры» DEEP.

Прототип DEEP в Юлихском центре суперкомпьютеров
Прототип DEEP в Юлихском центре суперкомпьютеров

«Изначально DEEP был просто идеей. Его реализация стала плодом усилий квалифицированных ученых и инженеров в Европе благодаря поддержке Еврокомиссии. Все участвующие в проекте компании, исследовательские институты и университеты могут гордиться уникальной системой, которая отличается высокой универсальностью и великолепной масштабируемостью. Концепция Cluster Booster DEEP серьезно повлияет на развитие будущих суперкомпьютеров», сказал координатор проекта, профессор Томас Липперт (Thomas Lippert), директор Юлихского центра суперкомпьютеров.

Прототип DEEP будет использоваться не только для проектирования грядущих суперкомпьютеров, но и для решения задач науки и промышленности. Финансирование Евросоюза завершено, но сервер в Юлихе продолжит работать. Система будет доступна ближайшие несколько лет в JSC и для сторонних разработчиков, которые смогут оптимизировать свои приложения на прототипе для будущих суперкомпьютеров. Кроме того, JSC планирует докупать еще один «бустер», который сможет ускорить недавно установленный суперкомпьютер JURECA в ближайшие год-два до производительности 10 PFLOPS. JURECA опирается на 1.872 узла, каждый с двумя Intel Xeon E5-2680 и NVIDIA Tesla K80.