> > > > NVIDIA HGX-2 предложит 2 PFLOPS вычислительной производительности

NVIDIA HGX-2 предложит 2 PFLOPS вычислительной производительности

Опубликовано:

nvidiaНа прошлогодней GPU Technologies Conference NVIDIA представила серверную систему HGX-1, своего рода версию DGX-1 с водяным охлаждением, ориентированную на облачные решения HPC. В этом году NVIDIA представила Tesla V100 с удвоенным объемом памяти HBM2 32 Гбайт. Quadro V100 тоже доступна в данной версии с весны.

Сегодня NVIDIA анонсировала HGX-2. Опять же используются Tesla V100, но NVIDIA удвоила число ускорителей на GPU с 8 до 16. Также используются новые коммутаторы NVSwitch, позволяющие подключать до 16 компонентов на полной скорости через NVLink. Как и предшествующая версия, сервер состоит, как минимум, из двух процессоров, но NVIDIA их не раскрывает. Скорее всего, на рынок выйдут три варианта HGX-2, которые будут предлагать разные функции, в зависимости от сферы применения. Для тренировки сетей глубокого обучения NVIDIA предложит HGX-T2, вариант HGX-I2 будет оптимизирован под обработку запросов в сеть (inferencing), а для суперкомпьютеров предлагается SCX.

В сервере работают 81.920 потоковых процессоров и 10.240 тензорных ядер. NVIDIA указывает производительность 2 PFLOPS со смешанной точностью. Прочем, если взять за основу 16 ускорителей Tesla V100, мы получим вычислительную производительность 124,8 TFLOPS с двойной точностью (FP64), 249,6 TFLOPS с одинарной точностью (FP32), 499,2 TFLOPS с половинной точностью (FP16) и 2 POPS для вычислений INT8. У 16 видеокарт суммарный объем HBM2 составит 512 Гбайт.

Пока не совсем понятно, как будут выглядеть остальные компоненты HGX-2. NVIDIA наверняка поделится подробностями на своей пресс-конференции на Computex 2017. Она пройдет 4 июня в понедельник.

"The world of computing has changed," сказал Дженсен Хуанг, CEO NVIDIA. "CPU scaling has slowed at a time when computing demand is skyrocketing. NVIDIA’s HGX-2 with Tensor Core GPUs gives the industry a powerful, versatile computing platform that fuses HPC and AI to solve the world’s grand challenges."

Lenovo, QCT, Supermicro и Wiwynn представят серверы HGX-2. ODM, подобные Foxconn, Inventec, Quanta и Wistron, разработают собственные серверы на основе HGX-2 дял крупных дата-центров.