> > > > NVIDIA Tesla V100S - скоростная память HBM2 и более высокая частота при прежнем TDP

NVIDIA Tesla V100S - скоростная память HBM2 и более высокая частота при прежнем TDP

Опубликовано:

nvidia-tesla-p100Нынешним флагманом NVIDIA для дата-центров является Tesla V100, который доступен в двух вариантах - модуль SXM2 и карта расширения PCI Express. NVIDIA уже увеличила тепловой пакет версии SXM2 с 300 Вт до 450 Вт. Такие ускорители используются в некоторых системах DGX, но NVIDIA не дает информации о вычислительной производительности, поэтому сложно судить, имеем ли мы дело с простым подъемом тактовых частот.

На конференции Supercomputing 2019 были замечены ускорители Tesla V100S, хотя сама NVIDIA ни словом о них не обмолвилась. Информация поступила от наших коллег Anandtech и STH. Между тем стали известны отличия от обычной версии. NVIDIA модернизировала версию PCI Express, теперь ускоритель работает даже быстрее ускоренных вариантов SMX2. Используется GPU GV100 с 5.120 потоковыми процессорами и 640 ядрами Tensor. Ядра RT архитектуры Turing в чипах Volta пока не используются. В целом, GPU GV100 в виде ускорителей Tesla V100 остается главной "рабочей лошадкой" NVIDIA в сегменте дата-центров.

В случае Tesla V100S вычислительная производительность была увеличена с 7 до 8,2 TFLOPS с двойной точностью (FP64). Что касается одинарной точности (FP32), мы получили прирост с 14 до 16,4 TFLOPS. Производительность ядер Tensor (INT8) получила сравнимое повышение со 112 до 130 TOPS. NVIDIA представила GPU GV100 в 2017 году, с тех пор чип производится на заводах TSMC по 12-нм техпроцессу. Новые версии GPU работают на более высоких тактовых частотах, что и обусловило прирост производительности.

Еще одна причина увеличения производительности кроется в более скоростной подсистеме памяти. 32 Гбайт HBM2 работали в случае Tesla V100 с пропускной способностью 900 Гбайт/с, у Tesla V100S мы получили уже 1.134 Гбайт/с. Скорее всего, NVIDIA увеличила тактовую частоту памяти до 1.134 МГц, то есть речь идет о более быстрых чипах памяти HBM2. Но пока не совсем понятно, какие именно чипы HBM2 использует NVIDIA. Samsung уже представила скоростные варианты HBM2 с кодовым названием Aquabolt, да и SK Hynix работает над так называемыми чипами HBM2e.

Tesla V100S предлагает на 15% больше вычислительной производительности по сравнению с предыдущим вариантом PCI Express и на 25% большую пропускную способность памяти. Если сравнивать со скоростной версией SXM2, мы получаем прирост производительности 5%, но пропускная способность памяти тоже на 25% больше.

Тепловой пакет новых ускорителей по-прежнему составляет 250 Вт, что существенно увеличивает эффективность работы карты. NVIDIA продолжает использовать стандарт PCI Express 3.0, что вряд ли изменится до следующего поколения.

Как мы отметили выше, ускорители Tesla V100 были представлены весной 2017, и через три года в 2020 году можно ожидать преемника. NVIDIA пока лидирует по GP GPU для дата-центров, но и Intel не следует недооценивать с грядущими "Ponte Vecchio" Xe GPU.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).