> > > > До 75% быстрее: планируются суперкомпьютеры на новых NVIDIA GPU

До 75% быстрее: планируются суперкомпьютеры на новых NVIDIA GPU

Опубликовано:

nvidia-tu116В этом году возможен выход двух новых архитектур GPU. NVIDIA должна объявить новую архитектуру HPC, известную как Ampere, скорее всего, на конференции GPU Technology Conference в Сан-Хосе, которая пройдет 23-26 марта. Предшественница Volta была представлена в марте 2017, так что время для нового поколения как раз подходящее. Также вполне вероятны новости и по поводу нового поколения видеокарт GeForce в этом году, хотя каких-либо подробностей нет.

Но перейдем к вычислительным ускорителям Tesla нового поколения. Индианский университет недавно объявил о строительстве суперкомпьютера Big Red 200. Он должен обеспечивать производительность 6 PFLOPS, в результате мы получим один из самых быстрых суперкомпьютеров в сфере образования. Big Red 200 собирается Cray на основе стоек Shasta, которые содержат современные процессоры AMD EPYC с кодовым названием Rome (1.344 EPYC 7742 с 64 ядрами каждый).

Упомянутая вычислительная производительность 6 PFLOPS достигается одними только процессорами. Университет сообщил изданию The Next Platform, что изначально планировались ускорители Tesla V100. Но позднее было решено перейти на "next-generation NVIDIA Tensor Core GPUs". Один или больше GPU-ускорителей на узел увеличат вычислительную производительность системы до 8 PFLOPS, то есть 2 PFLOPS будут достигнуты через GPU-ускорители. Поскольку новые NVIDIA HPC GPU обеспечивают на 70-75% больше производительности по сравнению с предшественниками, можно будет обойтись меньшим числом GPU, чем планировалось изначально.

Прирост производительности на 70-75% на каждый GPU-ускоритель можно назвать весьма приличным. Но пока не совсем понятно, какая именно здесь подразумевается производительность. GPGPU может выполнять вычисления с двойной точностью (FP64), одинарной точностью (FP32) и половинной точностью (FP16). Ядра Tensor, которые впервые стали использоваться в архитектуре Volta, но также присутствуют и в архитектуре Turing, могут выполнять вычисления FP16, но также целочисленные матричные операции INT8, INT4 и теоретически INT2. Поскольку вычисления с низкой точностью играют важную роль в сфере ИИ, которая сегодня продолжает бурно расти, можно предположить, что NVIDIA продолжит наращивать число ядер Tensor, а также расширять их функционал.

GPU-ускорители планируется установить в суперкомпьютер в конце лета или осенью. Что дает примерное представление о планах NVIDIA насчет новых Tesla GPU. Как мы отметили выше, NVIDIA планирует представить новую архитектуру Ampere в марте. И Big Red 200 должен стать одним из первых суперкомпьютеров на новых GPU. Будут ли после архитектуры Ampere представлены производные на ее основе в виде игровых моделей GeForce - сказать сложно. Та же архитектура Volta нашла применение на настольных ПК только в виде Titan V. А для видеокарт GeForce летом 2018 была представлена архитектура Turing. GPU Turing используются и в ускорителях инференcа Tesla. Именно по этой причине NVIDIA в данном контексте говорит о "Tensor Core GPUs", что можно трактовать довольно широко.

В любом случае, в марте нас ждут новые интересные новости насчет GPU NVIDIA.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).