> > > > NVIDIA опубликовала обзор характеристик Tesla V100 и архитектуры Volta

NVIDIA опубликовала обзор характеристик Tesla V100 и архитектуры Volta

Опубликовано:

nvidia-tesla-p100

На GPU Technology Conference компания NVIDIA представила новую архитектуру Volta, а также три первые видеокарты Tesla, построенные на базе чипа GV100. Мы уже описывали новую архитектуру в отдельной статье, а теперь сама NVIDIA опубликовала технический обзор новой архитектуры и ускорителей Tesla V100, в котором открываются ранее неизвестные подробности.

Как и Pascal, архитектура Volta состоит из множества различных компонентов. GV100 GPU располагает следующими кластерами: Graphics Processing Clusters (GPC), Texture Processing Clusters (TPC), Streaming Multiprocessors (SM) и контроллеры памяти. GV100 состоит из шести GPC, 84 SM, 42 TPC и восьми 512-битных контроллеров памяти (всего 4.096 бит). Каждый SM содержит 64 ядра FP32, 64 ядра INT32, 32 ядра FP64 и восемь новых ядер Tensor. Кроме этого, на каждый SM имеется по четыре текстурных блока.

Имея 84 SM, GV100 располагает в общей сложности 5.376 ядрами FP32, 5.376 ядрами INT32, 2.688 ядрами FP64, 672 ядрами Tensor и 336 текстурными блоками. К каждому контроллеру памяти подключен кэш L2 ёмкостью 768 кбайт, а каждый стек HBM2 управляется двумя контроллерами. Таким образом, GV100 оснащен в общей сложности 6.144 кбайт кэша L2.

Maximum Performance Mode и Maximum Efficiency Mode

NVIDIA предлагает три варианта Tesla V100, которые отличаются, в основном, способом подключения и теплопакетом. NVIDIA говорит о двух режимах работы: Maximum Performance Mode (максимальная производительноть) и Maximum Efficiency Mode (максимальная эффективность).

В первом режиме Tesla V100 потребляет все доступные 300 Вт в формате SMX2 и 250 Вт в формате карты PCI Express. Maximum Efficiency Mode позволяет добиваться оптимальной производительности на ватт, и это значение можно изменять в зависимости от поставленной задачи. В среднем теплопакет должен составлять 50 - 60% от максимума, но сам GPU может при этом обеспечивать до 75 - 85% от максимальной производительности.

NVLink 2.0 становится более гибким

Скоростной интерконнект является важной частью любой платформы HPC. Все основные производители пытаются соединять чипы как можно более скоростными магистралями, то же самое касается соединения с внешними компонентами. Технологию интерконнекта NVLink NVIDIA представила еще на GPU Technology Conference в 2014 году. NVLink опирается на технологию High-Speed Signaling Interconnect (NVHS), разработанную NVIDIA.

С новыми GPU GV100 NVIDIA оптимизировала NVLink двумя путями. С одной стороны, увеличилась скорость каждого соединения. Также увеличилось и число каналов NVLink на GPU GV100. Максимальная пропускная способность канала NVLink до сих пор составляла до 40 Гбайт/с на канал для приема и передачи, в случае NVLink 2.0 мы получаем уже 50 Гбайт/с. Поскольку число каналов NVLink было увеличено с четырех до шести, для GPU GV100 мы получаем пропускную способность до 300 Гбайт/с.

Два дополнительных канала NVLink могут использоваться для построения новой инфраструктуры. До сих пор каналы NVLink позволяли соединять до восьми Tesla P100, а с процессором связь обеспечивалась через коммутатор PCI Express. В случае NVLink 2.0 появляются два дополнительных канала, их можно использовать, например, для связи с двумя CPU. Кроме того, в случае GPU Tesla V100 можно объединять до 64 GPU в одну систему. В целом, NVLink стал более быстрым и более гибким, что наверняка понравится разработчикам серверных решений.

NVIDIA начнет отгружать первые карты Tesla V100 во второй половине 2017 года. Причем это относится не только к отдельным картам, но и к готовым серверам, например, DGX-1, DGX Station и HGX-1. Сами ускорители, а особенно версии с интерфейсом PCI Express, будут доступны только ближе к концу года. В первую очередь NVIDIA начнет поставки производителям серверов.